什么是线性化PDF?

线性化PDF是一种特殊的PDF文件组织方式。

总体而言,PDF是一种极为优雅且设计精良的格式。PDF由大量PDF对象构成,这些对象用于创建页面。相关信息存储在一棵二叉树中,该二叉树同时记录文件中每个对象的位置。因此,打开文件时只需加载这棵树,随后便可借助它加载显示页面所需的对象。无需读取整个文件,仅读取这棵树即可。树的位置始终存储在文件末尾,所以很容易找到,而且只需追加新信息和一棵新树,就能轻松修改文件。

然而,如果通过网络读取文件,它是以字节流的形式被访问的。这意味着,必须在整个PDF文件传输完毕后,才能读取位于文件末尾的引用。对于大文件而言,这可能需要一些时间。

 

如何创建线性化PDF

于是,Adobe创建了一种新的PDF布局方式,即线性化PDF。其文件格式依然不变,但在文件开头有一个特殊标记,创建第一页所需的所有对象(以及描述这些对象的一个小型二叉树)都存储在文件开头。一旦读取了这些数据,即可显示第一页,同时文件的其余部分继续下载。这使得整个过程看起来快得多,即便对于超大文件,用户也几乎能立刻看到一些内容。

 

线性化PDF与非线性化PDF有何区别

线性化PDF用于按页面顺序有序地组织内部组件,这有助于提升网页浏览体验,使用户能够尽快查看最想看的页面。而非线性化PDF的对象分散在整个文件中,必须完全下载后才能查看。

 

如何检查PDF是否为线性化的?

在Adobe Acrobat和Adobe Reader中,查看PDF是否为线性化的最佳方法是查看文档属性。如果文件是线性化PDF,“快速网络视图”这一项将显示“是”。


 

在JPedal PDF阅读器中,我们也添加了类似功能,可在文档属性中显示文件是否为线性化PDF。如果是线性化PDF,“linearized(线性化)”一词会出现在常规信息部分中PDF版本之后。

 

用于查看PDF文件是否为线性化的Java代码

在JPedal中,你也可以通过编程方式检查文件是否为线性化的,方法是查看Linearized对象是否存在——如果存在,那它就是一个线性化的PDF。

final PdfUtilities extract = new PdfUtilities(filename);

if (extract.openPDFFile()) {

final boolean isLinearized = extract.isPDFLinearized();

}

extract.closePDFfile();

 

为什么线性化PDF很重要?

简而言之,线性化PDF是一种组织PDF文件的方式,这样如果要通过互联网访问该文件,它的加载速度会显得快很多。而且它确实能很好地做到这一点!

 

我们的主页:PDF 转 HTML5、Java 图像库、Java PDF SDK - IDRsolutions

关注我们🛰️:IDRSolutions

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/894164.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java基础知识总结(三十二)--API--- java.lang.Runtime

类中没有构造方法,不能创建对象。 但是有非静态方法。说明该类中应该定义好了对象,并可以通过一个static方法获取这个对象。用这个对象来调用非静态方法。这个方法就是 static Runtime getRuntime(); 这个Runtime其实使用单例设计模式进行设计。 class …

向量和矩阵算法笔记

向量和矩阵算法笔记 Ps:因为本人实力有限,有一部分可能不太详细,若有补充评论区回复,QWQ 向量 向量的定义 首先,因为我刚刚学到高中的向量,对向量的看法呢就是一条有长度和方向的线,不过这在数学上的定义其实是不对,甚至跟我看的差别其实有点大,真正的定义就是数域…

你的连接不是专用连接

当你打开网站看到如下提示,说明SSL证书到期了。 攻击者可能试图www窃取你的信息(例如、密码、消息或信用卡)。详细了解此警告 NET::ERR_CERT_DATE_INVALID 此服务器无法证明它是WWW ;它的安全证书已于2天前到期。这可能是错误配置或攻击者…

deb安装失败后,无法再安装别的包的解决方案

把package_name换成出安装问题的包 移除该包的安装标记 sudo dpkg --remove --force-remove-reinstreq package_name清理残留文件和配置 sudo apt-get purge package_name

51单片机开发:定时器中断

目标:利用定时器中断,每隔1s开启/熄灭LED1灯。 外部中断结构图如下图所示,要使用定时器中断T0,须开启TE0、ET0。: 系统中断号如下图所示:定时器0的中断号为1。 定时器0的工作方式1原理图如下图所示&#x…

变量声明是否可以放在语句之后?变量声明?声明变量一定需要指定类型吗?函数范围快捷使用临时变量?

变量声明是否可以放在语句之后? 除了C89必须将变量声明放在语句之前,其他主流编程语言基本都支持变量声明和语句混合使用。Fortran/C89/Pascal 只能将变量声明放在语句之前。 准确的说,Pascal的变量声明必须放在程序的说明定义部分,即程序首…

【电工基础】1.电能来源,触电伤害,触电预防,触电急救

一。电能来源 1.电能来源 发电-》输电-》变电-》配电 2.分配电 一类负荷 如果供电中断会造成生命危险,造成国民经济的重大损失,损坏生产的重要设备以致使生产长期不能恢复或产生大量废品,破坏复杂的工艺过程,以及破坏大…

简易计算器(c++ 实现)

前言 本文将用 c 实现一个终端计算器: 能进行加减乘除、取余乘方运算读取命令行输入,输出计算结果当输入表达式存在语法错误时,报告错误,但程序应能继续运行当输出 ‘q’ 时,退出计算器 【简单演示】 【源码位置】…

python-leetcode-从前序与中序遍历序列构造二叉树

105. 从前序与中序遍历序列构造二叉树 - 力扣(LeetCode) # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # self.left left # self.right r…

YOLOv11-ultralytics-8.3.67部分代码阅读笔记-head.py

head.py ultralytics\nn\modules\head.py 目录 head.py 1.所需的库和模块 2.class Detect(nn.Module): 3.class Segment(Detect): 4.class OBB(Detect): 5.class Pose(Detect): 6.class Classify(nn.Module): 7.class WorldDetect(Detect): 8.class RTDETRDec…

知识推理简要介绍

知识推理(Knowledge Reasoning)是人工智能(AI)、认知科学和逻辑学的核心领域,其本质是通过对已有知识的逻辑化处理与规则化推导,生成新的知识或结论。它不仅是机器智能的基石,也是人类认知能力的核心体现。 一、知识推理的定义与本质 定义 知识推理是通过形式化逻辑规则…

NLP深度学习 DAY4:Word2Vec详解:两种模式(CBOW与Skip-gram)

用稀疏向量表示文本,即所谓的词袋模型在 NLP 有着悠久的历史。正如上文中介绍的,早在 2001年就开始使用密集向量表示词或词嵌入。Mikolov等人在2013年提出的创新技术是通过去除隐藏层,逼近目标,进而使这些单词嵌入的训练更加高效。…

vscode+WSL2(ubuntu22.04)+pytorch+conda+cuda+cudnn安装系列

最近在家过年闲的没事,于是研究起深度学习开发工具链的配置和安装,之前欲与天公试比高,尝试在win上用vscodecuda11.6vs2019的cl编译器搭建cuda c编程环境,最后惨败,沦为笑柄,痛定思痛,这次直接和…

深入了解 npm 和 pnpm:前端包管理工具的选择与比较

在现代前端开发中,包管理工具已经成为了必不可少的组成部分。它们帮助我们管理项目的依赖、自动化任务、以及在团队协作时确保一致的开发环境。最常见的前端包管理工具有 npm 和 pnpm,它们各自具有独特的特点和优势。今天,我们就来一起深入了…

剑指 Offer II 011. 0 和 1 个数相同的子数组

comments: true edit_url: https://github.com/doocs/leetcode/edit/main/lcof2/%E5%89%91%E6%8C%87%20Offer%20II%20011.%200%20%E5%92%8C%201%20%E4%B8%AA%E6%95%B0%E7%9B%B8%E5%90%8C%E7%9A%84%E5%AD%90%E6%95%B0%E7%BB%84/README.md 剑指 Offer II 011. 0 和 1 个数相同的子…

【MQ】RabbitMq的可靠性保证

消息队列中的可靠性主要是分为三部分: 消息不丢失:确保消息从生产者发送到消费者消息不丢失消息不重复:确保消息不被重复消费消息顺序性:确保消费的顺序性 解决方案主要有以下几部分: 消息不丢失 生产者确认机制持久…

Jason配置环境变量

jason官网 https://jason-lang.github.io/ https://github.com/jason-lang/jason/releases 步骤 安装 Java 21 或更高版本 安装 Visual Studio Code 根据操作系统,请按照以下具体步骤操作 视窗 下载 Jason 的最新版本,选择“jason-bin-3.3.0.zip”…

SpringBoot 日志与配置文件

SpringBoot 配置文件格式 Properties 格式 Component ConfigurationProperties(prefix "person") //和配置文件person前缀的所有配置进行绑定 Data public class Person {private String name;private Integer age;private Date birthDay;private Boolean like;pr…

【Elasticsearch】 Intervals Query

Elasticsearch Intervals Query 返回基于匹配术语的顺序和接近度的文档。 intervals 查询使用 匹配规则,这些规则由一小组定义构建而成。这些规则然后应用于指定 field 中的术语。 这些定义生成覆盖文本中术语的最小间隔序列。这些间隔可以进一步由父源组合和过滤…

HarmonyOS DevEco Studio模拟器点击运行没有反应的解决方法

HarmonyOS DevEco Studio模拟器点击运行没有反应的解决方法 翻遍了CSDN,试了所有办法都没办法,最后偶然间竟然解决了 解决方法其实很简单:本地模拟器下载路径下面不能有中文。。。。。 切换正确路径以后,成功运行,哦…