欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科普文章

pdf

科普小知识2022-12-23 22:13:42
...

pdf(PortableDocumentFormat的简称,意为“便携式文档格式”),是由AdobeSystems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式。PDF文件以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符、颜色以及图象。可移植文档格式是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的MacOS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件在开始使用PDF格式文件。Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。为了达到此目的,PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以逼真地展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。

中文名:便携式文档格式

外文名:PortableDocumentFormat

缩写:便携式档

外语缩写:PDF(也用作文件扩展名)

1、技术要点

PDF主要由三项技术组成:

·衍生自PostScript,用以生成和输出图形;

·字型嵌入系统,可使字型随文件一起传输;

·结构化的存储系统,用以绑定这些元素和任何相关内容到单个文件,带有适当的数据压缩系统。

PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文件中一些重要结构的定位信息。正是由于PDF文件的种种优点,它逐渐成为出版业中的新宠。

2、格式研究

PDF文件结构主要可以分为四个部分:

首部

用文本编辑器打开的时候就可以看到:%PDF-1.4这样的字眼,其中最后一位就是PDF文件格式版本号,软件的版本号总要比文件格式的版本号高1,比如说Read5能打开的内容就是4。

文件体

里面由若干个的obj对象来组成,类似这种形式:

30obj

/Type/Pages

/Count1

/Kids

>>

endobj

第一个数字称为对象号,来唯一标识一个对象的,第二个是产生号,是用来表明它在被创建后的第几次修改,所有新创建的PDF文件的产生号应该都是0,即第一次被创建以后没有被修改过。上面的例子就说明该对象的对象号是3,而且创建后没有被修改过。

对象的内容应该是包含在>之间的,最后以关键字endobj结束。

交叉引用表

用来索引各个obj对象在文档中的位置,以实现随机访问,它的形式是:

xref

08

000000000065535f

000000000900000n

000000007400000n

000000012000000n

000000017900000n

000000032200000n

000000041500000n

000000044500000n

xref说明一个交叉引用表的开始,交叉引用表的第一行08说明下面各行所描述的对象号是从0开始,并且有8个对象。

000000000065535f,一般每个PDF文件都是以这一行开始交叉应用表的,说明对象0的起始地址为0000000000,产生号(generationnumber)为65535,也是最大产生号,不可以再进行更改,而且最后对象的表示是f,表明该对象为free,这里,大家可以看到,其实这个对象可以看作是文件头。

000000000900000n就是表示对象1,0000000009是其偏移地址,00000为5位产生号(最大为65535),0表明该对象未被修改过,n表示该对象在使用,区别与*对象(f),可以更改。

尾部

Trailer

/Size8

/Root10R

>>

startxref

553

%%EOF

trailer说明文件尾trailer对象的开始。

/Size8说明该PDF文件的对象数目。

/Root10R说明根对象的对象号为1。

Startxref

553说明交叉引用表的偏移地址,从而可以找到PDF文档中所有的对象的相对地址,进而访问对象。

%%EOF为文件结束标志。

3、发展趋势

历史

PDF文件格式在1990年代早期开发,以作为能够包括文件的格式、内置图像的分享方法,而且能够跨平台操作,即使完全不同的电脑平台之上收件者未必有相关或合用的应用软件接口可使用。当时与PDF一起竞逐跨平台文件格式的,还包括DjVu(仍在开发中)、Envoy、CommonGroundDigitalPaper、FarallonReplica及Adobe自己本身的PostScript(.ps)格式。在当时万维网及HTML文本尚未兴起之时的最初几年中,PDF在桌面出版工作流技术当中很受欢迎。

PDF在早期文件格式分享历史的接受程度颇晚。可以阅读及产生PDF格式的程序AdobeAcrobat并非免费产品;早期版本的PDF也不支持外部链接,使之在互联网上的可用性减低;相较于全文本的格式显得很巨大的PDF文件,在当时仍然要利用modem来连接的年代需要更长的下载时间,再者以当年性能低的电脑要渲染PDF文件的过程也超慢。

从2.0版开始,Adobe开始免费分发PDF的阅读软件AcrobatReader(现时改称AdobeReader,创建软件依然称为AdobeAcrobat),而旧的格式依旧支持,使PDF后来成为固定格式文本业界的非正式标准。

及至2008年,AdobeSystems的PDF参考1.7版成为了ISO32000:1:2008,从此PDF就成为了正式的国际标准。亦因为这个缘故,现时PDF的更新版本开发(包括未来的PDF2.0版本的开发)变成由ISO的TC171SC2WG8主导,但Adobe及其他相关项目的专家依然有参与其中。

趋势

最初PDF只被看作是一种页面预览格式,而不是生产格式。然而市场的感觉并非如此,市场期望转化了这种格式的焦点,从而也改变了该产品。各种各样的电子书阅读器充斥着国内外市场,已经在很多领域取代纸质媒体。纸质媒体阅读率的下降很大程度上是因为广大读者将注意力从纸质媒体转向了电子类读物。虽然电子图书市场销售额远远不能同传统图书市场相比,但发展势头强劲。大多数电子阅读器厂商都开始全部或部分支持PDF格式。市面上使用较多的PDF电子阅读器有当当网手机阅读器,掌门科技的百阅,九月网的九月读书,以及开发出来的安卓手机专用阅读器。

Adobe公司于2009年7月13日宣布,作为电子文档长期保存格式的PDF/Archive(PDF/A)经中国国家标准化管理委员会批准已成为正式的中国国家标准,并已于2009年9月1日起正式实施。PDF格式文件已成为数字化信息事实上的一个工业标准。

ISO标准化

自1995起,Adobe参与了一些由ISO创建出版技术规范及在用于特定行业及用途的PDF标准专业子集(如PDF/X或PDF/A)进程中与ISO协作的工作组。制定完整PDF规格的子集的目的是移除那些不需要或会对特定用途造成问题以及一些要求的功能的使用在完整PDF规格中仅仅是可选的(不是强制性的)功能。

2007年1月29日,Adobe宣布将发布完整的PDF1.7规格给美国国家标准协会(ANSI)及企业内容管理协会(AIIM),为了由国际标准化组织(ISO)发布。ISO将制定PDF规格是未来版本,而且Adobe仅仅是ISO技术委员会的一员。

ISO“全功能PDF”的标准在正式编号ISO32000之下发布。全功能PDF规格意味着不仅仅是AdobePDF规格的子集;就ISO32000-1而言全功能PDF包含了Adobe的PDF1.7规格定义的每一条。然而,Adobe后来发布了不是ISO标准的一部分的扩展。那些也是PDF规格中的专有功能,只能作为额外的规格参考。

上一篇:梁小熊

下一篇:包子