随笔 - 30  文章 - 1  评论 - 190 
  置顶随笔

PDF补丁丁是一个用于修改PDF文件信息的工具。它具有以下功能:

  • 修改PDF信息:修改文档属性、页码编号、页面链接、页面尺寸;删除自动打开网页等动作,去除复制及打印限制;设置阅读器初始模式。
  • 贴心PDF书签编辑器:可批量修改PDF书签属性(颜色、样式、目标页码、缩放比例等),在书签中执行查找替换(支持正则表达式及XPath匹配)。
  • 生成PDF书签:无需手工输入,自动识别正文标题或目录,为PDF文件生成书签。
  • 制作PDF文件:合并已有PDF文件或图片,生成新的PDF文件(可挂上书签)。
  • 拆分或合并PDF文件,并保留原文件的书签或挂上新的书签。
  • 高速无损导出PDF文件的图片。
  • 提取或删除PDF文件中指定的页面。
  • 根据PDF文档元数据重命名PDF文件名。
  • 调用微软 Office 的图像识别引擎分析PDF文档图片中的文字;将图片PDF的目录页转换为PDF书签。识别结果可写入PDF文件。
  • 分析文档结构:以树视图显示PDF文档结构,可编辑修改PDF文档节点,或将PDF文档导出成XML文件,供PDF爱好者分析、调试之用。
  • 永久免费,绝不过期,无广告,无弹出废话对话框。

运行环境

下载链接及说明文档

  1. 下载 PDF补丁丁 稳定版(0.3.3.100)最新公开测试版(暂无测试版可供下载)
  2. 下载 PDF补丁丁 使用手册(0.3.3.100)测试版使用手册
  3. 软件功能简介及界面截图网页
  4. 开发计划及已知问题
posted @ 2011-02-25 15:03 PDF补丁丁 阅读(4220) 评论(82) 编辑
  2012年3月27日

偶尔想起曾经让自己折腾很长时间的事情:

为了让公司的程序“看起来”“可能”会运行得“快一点点”,看起来好用一点点,花了不知道多少个日夜加班重构代码……

为了美化一个二百多块钱的手机的界面去搜索一大批软件……

为了让几本电子书看起来轻松一点,花好多时间编写复杂的程序……

为了使用最新版的软件,经常留意其网站的更新情况……

为了不花钱玩个小游戏或用个软件,弄了好多时间去找破解……

为了在淘宝上买东西省几块钱,翻了更多的页面并对比更多的产品……

为了一部高清烂片,花了近一个小时的时间去下载,然后花了近两个小时的时间观看……

为了莫名奇妙的原因,在论坛、博客或微博上,与素不相识的甲乙丙丁打笔仗,最后谁也说服不了谁……

 

折腾,也许是一种强迫症,让我们在上面这些无关紧要的事情上,不知不觉地耗费了自己最宝贵的东西——青春。

如果不折腾,省下来的时间,本来可以让我们去开创更崇高的事业,去更甜蜜地感受和爱人交往的生活,去寻找更多能够帮助自己的人,去更紧密地拥抱自然,拥有更健康的身体,让人生过得更加多元化。各位,你折腾了么?

posted @ 2012-03-27 10:01 PDF补丁丁 阅读(132) 评论(2) 编辑
  2012年3月23日

新版的 Firefox 11 在内存管理上做得不错,启动速度比前面的版本有可观的提升,浏览速度也很快,并且支持最新的 HTML 标准,配合 GDI++,网页渲染效果颇佳。

使用了一个早上,装了大量插件和浏览了平常访问的网站后,我观察了 Firefox 的内存占用量。发现其虚拟内存占用量还不超过 200M(一般稳定在160M左右),比起疯狂吃内存的 Chrome、Maxthon3、IE 等,优势非常明显,与 Opera 相比也更胜一筹。我已将其作为主力浏览器了。

目前安装的插件有:Adblock Lite、Custom Tab Width、Default Full Zoom Level、Firebug、FVD Speed Dial、Google Search Link Fix、IE Tab 和 Undo Closed Tabs Button。

posted @ 2012-03-23 11:17 PDF补丁丁 阅读(111) 评论(0)  编辑
  2012年3月16日

折腾Oracle时,出现了“ORA-27100: shared memory realm already exists”的问题。上网查问题根源,乃是32位机SGA及PGA不能大于1.7G之故。

SGA的设置在SPFILEORCL.ORA里面,但该文件是一个二进制文件,不好随便编辑。

网上给的解决办法是用一个“正常的”PFILE启动Oracle,然后重新生成SPFILE,操作颇繁琐。其实SGA过大的问题也不难解决,不必用“PFILE”那样曲折迂回的办法:用一个二进制编辑器打开SPFILEORCL.ORA文件,可以发现其配置信息中有部分是可读的文本,找到“sga_max_size=”,将其后的数值改小,保存文件,再重新启动Oracle即可。

posted @ 2012-03-16 16:38 PDF补丁丁 阅读(67) 评论(0) 编辑
  2012年3月13日

经过多个月的开发,PDF 补丁丁 0.3.3 正式版已经发布。新版本新增文档结构探查器、写入OCR结果、JBIG2优化压缩黑白图片等多项实用功能,并修复程序的多项错误。欢迎在首页置顶下载。

0.3.3.100 2012年3月13日
新增功能:
PDF 文件结构探查器。
将光学字符识别的结果写入 PDF 文档。
使用 JBIG2 压缩算法优化 PDF 黑白图片的压缩效果。
导出图片功能支持合并 JPEG 图片。
导出图片功能支持导出批注内的图片。
页码范围支持负数页码(从末尾起算的页码)。
导出、导入书签功能支持导出 Javascript 脚本。
支持写入及读取超过 2G 的 PDF 文件。
修改功能:
自动生成书签功能提取字体时忽略字体子集名称。
书签编辑器可以拖放文件打开 PDF 文档。
增强自动判断文本编码的兼容性。
导出图片时考虑图片位置,按照横排文本的阅读习惯,先导出上方的图片再导出下方的图片。
修复错误:
浮点数误差导致自动生成书签层次错误。
导出图片时遇到页面内嵌图像会出错。
导出图片时无法未能识别 LZWDecode 图片。
导出黑白图片时在某些场合下无法正确反转颜色。
书签编辑器在某些场合下无法更改页码。
书签编辑器在展开或收拢节点时会抖动。
强制转换页面连接为内部连接后目标页码少一页。
无法禁用压缩文档索引表。
进度条数值错误造成程序异常。
在书签存在错误时无法提取页面。
页面旋转角度不为 0 时,导入书签自动设置纵方向偏移不正确。
修改页面尺寸拉伸原始页面时无法按指定位置对齐页面边沿。
跳转目标为空时无法导出书签。
页面旋转角度不为 0 时,拉伸 PDF 页面方向不正确。
导出信息文件缺少缩放比例的问题。


由于近来事务繁杂,PDF补丁丁将暂停更新一段时间。请各位用户见谅。

posted @ 2012-03-13 09:05 PDF补丁丁 阅读(281) 评论(1) 编辑
  2012年2月13日

新版的PDF补丁丁修复了多处错误,增加写入OCR结果、JBIG2压缩、文档结构探查器、超大PDF文档支持等多项实用功能,欢迎下载使用。

  

新增功能:
	PDF 文件结构探查器。
	将光学字符识别的结果写入 PDF 文档。
	使用 JBIG2 压缩算法优化 PDF 黑白图片的压缩效果。
	导出图片功能支持合并 JPEG 图片。
	导出图片功能支持导出批注内的图片。
	页码范围支持负数页码(从末尾起算的页码)。
	导出、导入书签功能支持导出 Javascript 脚本。
	支持写入及读取超过 2G 的 PDF 文件。
修改功能:
	自动生成书签功能提取字体时忽略字体子集名称。
	书签编辑器可以拖放文件打开 PDF 文档。
	增强自动判断文本编码的兼容性。
修复错误:
	浮点数误差导致自动生成书签层次错误。
	导出图片时遇到页面内嵌图像会出错。
	导出图片时无法未能识别 LZWDecode 图片。
	导出黑白图片时在某些场合下无法正确反转颜色。
	书签编辑器在某些场合下无法更改页码。
	书签编辑器在展开或收拢节点时会抖动。
	强制转换页面连接为内部连接后目标页码少一页。
	无法禁用压缩文档索引表。
	进度条数值错误造成程序异常。
	在书签存在错误时无法提取页面。
	页面旋转角度不为 0 时,导入书签自动设置纵方向偏移不正确。
	修改页面尺寸拉伸原始页面时无法按指定位置对齐页面边沿。
	跳转目标为空时无法导出书签。

 

posted @ 2012-02-13 18:14 PDF补丁丁 阅读(170) 评论(6) 编辑
  2012年2月1日
摘要: 有网友希望提供 PDFPatcher 的 JBIG2 编码库,因发此博文。此处提供的编码库源自agl在Github的开源代码。该代码编译后输出 EXE 文件,编码现存位图文件或 StdIn 提供的数据,未提供被其它应用程序调用的 DLL 库。为了在 PDF 补丁丁中增加 JBIG2 编码功能,我修改了该代码,去除了其有损压缩功能及 Leptonica 图像库的依赖关系,减少了编码器的文件大小。导出函数DLL 库导出的函数有三个(除下列方法之外,还有原代码提供的jbig2_encode_generic方法,该方法的调用方式请参见原代码的说明):uint8_t *jbig2_encode (int阅读全文
posted @ 2012-02-01 11:29 PDF补丁丁 阅读(192) 评论(3) 编辑
  2012年1月4日
摘要: 由于手头有多个项目要开发,PDF 补丁丁的开发将要暂缓一段时间。感谢各位网友的关注。阅读全文
posted @ 2012-01-04 11:17 PDF补丁丁 阅读(93) 评论(0) 编辑
  2011年11月7日
摘要: 新的测试版修复了打开或输出超过 2GB 的超大型 PDF 文档问题。遇到此问题的网友请下载测试版测试。注意:程序可能存在问题,请不要覆盖原始文档!日前更新测试版0.3.3.68,修复打开、输出超过 2G 的大型 PDF 文件问题(0.3.3.58版的漏洞已被修复)。阅读全文
posted @ 2011-11-07 11:29 PDF补丁丁 阅读(342) 评论(3) 编辑
  2011年11月4日
摘要: PDF补丁丁新测试版增加了将字符识别(OCR)的结果写入PDF文件的功能。操作方法:选择“识别图像文本”功能。指定PDF文档和信息文件路径,选中“保存原始的识别结果”复选框,然后点击“识别图像文本”按钮。程序将识别文档,并将识别结果保存成一个XML文件。再指定输出PDF文件路径,点击“写入识别结果”按钮。程序将把识别结果XML文件的数据和原始PDF文档合并,写入到输出PDF文件。如果发现识别结果有错字或文字先后位置不正确的,可以修改XML文件,然后重复步骤4。 如果发现问题请在此留言。敬告:硬盘位贱,数据无价,请保留原始PDF文件的备份!阅读全文
posted @ 2011-11-04 11:10 PDF补丁丁 阅读(156) 评论(3) 编辑
  2011年11月3日
摘要: 今天做出了一个新功能,PDF补丁丁在导出识别结果为XML文件后(见附图一:识别结果XML),可以将其重新写入PDF文档,变成可以检索的文本PDF(输出效果见附图二、附图三,为检查输出字符位置是否正确,特意将文字显示出来,在正式发布时文字将是隐形字符)。 目前尚有少量问题需要修复,将不日内将提供测试版下载。附图一:识别结果XML附图二: 输出效果(黑白竖排文本)附图三:输出效果二(JPEG灰度图片、横排文本)阅读全文
posted @ 2011-11-03 16:47 PDF补丁丁 阅读(104) 评论(0) 编辑