<html>
<head>
<title>DjVuToy</title>
<meta name="GENERATOR" content="Microsoft FrontPage 6.0">
</head>
<body>
<div align="center"><center>
<table border="0" width="700" cellpadding="0" cellspacing="0">
<tr>
<td>DjVuToy: A handy toolkit to merge, split and analyze DjVu files.<p>作者:马健<br>
邮箱:<a href="mailto:stronghorse@tom.com">stronghorse@tom.com<br>
</a>主页:<a target="_blank" href="http://www.comicer.com/stronghorse/">老马的原创空间</a></p>
<p><a href="#FAQ">FAQ<br>
</a><a href="#使用说明">使用说明<br>
</a> <a href="#软件安装/删除">一、软件安装/删除<br>
</a> <a href="#软件使用">二、软件使用</a><br>
<a href="#文件合并">文件合并</a><br>
<a href="#文件拆分">文件拆分</a><br>
<a href="#页面调整">页面调整</a><br>
<a href="#生成索引">生成索引</a><br>
<a href="#DjVu制作">DjVu制作</a><br>
<a href="#PDG压缩">PDG压缩</a><br>
<a href="#书签相关">书签相关</a><br>
<a href="#页面宽度">页面宽度</a><br>
<a href="#转为图像">转为图像</a><br>
<a href="#文本相关">文本相关</a><br>
<a href="#转PDF">转PDF</a><br>
<a href="#文件结构">文件结构</a><br>
<a href="#操作示范">三、操作示范</a><a href="#软件使用"><br>
</a><a href="#鸣谢">附录A 鸣谢<br>
</a><a href="#版本更新记录">附录B 版本更新记录</a></p>
<h1><a name="FAQ"><font color="#FF0000">FAQ</font></a></h1>
<p>Q:DjVuToy是什么?<br>
A:这是一个处理DjVu的工具集,具有下列功能:<ol>
<li>文件合并:将散页DjVu文件合并成一个多页DjVu。支持指向外部文件的共享数据段。</li>
<li>文件拆分:将多页DjVu拆分成每页一个文件,并可指定是否拆分共享数据段、是否生成索引。</li>
<li>页面调整:插入、删除、移动、旋转多页DjVu中的页面。</li>
<li>生成索引:为文件夹下的散页DjVu文件生成索引文件,打开索引文件即可浏览全部散页文件,就像将散页文件合并成了多页文件一样。但是与多页文件不同,索引文件不能挂书签。</li>
<li>DjVu制作:图像文件转DjVu,支持PDG、BMP、GIF、PNG、TIFF、JPEG、JPEG 2000。</li>
<li>PDG压缩:对清晰版进行无损压缩,或将清晰版压缩成快速版,或将黑白TIFF转换成PDG。</li>
<li>DjVu书签处理:包括导出书签、加挂书签(支持多级书签)、将中美百万的a.opf、catalog.xml转换成FreePic2Pdf接口文件。</li>
<li>DjVu页宽设置:将多页DjVu的页面宽度或DPI设置为一个统一值。</li>
<li>转为图像:将多页DjVu的每一页转换成一个图像。</li>
<li>DjVu文本处理:包括OCR(生成可检索的隐藏文本)、导出纯文本、导出XML文本、导入XML文本、删除文本。</li>
<li>DjVu转PDF:一次将整本DjVu转换成PDF,并可选择是否转换书签(目录)。</li>
<li>查看DjVu文件结构:如果打算对DjVu文件内部格式进行研究,这个功能那是相当地有用,不然还是点“显示设置”按钮,把它藏起来算了。</li>
</ol>
<p>Q:为什么要开发DjVuToy?<br>
A:现在网络上DjVu格式的电子书开始多起来,但是讨论DjVu的专业文章并不多。为了深入了解DjVu文件的各个方面,我就开发了这个软件。因为目的不是很严肃,所以软件的名字也不是很严肃,不过我终于还是很严肃地为它挑选、修改了个一看就是toy的图标。<p>Q:DjVuToy收费吗?<br>
A:DjVuToy是一个“友情软件”(Friendware),用户在承诺不用于商业目的,也不对文件及其附件进行任何更改的条件下,不需要为使用该软件付任何费用,最多是在BBS上看到我发帖子灌水时(我的ID一般是strnghrs),进去捧个人场,作为友情回报;或者在年节时<a
href="mailto:stronghorse@tom.com">发个email</a>问声好(所以叫“友情软件”)。我承诺绝不在程序中暗藏任何商业广告、木马,但不承诺为使用DjVuToy的后果承担任何责任。如果您需要将它用于商业目的,或加入您的网站,请<a
href="mailto:stronghorse@tom.com">与我联系</a>,否则保留追究一切责任的权利。</p>
<p>Q:DjVuToy在将DjVu文件合并、切分、删除、旋转页面,或改变页面顺序、改变页面宽度时,会造成图像质量下降吗?<br>
A:不会,图像数据流保持不变。</p>
<p>
Q:FreePic2Pdf接口文件有什么作用?<br>
A:接口文件是从Pdg2Pic和FreePic2Pdf借用过来的,对多级书签进行描述。接口文件的详细格式说明和示例见FreePic2Pdf使用说明。
对书签文件进行编辑推荐使用PdgCntEditor。<p>
Q:有些PDG文件转换不出来,怎么办?<br>
A:详见Pdg2Pic的使用说明。<p>
Q:为什么在合并文件时,如果选择了“合并过程中花时间检查坏页”,DjVu会报告某些文件损坏,但是单独用WinDjView看每页都能正常显示?<br>
A:这种情况通常是下载的时候,散页文件末尾被添加了垃圾数据。解决的办法:<ol>
<li>创建一个空文件夹,把问题散页复制进去,然后用“文件合并”功能合并这个文件夹,得到一页结果。</li>
<li>将此一页结果更名为问题散页的文件名,覆盖原问题散页,重新合并即可。</li>
</ol>
<p>
Q:为什么有些散页DjVu文件合并后,从某页开始就无法显示,但是单独用WinDjView看每页都能正常显示?<br>
A:这种情况通常是下载的时候,散页文件末尾被添加了垃圾数据,或文件数据不全。解决的办法:<ol>
<li>先定位有问题的散页。办法是把不能显示的页或其前、后页对应的散页删除,重新合并。如果某页删除后合并结果正常,则该页即为问题页。</li>
<li>用WinDjView打开问题页,如果能够打开,多半是文件末尾被添加了垃圾数据,参照前述方法解决;如果不能打开,说明数据不全,只能重新下载。</li>
</ol>
<p>Q:如何快速检查合并后的DjVu文件是否有问题?<br>
A:严格说来用WinDjView的缩略图看是最保险的,不过如果希望尽量快,也可以用DjVuToy的“文件结构”功能,导出文件结构为文本文件,如果此过程中没有报错,基本没有问题,否则可能有问题。</p>
<p>Q:OCR功能有什么用?在什么情况下可以使用?<br>
A:OCR功能在DjVu文件中生成隐藏文本,这些文本平时不可见,但可用WinDjVu的“Edit->Find”功能检索,也可以用“File->Export
Text”功能导出。隐藏文本不仅有文本信息,而且有位置信息,因此用鼠标按住左键在DjVu页面上拖动,可以选中隐藏文字,并复制到剪贴板。<br>
DjVuToy的OCR功能对DjVu中的原始图像不会造成任何影响,因此可以对其它软件生成的DjVu文件进行OCR,以实现强强联合:目前DjVu制作软件以国外的为佳,但是国外DjVu制作软件在OCR中文时总觉得不如本土软件。DjVuToy的OCR引擎是微软从清华购买的,中文OCR效果不错。<br>
当然再好的OCR软件都不可能完全准确,因此DjVuToy提供了独创性的“导出XML文本”、“导入XML文本”功能,可以将隐藏文本及其位置信息以XML格式导出,进行人工校对,然后再导入DjVu文件。
另外这两个功能也可以用于文本的繁简转换:将繁体导出,用TextForever或其它转码软件转成简体,然后再导入。<br>
当然如果您有更好的OCR引擎,也可以自己写一个软件,OCR后输出符合DjVuToy格式要求的XML文件,然后用DjVuToy导入。<br>
DjVuToy的OCR功能需要微软Office 2003以上版本的Microsoft Office Document
Imaging的支持,对于Office 2003、2007,这个功能可能缺省安装都没有装全(Office 2007的缺省安装干脆就没装),需要补充安装。<br>
在简体中文环境下进行配置,以OCR繁体中文、日文、韩文的方法,可以google我写的《在简体中文Office 2003下OCR繁体中文、日文、韩文》一文。</p>
<h2><a name="使用说明"><font color="#FF0000">使用说明</font></a></h2>
<p><a name="软件安装/删除"><font color="#FF0000">一、软件安装/删除</font></a></p>
<p>本软件安装非常简单:创建一个目录,用WinZip将下载下来的ZIP包解压缩到该目录即可。</p>
<p>本软件的删除也很简单:直接删除从ZIP包中解压缩出来的所有文件及运行过程中生成的文件即可。</p>
<p>ZIP包中包括下列文件:<ol>
<li>DjVuToy.exe。这是软件的主程序。</li>
<li>DjVuToy.dll。DjVu制作所需的文件,无此文件则不能使用该功能。</li>
<li>DjVuToy.htm。本帮助文件。</li>
</ol>
<p>如果您下载到的ZIP包中还包括其它文件,毫无疑问不是我放进去的,有广告或木马之嫌疑,请立即删除。</p>
<p>另外程序运行过程中还会生成以下文件:<ol>
<li>DjVuToy.ini。这个是参数保存文件,第一次更改参数后生成。退出DjVuToy,删除此文件,再重启DjVuToy,即可恢复缺省参数。</li>
<li>DjVuToy_log.txt。这个是错误记录文件,在转换过程中出现错误时自动生成,没有错误则自动删除以前的错误记录。</li>
<li>djvu_temp:如果运行了“DjVu制作”功能,就会生成此文件夹,用来存储中间文件。</li>
</o
- 1
- 2
前往页