<html>
<head>
<title>FineReader</title>
<meta name="GENERATOR" content="Microsoft FrontPage 4.0">
</head>
<body>
<div align="center">
<center>
<table border="0" width="700" cellpadding="0" cellspacing="0">
<tr>
<td>
<p>FineReader: An application to format text file, including convert HTML file
to text file, merge text files, paragraph and reparagragh,etc.</p>
<p>作者:马健<br>
邮箱:<a href="mailto:[email protected]">[email protected]<br>
</a>主页:<a href="http://stronghorse.yeah.net">http://stronghorse.yeah.net</a></p>
<p><a href="#FAQ">FAQ<br>
</a><a href="#使用说明">使用说明<br>
</a> <a href="#软件安装/删除">一、软件安装/删除<br>
</a> <a href="#软件使用">二、软件使用<br>
</a><a href="#鸣谢">附录A 鸣谢<br>
</a><a href="#版本更新记录">附录B 版本更新记录</a></p>
<h1><a name="FAQ"><font color="#FF0000">FAQ</font></a></h1>
<p>Q:FineReader是什么?<br>
A:这是一个专为整理电子版小说而开发的工具,包括HTML到文本文件的转换、文件合并、段落合并、段落切分、文本替换、内码转换(只能在Win
2k/XP下用)、文件切分、tcr文件压缩/解压等功能。</p>
<p>Q:文件转换、文件合并功能好理解,段落合并、段落切分是干什么的?<br>
A:段落合并其实就是某些软件所吹嘘的“自动分段”功能:在转换、识别出来的文本文件中,往往在一个自然段中间加入了若干回车/换行符,成了一行一行的了,因此需要将这些多余的回车/换行符去掉,只在自然段结尾才出现回车/换行符。有人喜欢把这个功能称为“自动分段”,我更喜欢称为“段落合并”。<br>
段落切分是段落合并的逆过程。段落合并完成以后,在某些软件下阅读时,可能因为行太长,给阅读带来不便,因此需要按照指定的行长,对段落进行切分,切成一个一个短行。</p>
<p>Q:tcr功能是干什么用的?<br>
A:tcr的全称是Text Compression for Reader,这是给制作在手机和PDA上看的电子书用的,如果您只打算在PC上看书,相信您不会用到这个功能。tcr是一种文本压缩格式,专门针对手机和PDA这种存储空间和处理能力都很有限的环境,压缩能力和zip、rar当然不能比,但总比没有压缩强。所以在手持设备能够处理象zip和rar这样复杂的文件之前,我相信都会保持其流行趋势。</p>
<p>Q:为什么要开发FineReader?<br>
A:我曾经极度热衷于在PC上看小说,但是从网上下载的网页多半不适合直接离线浏览,需要进行转换、整理等,然后才能符合我的收藏标准。现成的HTML到TXT的转换工具有不少,但是集转换、合并、分段、替换等功能于一体的好像还没有,尤其是分段工具,多半分完段后都会有哭笑不得的感觉,所以我才自己开发了这个工具。后来我又开始在手机上看小说,所以又加了tcr压缩/解压、文件切分、jar书等功能。</p>
<h2><a name="使用说明"><font color="#FF0000">使用说明</font></a></h2>
<p><a name="软件安装/删除"><font color="#FF0000">一、软件安装/删除</font></a></p>
<p>本软件为纯正的绿色软件,不需要安装,下载ZIP包后直接展开、运行即可。删除时删除可执行文件和帮助文件即可。</p>
<p>软件包中仅包含下列两个文件,如果有其它的,保证不是我加的,请不要犹豫,立刻删除:</p>
<ol>
<li>FineReader.exe。可执行文件。</li>
<li>FineReader.htm。本帮助文件。</li>
</ol>
<p>另外如果在运行过程中改变了参数值,会自动生成FineReader.ini文件。删除时可以一起删除。</p>
<p><a name="软件使用"><font color="#FF0000">二、软件使用</font></a></p>
<p>注意:FineReader会自动记忆您所设置的参数值(记录在FineReader.ini文件中),点击“恢复”按钮可以将所有参数恢复到缺省值。</p>
<p><font color="#FF0000">1、HTML文件到文本文件的转换(HTML->Text)</font></p>
<p>根据需要设置选项(也可以什么不选,直接使用预设值),点击“开始转换”按钮,在弹出的对话框中选择需要转换的文件(按住Ctrl键或Shift键点击文件,即可选多个),然后点“打开”或“Open”按钮即可。</p>
<p>如果转换出来的内容不对,可能是因为真正的内容是用JavaScript动态生成的,可以选择“使用IE内核”,然后再点“开始转换”,重新试一遍。这个选项相当于IE的“另存为文本文件”功能,用缺省选项搞不定的网页,都可以用这个选项试试看。与在IE中打开网页不同的是,如果网页中有错,这里不会弹出错误对话框要求调试网页,而是直接跳过,反正错误对获取文本没有多大影响。</p>
<p>另外如果使用IE内核,而网页又是utf-8编码,则可以选择将结果转换成Unicode或ANSI,ANSI使用的是系统缺省字符集(简体中文Windows的缺省字符集为GB2312)。</p>
<p><font color="#FF0000">2、文件合并(Merge Files)</font></p>
<p>一般网站刊登电子版小说时,都是一章一个文件,因此在将HTML文件转换成TXT文件后,一般还需要按照章节顺序将转换出来的诸多TXT文件合并成一个文件。</p>
<p>使用方法:点击“选择”按钮,在弹出的对话框中输入合并后的文件名,然后点“开始”按钮,在弹出的对话框中选择需要合并的文件即可。</p>
<p>注意:文件的合并顺序,等同于在点“开始”按钮后,弹出的对话框中“文件名”(File
Name)项中的显示顺序。通常最先选择的文件将排在末尾,而最后选择的文件将排在开头。最简单的选择方法:先选择最后一个文件,然后按住Shift健,选择第一个文件;或者先选择最后一个文件,然后按住Ctrl健,倒序选择其余文件。</p>
<p><font color="#FF0000">3、段落合并(Paragraph)</font></p>
<p>在把HTML转换成TXT文件后,由于去掉了HTML中的段落控制,转出来的文件看起来可能会参差不齐,需要重新合并、分段。</p>
<p>使用方法:按照界面上标示出来的1、2、3顺序,先设置“源文件段落开始标志”选项,再设置“输出文件段落控制”选项,最后选择源文件。如果是对单个文件进行处理,则在“选择源文件”框中,先点“选择...”按钮选择源文件(如果前面做过文件合并,这里会自动填入合并后的文件名,则不再需要选择),再点“开始合并”按钮开始合并;如果是对多个文件进行操作,直接点“对多个文件中的段落进行合并...”按钮,然后在弹出的对话框中选择需要操作的所有文件(按住Ctrl键或Shift键点击文件,即可选多个)。</p>
<p>选项说明:</p>
<p>“源文件段落开始标志”框指定分段条件,即在输入文件中,满足什么样的条件算一个段落。这样的条件可以有4个:</p>
<ol>
<li>以2个或指定个数的中文空格开头。</li>
<li>以4个或指定个数的英文空格开头。</li>
<li>某一行的长度小于平均行长的1/20(可设置)。一般这个条件用于OCR出来、没有整理过的文件。如下面这段文字:<br>
<br>
<i>他很专注的检阅着自己刚获得的新领土。 <br>
虽然自己对空气中的这股刺鼻甜味并不是很喜欢,但只要习惯之后也就没什么。 <br>
他在这块领地上绕了整整一圈。看来这里似乎没有任何敌人的样子。 <br>
他抬起头来望着一道闸门,刚才自己就是从这里出发的。虽然他看不懂门上那块 <br>
牌子的文字,不过那里确实是写着'海德伯爵城馆:帝国中最小不隆咚的贵族城 <br>
馆。' <br>
他端正的坐在门前,并盼望那扇门能够马上开启。因为自己一路睡到刚刚才醒的 <br>
关系,被关在门外也是不得已的。 <br>
然而,那扇门却没有任何开启的迹象。</i> <br>
<br>
很显然,每一段的最后一行都要比其它行短。</li>
<li>后面跟一个空行。</li>
</ol>
<p>“输出文件段落控制”框指定输出格式,可以指定的内容包括:</p>
<ol>
<li>段落的引导字符:可以是2个中文空格、4个英文空格或者什么也没有。</li>
<li>在段落后面加一个空行。</li>
<li>删除原文文本行的引导空格。</li>
<li>删除原文文本行的末尾空格。</li>
</ol>
<p><font color="#FF0000">4、段落切分(Reparagraph)</font></p>
<p>有时候在用段落合并功能对原文中的段落进行合并、整理后,还需要按照指定的行宽,对段落进行分行,避免在没有自动环绕功能的浏览器上出现横向滚动条。</p>
<p>段落合并功能和段落切分功能互为逆过程,如果对切分结果不满意,可以合并后重新切分。</p>
<p>使用方法:按照界面上标示出来的1、2、3顺序,先设置“输出段落”选项,再设置源文件是否保留备份,最后选择源文件。如果是对单个文件进行处理,则在“选择源文件”框中,先点“选择...”按钮选择源文件(如果前面做过文件合并,这里会自动填入合并后的文件名,则不再需要选择),再点“开始切分”按钮开始切分;如果是对多个文件进行操作,直接点“对多个文件中的段落进行切分...”按钮,然后在弹出的对话框中选择需要操作的所有文件(按住Ctrl键或Shift键点击文件,即可选多个)。</p>
<p>使用方法:点“选择”按钮选择需要分行的文件(如果前面做过文件�
软件工具包
需积分: 6 105 浏览量
2008-06-25
11:24:19
上传
评论
收藏 1.7MB RAR 举报
shuben2000
- 粉丝: 6
- 资源: 52
最新资源
- 微信小程序 - 同乐居商城:购物车合算源码
- 1、根据输入的三条边值判断能组成何种三角形,并设计测试数据进行判定覆盖测试 三条边为变量a、b、c,范围为1≤边值≤10,不在范
- SQL server 练习题目8道(小白教学).zip
- Python 手写实现 iD3 决策树算法-根据信息增益公式.zip
- 411675952289057车联助手-小窗版(三星)3.5.1.apk
- 三种快速排序方法合并在一个文件中以便直接运行的Python代码示例
- 937712277954201实习5.word
- 2程序语言基础知识pdf1_1716337722703.jpeg
- 简单的Python示例,演示了如何使用TCP/IP协议进行基本的客户端和服务器通信
- 考试.sql
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈