get_word_from_webpage.rar_delphi网页_单词资源-CSDN文库

共42个文件

pas：7个

dcu：6个

ico：4个

版权申诉

52 浏览量 2022-09-24 01:56:05 上传评论收藏 697KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

get_word_from_webpage.rar （42个子文件）

folder

ParserEn.Sources

New001.html 23KB

folder

Common

uParserTypeThread.pas 10KB

uDownListThread.pas 7KB

uPublic.pas 22KB

uDownFileThread.pas 4KB

uPaserWordThread.pas 13KB

uConst.pas 3KB

uPublic.~pas 22KB

Readme.txt 1KB

folder

Dcu

uParserEn.dcu 25KB

uConst.dcu 2KB

uPublic.dcu 14KB

uParserTypeThread.dcu 9KB

uPaserWordThread.dcu 8KB

uDownFileThread.dcu 4KB

folder

Six

MyRes.RES 5KB

ParserEn.cfg 458B

ParserEn.dsk 5KB

uParserEn.pas 22KB

uParserEn.~ddp 51B

ParserEn.dpr 860B

ParserEn.res 3KB

uParserEn.dfm 8KB

uParserEn.ddp 51B

uParserEn.~pas 22KB

uParserEn.~dfm 8KB

ParserEn.dof 4KB

ParserEn.~dpr 862B

ParserEn.~dsk 5KB

常用正则表达式.txt 1KB

TPerlRegEx.rar 184KB

folder

Bin

ParserEn.exe 1012KB

folder

Data

access2k001.er1 37KB

EnWordData.mdb 208KB

folder

ICO

03.ico 2KB

gogo.bat 37B

05.ico 2KB

MyRes.rc 44B

02.ico 326B

06.ico 2KB

New002.html 20KB

okok.htm 44KB

ParserEn说明这是一个从指定网页格式分离单词的小程序，自动从http://www.fane.cn/article_list.asp?c_id=1&s_id=1 链接抓取分析其它可用链接，然后对所有链接进行分析找到可用页面然后分离中英文单词，并进行分类。使用了多线程处理，遇到了很有趣的多个不同功能的许多线程相互协调工作的问题，由于采用主线程进行消息处理安排线和工作流程所以会产生主程序窗口被堵死情况，特别是在开的线程很多的时候。优化方案： 1.应再写个控制线程，让一个单独的线程去管理其它工作线程协调问题，防止主程无响应，主程通过定时刷新共享区数据获取运行状况。 2.多线程情况下效率问题没有做过多考虑，特别是ADO产生多线程锁冲突时使程序效率更低下，应考虑先将抓取的数据先放到缓冲区中，开适当的线程数来将数据插入数据库中。 3.没有测试其它正则表达式控件的效率问题（对正则表达式的算法没有做过仔细研究）使用TPerlRegEx正则表达式控件分离.htm中所需要数据该程序没有经过严格测试难免有很多bug，主要精力用于提高抓取速度、精度和解决主程无响应问题上，希望这些简陋的代码能给正在学习使用多线程的朋友们一定的参考。 Piao40993470 2005-05-3

内容反馈

版权申诉

四散

粉丝: 51
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip