ParserEn说明
这是一个从指定网页格式分离单词的小程序,自动从http://www.fane.cn/article_list.asp?c_id=1&s_id=1
链接抓取分析其它可用链接,然后对所有链接进行分析找到可用页面然后分离中英文单词,并进行分类。
使用了多线程处理,遇到了很有趣的多个不同功能的许多线程相互协调工作的问题,由于采用主线程进行消
息处理安排线和工作流程所以会产生主程序窗口被堵死情况,特别是在开的线程很多的时候。
优化方案:
1.应再写个控制线程,让一个单独的线程去管理其它工作线程协调问题,防止主程无响应,主程通过定时刷
新共享区数据获取运行状况。
2.多线程情况下效率问题没有做过多考虑,特别是ADO产生多线程锁冲突时使程序效率更低下,应考虑先将抓
取的数据先放到缓冲区中,开适当的线程数来将数据插入数据库中。
3.没有测试其它正则表达式控件的效率问题(对正则表达式的算法没有做过仔细研究)
使用TPerlRegEx正则表达式控件分离.htm中所需要数据
该程序没有经过严格测试难免有很多bug,主要精力用于提高抓取速度、精度和解决主程无响应问题上,希望
这些简陋的代码能给正在学习使用多线程的朋友们一定的参考。
Piao40993470 2005-05-3
没有合适的资源?快使用搜索试试~ 我知道了~
get_word_from_webpage.rar_delphi 网页_单词
共42个文件
pas:7个
dcu:6个
ico:4个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 52 浏览量
2022-09-24
01:56:05
上传
评论
收藏 697KB RAR 举报
温馨提示
从网页格式提取单词的小程序
资源推荐
资源详情
资源评论
收起资源包目录
get_word_from_webpage.rar (42个子文件)
ParserEn.Sources
New001.html 23KB
Common
uParserTypeThread.pas 10KB
uDownListThread.pas 7KB
uPublic.pas 22KB
uDownFileThread.pas 4KB
uPaserWordThread.pas 13KB
uConst.pas 3KB
uPublic.~pas 22KB
Readme.txt 1KB
Dcu
uParserEn.dcu 25KB
uConst.dcu 2KB
uPublic.dcu 14KB
uParserTypeThread.dcu 9KB
uPaserWordThread.dcu 8KB
uDownFileThread.dcu 4KB
Six
MyRes.RES 5KB
ParserEn.cfg 458B
ParserEn.dsk 5KB
uParserEn.pas 22KB
uParserEn.~ddp 51B
ParserEn.dpr 860B
ParserEn.res 3KB
uParserEn.dfm 8KB
uParserEn.ddp 51B
uParserEn.~pas 22KB
uParserEn.~dfm 8KB
ParserEn.dof 4KB
ParserEn.~dpr 862B
ParserEn.~dsk 5KB
常用正则表达式.txt 1KB
TPerlRegEx.rar 184KB
Bin
ParserEn.exe 1012KB
Data
access2k001.er1 37KB
EnWordData.mdb 208KB
ICO
03.ico 2KB
gogo.bat 37B
05.ico 2KB
MyRes.rc 44B
02.ico 326B
06.ico 2KB
New002.html 20KB
okok.htm 44KB
共 42 条
- 1
资源评论
四散
- 粉丝: 51
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功