没有合适的资源?快使用搜索试试~ 我知道了~
Arise:在搜索引擎中自动提取记录
共101个文件
h:42个
c:26个
cpp:8个
需积分: 9 0 下载量 94 浏览量
2021-05-18
16:16:45
上传
评论
收藏 1.02MB ZIP 举报
温馨提示
Arise: Automatically Extract Records In Search Engine Arise组件可以全自动抽取目前主流搜索引擎(百度、谷歌、Bing、Yahoo、Sogou、haosou、Sina、s.weibo、Youdao、Goso、盘古等)结果页面数据记录的三个元信息(标题、URL、摘要)。 Arise由C++编写,由Cmake构建工程,支持Linux和windows平台。 algorithm reference : build $ mkdir build $ cd build $ cmake .. $ make how to use 1. 可执行程序 使用 --help 打印用法 可执行程序包含四个参数: 第一个参数为运行程序exe 第二个参数为待抽取搜索结果页面文件存储路径 第三个参数为是否修补网页标签的bool值,0不修补,1修补,其他整数对应不修补
资源推荐
资源详情
资源评论
收起资源包目录
Arise:在搜索引擎中自动提取记录 (101个子文件)
libhtmltidy.a 463KB
libhtmlcxx.a 97KB
attrdict.c 192KB
parser.c 118KB
lexer.c 103KB
access.c 92KB
localize.c 81KB
charsets.c 78KB
pprint.c 66KB
clean.c 64KB
attrs.c 56KB
config.c 47KB
tags.c 45KB
tidylib.c 40KB
win32tc.c 35KB
streamio.c 35KB
utf8.c 15KB
entities.c 13KB
tagask.c 8KB
istack.c 6KB
attrget.c 6KB
tmbstr.c 5KB
attrask.c 5KB
buffio.c 4KB
iconvtc.c 3KB
fileio.c 2KB
alloc.c 2KB
cmp.c 753B
Uri.cc 15KB
utils.cc 11KB
ParserDom.cc 3KB
Node.cc 3KB
Extensions.cc 721B
ParserSax.cc 189B
ExtracBase.cpp 10KB
NodeBase.cpp 10KB
Pretreat.cpp 8KB
Demo.cpp 3KB
Interface.cpp 3KB
AttributeExtract.cpp 3KB
ExtractWithoutWrapper.cpp 3KB
FunTools.cpp 2KB
tree.h 62KB
tidy.h 36KB
tidyenum.h 23KB
attrs.h 19KB
lexer.h 17KB
platform.h 13KB
access.h 11KB
tags.h 9KB
message.h 7KB
config.h 6KB
attrdict.h 5KB
streamio.h 5KB
ExtractBase.h 4KB
NodeBase.h 4KB
tidy-int.h 4KB
Uri.h 4KB
tld.h 3KB
Interface.h 3KB
clean.h 3KB
buffio.h 3KB
Pretreat.h 3KB
pprint.h 2KB
tmbstr.h 2KB
Node.h 2KB
parser.h 2KB
ParserSax.h 1KB
utf8.h 1KB
ci_string.h 1KB
utils.h 1KB
debug.h 1KB
forward.h 1KB
AttributeExtract.h 947B
ExtractWithoutWrapper.h 884B
fileio.h 880B
ParserDom.h 767B
FunTools.h 747B
win32tc.h 592B
entities.h 568B
charsets.h 469B
Extensions.h 396B
wincstring.h 356B
iconvtc.h 341B
googlebeijingxiaochi.htm 100KB
baidubeijingxiaochi.htm 55KB
htmltidy.lib 1.04MB
htmlcxx.lib 888KB
README.md 1KB
googlebeijingxiaochi.out 5KB
baidubeijingxiaochi.out 4KB
googlebeijingxiaochi.ref 5KB
baidubeijingxiaochi.ref 4KB
googlebeijingxiaochi.refwin 5KB
baidubeijingxiaochi.refwin 4KB
ParserSax.tcc 8KB
baidunew.txt 4KB
CMakeLists.txt 2KB
CMakeLists.txt 1KB
CMakeLists.txt 885B
共 101 条
- 1
- 2
资源评论
行者无疆0622
- 粉丝: 19
- 资源: 4632
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- delphi实现DBGrid全选和反选功能
- 25C11F41-2B2A-4D1A-AAA8-7C654526B129.pdf
- Android Studio Jellyfish(android-studio-2023.3.1.18-cros.deb)
- MVC+EF框架+EasyUI实现权限管理源码程序
- python第66-75天,Day66-75.rar
- python后端服务project-of-tornado.rar
- python测验,hello-tornado.rar
- 基于SpringBoot+Vue3快速开发平台、自研工作流引擎源码设计.zip
- docker安装部署全流程
- 基于树莓派的人脸识别系统python源码+项目部署说明+超详细代码注释.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功