没有合适的资源?快使用搜索试试~ 我知道了~
CreateHatenaBookmarkLogDB:对于Hatebu RSS文件,对每个网页进行文本提取和形态分析,并将文件注册...
共13个文件
py:5个
rb:2个
sh:1个
需积分: 5 0 下载量 141 浏览量
2021-06-29
09:07:31
上传
评论
收藏 46KB ZIP 举报
温馨提示
创建HatenaBookmarkLogDB 这是的脚本。对于哈特布 RSS 文件的每个网页,都会进行文本提取和形态分析。在 MySQL 数据库中注册结果。结果,创建了以下 DB (MySQL) 状态。 提前准备 假设MacOSX环境中预装了 、 、python、pip、ruby。 编译 C 代码 $ cd scripts $ gcc-4.8 ` mysql_config --include ` ` mecab-config --cflags ` parse_web_content_to_morpheme.cpp ` mysql_config --libs ` ` mecab-config --libs ` -fopenmp -o parse_web_content_to_morpheme.o 如果未安装 gcc-4.8,请安装它。 $ brew tap homebrew/vers
资源推荐
资源详情
资源评论
收起资源包目录
CreateHatenaBookmarkLogDB-master.zip (13个子文件)
CreateHatenaBookmarkLogDB-master
LICENSE 18KB
scripts
set_stoplist_to_db.py 2KB
hatena_bookmark_table_def_foreigenkey.sql 5KB
data
stoplist.dat 52KB
set_morpheme_to_db.py 5KB
set_rss_to_db.py 2KB
parse_web_content_to_morpheme.cpp 10KB
set_web_content_to_db.py 3KB
extractcontent.rb 8KB
scrape_webpage.rb 2KB
set_dat_to_db.py 1KB
main.sh 3KB
README.md 8KB
共 13 条
- 1
资源评论
刘怒威
- 粉丝: 26
- 资源: 4651
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功