没有合适的资源?快使用搜索试试~ 我知道了~
open-semantic-etl:基于Python的开源ETL工具,用于文件爬网,文档处理(文本提取,OCR),内容分析(实体...
共162个文件
py:82个
yml:3个
tsv:3个
1 下载量 74 浏览量
2021-03-25
07:49:58
上传
评论
收藏 213KB ZIP 举报
温馨提示
open-semantic-etl:基于Python的开源ETL工具,用于文件爬网,文档处理(文本提取,OCR),内容分析(实体提取和命名实体识别)和数据充实(注释)管道以及Solr或Elastic搜索索引和链接数据图数据库的提取器
资源推荐
资源详情
资源评论
收起资源包目录
open-semantic-etl:基于Python的开源ETL工具,用于文件爬网,文档处理(文本提取,OCR),内容分析(实体提取和命名实体识别)和数据充实(注释)管道以及Solr或Elastic搜索索引和链接数据图数据库的提取器-python source file (162个子文件)
blacklist-contenttype 28B
blacklist-contenttype-prefix 834B
blacklist-contenttype-regex 75B
blacklist-contenttype-suffix 36B
blacklist-fieldname 3KB
blacklist-fieldname-prefix 176B
blacklist-fieldname-suffix 51B
blacklist-lawcode-if-no-clause 723B
blacklist-url 20B
blacklist-url-prefix 50B
blacklist-url-regex 67B
blacklist-url-suffix 60B
build-deb 1KB
conffiles 1KB
connector-files 2KB
connector-web 1KB
control 1020B
Dockerfile 2KB
enhancer-rdf 1KB
etl 8KB
etl-delete 13B
etl-enrich 13B
etl-file 11B
etl-filedirectory 20B
etl-filemonitoring 21B
etl-rss 10B
etl-sitemap 14B
etl-sparql 13B
etl-twitter-scraper 22B
etl-web 10B
etl-web-crawl 16B
etl_tasks 53B
facets 0B
files 0B
.gitignore 45B
.gitmodules 331B
Test_OCR_Image2.jpg 16KB
LICENSE 34KB
README.md 1KB
opensemanticsearch-delete 10B
opensemanticsearch-enrich 10B
opensemanticsearch-filemonitoring 21B
opensemanticsearch-index-dir 17B
opensemanticsearch-index-file 8B
opensemanticsearch-index-rss 7B
opensemanticsearch-index-sitemap 11B
opensemanticsearch-index-sparql 10B
opensemanticsearch-index-twitter-scraper 19B
opensemanticsearch-index-web 7B
opensemanticsearch-index-web-crawl 13B
test.pdf 45KB
Test_OCR_Image1.png 15KB
postinst 753B
prerm 182B
etl_enrich.py 14KB
etl.py 13KB
filter_file_not_modified.py 12KB
export_solr.py 11KB
enhance_rdf.py 11KB
enhance_extract_text_tika_server.py 10KB
enhance_csv.py 10KB
etl_file.py 10KB
enhance_entity_linking.py 9KB
etl_web.py 8KB
enhance_pdf_ocr.py 8KB
etl_hypothesis.py 7KB
move_indexed_file.py 7KB
etl_plugin_core.py 7KB
enhance_multilingual.py 6KB
etl_sitemap.py 5KB
tasks.py 5KB
enhance_rdf_annotations_by_http_request.py 5KB
etl_sparql.py 5KB
enhance_pdf_page.py 5KB
enhance_ner_stanford.py 5KB
etl_filemonitoring.py 5KB
enhance_ner_spacy.py 5KB
enhance_extract_law.py 5KB
test_enhance_extract_text_tika_server.py 4KB
enhance_xmp.py 4KB
enhance_pst.py 4KB
test_move_indexed_files.py 4KB
etl_rss.py 4KB
enhance_sentence_segmentation.py 4KB
enhance_zip.py 4KB
test_etl_file.py 4KB
enhance_warc.py 4KB
etl_web_crawl.py 4KB
filter_blacklist.py 4KB
export_neo4j.py 3KB
etl_delete.py 3KB
enhance_ocr_descew.py 3KB
etl_twitter_scraper.py 3KB
enhance_contenttype_group.py 3KB
enhance_regex.py 3KB
test_enhance_pdf_ocr.py 3KB
test_enhance_extract_law.py 2KB
enhance_xml.py 2KB
enhance_html.py 2KB
enhance_detect_language_tika_server.py 2KB
共 162 条
- 1
- 2
资源评论
机器好奇心
- 粉丝: 26
- 资源: 4598
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功