没有合适的资源?快使用搜索试试~ 我知道了~
BeePasture:蜜蜂牧场是一个数据采集清洗工具,也是一个ETL工具,同时也是一套脚本语言
共207个文件
java:90个
yaml:67个
xml:19个
需积分: 13 0 下载量 187 浏览量
2021-05-09
09:47:48
上传
评论
收藏 3.33MB ZIP 举报
温馨提示
BeePasture (蜜蜂牧场) 蜜蜂牧场是一个数据采集清洗工具,也是一个ETL工具,同时也是一套脚本语言。最初只是完成网页数据采集清洗入库的工作。随着它的发展,功能越来越多。拥有同步和异步两种模式。结合apache camel,可以很方面的创建异步流式处理集群,称为牧场蜂群模式。使用这套脚本,根据任务情况,需要有xml,yaml,json,xpath, jsonpath, beetl模板,apache camel等相关知识。脚本本身是yaml格式。支持单步调试。 request: jdk1.7 详细文档参见wiki 特性 支持同步(批处理)和异步(流处理)两种模式 支持各种常见的数据来源的读写(http, mqtt, activemq, file, mysql, oracle, sqlserver, mongodb, elastiasearch),能很方面的扩展新的来源。 集成apac
资源推荐
资源详情
资源评论
收起资源包目录
BeePasture:蜜蜂牧场是一个数据采集清洗工具,也是一个ETL工具,同时也是一套脚本语言 (207个子文件)
sougou.dic 4.98MB
main.dic 2.92MB
single_word.dic 62KB
single_word_full.dic 62KB
single_word_low_freq.dic 13KB
quantifier.dic 2KB
surname.dic 752B
suffix.dic 192B
stopword.dic 166B
stopword.dic 164B
ext_stopword.dic 156B
mydict.dic 130B
preposition.dic 123B
.gitignore 175B
GatherStep.java 51KB
HttpTools.java 25KB
ExcelParser.java 21KB
Dictionary.java 20KB
HttpTools4.java 17KB
JdbcResource.java 16KB
OkHttpTools.java 16KB
HrefElementCorrector.java 12KB
NagaoAlgorithm.java 12KB
AnalyzeContext.java 11KB
FlowGather.java 10KB
HttpResource.java 10KB
ElasticsearchResource.java 10KB
FileResource.java 10KB
ZipUtils.java 9KB
DictSegment.java 9KB
LetterSegmenter.java 9KB
ParseUtils.java 8KB
GatherDebug.java 8KB
FtpResource.java 8KB
StringFunctions.java 7KB
BeeGather.java 7KB
CN_QuantifierSegmenter.java 7KB
Lexeme.java 6KB
LexemePath.java 6KB
BeeResource.java 6KB
ScriptTemplateExecuter.java 6KB
EsperProcess.java 6KB
QuickSortSet.java 6KB
EasySSLProtocolSocketFactory.java 6KB
SmartDateFunction.java 5KB
DirResource.java 5KB
ElectroHttpProxy.java 5KB
CamelContextResource.java 5KB
IKArbitrator.java 5KB
DfaResource.java 5KB
DeterministicFiniteAutomaton.java 4KB
MongodbResource.java 4KB
IKTokenizer.java 4KB
Main.java 4KB
ElectroHttpTools.java 4KB
IKSegmenter.java 4KB
NagaoResource.java 4KB
CJKSegmenter.java 4KB
CSVUtils.java 4KB
LastDayOfMonthFunction.java 4KB
ResourceMng.java 4KB
OssResource.java 4KB
Main.java 3KB
CharacterUtil.java 3KB
Monitor.java 3KB
DateAddFunction.java 3KB
PageAnalyzer.java 3KB
EasyX509TrustManager.java 3KB
EsperResource.java 3KB
Hit.java 3KB
BeeGatherServiceImpl.java 3KB
ElasticsearchResourceTest.java 2KB
ProxyService.java 2KB
IKAnalzyerDemo.java 2KB
ResourceUtils.java 2KB
ScriptTemplateExecuterTest.java 2KB
LoadYaml2Class.java 2KB
ConsoleResource.java 2KB
TFNeighbor.java 2KB
FilterResult.java 2KB
StreamLineIterator.java 2KB
SSLClient.java 2KB
Main.java 2KB
HttpServiceMng.java 2KB
IKAnalyzer.java 2KB
CharacterHelper.java 2KB
InsertSqlServer.java 1KB
MyResourceTest.java 1KB
JavaScriptExecuter.java 1KB
ISegmenter.java 1KB
StringFunctionsTest.java 1KB
Yaml2Json.java 1KB
HttpService.java 996B
AuthorizationRequestFilter.java 979B
BeeGatherService.java 948B
TestDateFormat.java 905B
SimpleResponseFilter.java 887B
ExcelResource.java 884B
Sleep.java 771B
City.java 663B
共 207 条
- 1
- 2
- 3
资源评论
林John
- 粉丝: 47
- 资源: 4601
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- js基础但是这个烂怂东西要求标题不能少于10个字才能上传然后我其实还没有写完之后再修订吧.md
- electron-tabs-master
- Unity3D 布朗运动算法插件 Brownian Motion
- 鼎微R16中控升级包R16-4.5.10-20170221及强制升级方法
- 鼎微R16中控升级包公版UI 2015及强制升级方法,救砖包
- 基于CSS与JavaScript的积分系统设计源码
- 生物化学作业_1_生物化学作业资料.pdf
- 基于libgdx引擎的Java开发连连看游戏设计源码
- 基于MobileNetV3的SSD目标检测算法PyTorch实现设计源码
- 基于Java JDK的全面框架设计源码学习项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功