没有合适的资源?快使用搜索试试~ 我知道了~
folioxml:Folio Flat File到XMLHTMLLucene转换框架
共188个文件
java:166个
xml:7个
gitignore:2个
需积分: 9 0 下载量 196 浏览量
2021-05-18
20:33:47
上传
评论
收藏 421KB ZIP 举报
温馨提示
掌握: 开发: 这是什么? 这是Folio Flat File数据库的完整流式处理词法分析器,解析器和编译器。 输出包括SLX,XML,HTML和Lucene。 基于流的(不是基于DOM的)-可以以非常低的RAM使用率快速处理千兆字节。 第一步是无损转换为SLX格式。 这就像XML,但是包含“ ghost标签”,它们成对出现(带有匹配的GUID),并且可以在任何地方开始和结束。 这将〜120关键字〜20上下文语言简化为〜12关键字和2个上下文。 第二种转换是从SLX到XML。 这导致幻影标签被分割,因此名义上是有损的,但实际上是无损的。 从XML,我们可以转换为HTML,Lucene等。 我们甚至支持将查询链接转换为超链接,因为我们已经在folioxml-lucene包中重新实现了folio查询语言。 我们的XML实现提供了基于正则表达式的搜索和替换,仅影响节点的文本内容-
资源推荐
资源详情
资源评论
收起资源包目录
folioxml:Folio Flat File到XMLHTMLLucene转换框架 (188个子文件)
.gitattributes 732B
.gitignore 904B
.gitignore 14B
diff_match_patch.java 101KB
diff_match_patch_test.java 45KB
FolioCssUtils.java 43KB
FolioTokenReaderTest.java 38KB
FolioSlxTranslator.java 37KB
VirtualCharSequence.java 33KB
SlxToXmlTransformer.java 29KB
SlxTransformer.java 25KB
NodeList.java 24KB
TokenBase.java 19KB
SlxRecord.java 17KB
SlxContextStack.java 16KB
CssClassCleaner.java 16KB
FauxTabs.java 15KB
RenameImages.java 14KB
TokenUtils.java 14KB
ResolveHyperlinks.java 12KB
FolioToken.java 12KB
FolioLinkUtils.java 12KB
QueryToken.java 11KB
FolioTokenReader.java 10KB
InventoryNodes.java 10KB
Node.java 10KB
TokenReaderBase.java 10KB
VirtualCharSequenceTest.java 9KB
QueryParser.java 9KB
ExportXmlFile.java 8KB
IdSlugProvider.java 8KB
IndexFieldOpts.java 8KB
SimultaneousTest.java 8KB
HtmlEntities.java 7KB
ExportHtmlFiles.java 7KB
SlxValidator.java 7KB
StylesheetBuilder.java 7KB
InfobaseSetVisitor.java 6KB
RegexTestHarness.java 6KB
YamlInfobaseSet.java 6KB
InfobaseSetIndexer.java 6KB
SlxRecordReader.java 6KB
FolioToSlxDiagnosticTool.java 6KB
DirectXhtmlExporter.java 6KB
SlxRecordReaderTestFile.java 6KB
XmlStringWrapperTest.java 6KB
PullElements.java 5KB
ObjectResolver.java 5KB
ExportRunner.java 5KB
FolioObjectUtils.java 5KB
FolioSlxTransformerTest.java 5KB
FieldCollector.java 5KB
CssUtils.java 5KB
ExportHiddenText.java 5KB
YamlExportLocations.java 4KB
ExportStructure.java 4KB
YamlInfobaseConfig.java 4KB
RenameFiles.java 4KB
XmlFormatter.java 4KB
LookAroundCharTokenizer.java 4KB
Indexer.java 3KB
SlugProvider.java 3KB
StringIncludeResolver.java 3KB
ExportCssFile.java 3KB
QueryParserTest.java 3KB
HtmlUtil.java 3KB
TextLinesBuilder.java 3KB
SlxToken.java 3KB
EffectiveStyle.java 3KB
TokenCombinerTest.java 3KB
InfobaseFieldOptsSet.java 3KB
Popups.java 3KB
DirectXmlExporter.java 3KB
HtmlTidy.java 3KB
Stopwatch.java 3KB
CleanupSlxStuff.java 3KB
BaseFileSplitter.java 3KB
FixHttpLinks.java 3KB
DirectSlxExporter.java 3KB
FileIncludeResolver.java 3KB
Main.java 3KB
LinkMapper.java 3KB
TokenBaseReader.java 3KB
RegexBugs.java 2KB
XmlRecord.java 2KB
TestExportRunner.java 2KB
LineColTracker.java 2KB
Notes.java 2KB
SlxTokenTest.java 2KB
ApplyProcessor.java 2KB
ExportInventory.java 2KB
StaticFileNode.java 2KB
FolioTokenReaderTestFile.java 2KB
MultiRunner.java 2KB
FolioTokenTest.java 2KB
ExportMappingsFiles.java 2KB
TokenCombiner.java 2KB
FolioEnuTokenizer.java 2KB
FolioLinkUtilsTest.java 2KB
ExportSlxFile.java 2KB
共 188 条
- 1
- 2
资源评论
LeonardoLin
- 粉丝: 17
- 资源: 4659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 过年倒计时动画html过年倒计时代码/春节倒计时网页版【春节倒计时html】
- arm linux tslib 1.23
- 若依python前端定时任务部署
- 基于java的库存管理系统的设计和实现.docx
- 基于java的流浪动物管理系统的设计和实现.docx
- 电动汽车再生制动系统simulink联合Carsim仿真模型,可模拟车辆在不同工况下的车辆各种参数,包含电池SOC,电压、电流、踏板深度、驱动与制动力矩等
- 基于java的码头船只货柜管理系统的设计和实现.docx
- 基于Python开发的bilibili直播弹幕点歌姬
- html+css网页设计 美食 文化美食大联盟5个页面
- 基于A*算法的往返式全覆盖路径规划的改进算法 matlab实现代码 算法一 %%往返式全覆盖路径规划 %通过建立二维栅格地图,设置障碍物,以及起始点 %根据定义往返式路径规划的定义的优先级运动规则从起
- sunyata是一个Python3 RPC框架,client和server既可以直连,也可以通过Consul或ETCD做服务注册发现 适用于 Python 的轻量级、简单、异步 RPC 框架
- 跨年烟花源代码html5-fireworks
- 基于HTTP POST请求的本地应用注册接口实现详解与用途
- Matlab遗传优化算法等算法 求解 生鲜配送问题 路径优化 时间窗 新鲜度 损成本 等约束 程序+算法+参考文献
- HTML5实现好看的二十四节气网页源码.zip
- 基于DDD架构的Java和Python混编项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功