没有合适的资源?快使用搜索试试~ 我知道了~
folioxml:Folio Flat File到XMLHTMLLucene转换框架
共188个文件
java:166个
xml:7个
gitignore:2个
需积分: 9 0 下载量 12 浏览量
2021-05-18
20:33:47
上传
评论
收藏 421KB ZIP 举报
温馨提示
掌握: 开发: 这是什么? 这是Folio Flat File数据库的完整流式处理词法分析器,解析器和编译器。 输出包括SLX,XML,HTML和Lucene。 基于流的(不是基于DOM的)-可以以非常低的RAM使用率快速处理千兆字节。 第一步是无损转换为SLX格式。 这就像XML,但是包含“ ghost标签”,它们成对出现(带有匹配的GUID),并且可以在任何地方开始和结束。 这将〜120关键字〜20上下文语言简化为〜12关键字和2个上下文。 第二种转换是从SLX到XML。 这导致幻影标签被分割,因此名义上是有损的,但实际上是无损的。 从XML,我们可以转换为HTML,Lucene等。 我们甚至支持将查询链接转换为超链接,因为我们已经在folioxml-lucene包中重新实现了folio查询语言。 我们的XML实现提供了基于正则表达式的搜索和替换,仅影响节点的文本内容-
资源推荐
资源详情
资源评论
收起资源包目录
folioxml:Folio Flat File到XMLHTMLLucene转换框架 (188个子文件)
.gitattributes 732B
.gitignore 904B
.gitignore 14B
diff_match_patch.java 101KB
diff_match_patch_test.java 45KB
FolioCssUtils.java 43KB
FolioTokenReaderTest.java 38KB
FolioSlxTranslator.java 37KB
VirtualCharSequence.java 33KB
SlxToXmlTransformer.java 29KB
SlxTransformer.java 25KB
NodeList.java 24KB
TokenBase.java 19KB
SlxRecord.java 17KB
SlxContextStack.java 16KB
CssClassCleaner.java 16KB
FauxTabs.java 15KB
RenameImages.java 14KB
TokenUtils.java 14KB
ResolveHyperlinks.java 12KB
FolioToken.java 12KB
FolioLinkUtils.java 12KB
QueryToken.java 11KB
FolioTokenReader.java 10KB
InventoryNodes.java 10KB
Node.java 10KB
TokenReaderBase.java 10KB
VirtualCharSequenceTest.java 9KB
QueryParser.java 9KB
ExportXmlFile.java 8KB
IdSlugProvider.java 8KB
IndexFieldOpts.java 8KB
SimultaneousTest.java 8KB
HtmlEntities.java 7KB
ExportHtmlFiles.java 7KB
SlxValidator.java 7KB
StylesheetBuilder.java 7KB
InfobaseSetVisitor.java 6KB
RegexTestHarness.java 6KB
YamlInfobaseSet.java 6KB
InfobaseSetIndexer.java 6KB
SlxRecordReader.java 6KB
FolioToSlxDiagnosticTool.java 6KB
DirectXhtmlExporter.java 6KB
SlxRecordReaderTestFile.java 6KB
XmlStringWrapperTest.java 6KB
PullElements.java 5KB
ObjectResolver.java 5KB
ExportRunner.java 5KB
FolioObjectUtils.java 5KB
FolioSlxTransformerTest.java 5KB
FieldCollector.java 5KB
CssUtils.java 5KB
ExportHiddenText.java 5KB
YamlExportLocations.java 4KB
ExportStructure.java 4KB
YamlInfobaseConfig.java 4KB
RenameFiles.java 4KB
XmlFormatter.java 4KB
LookAroundCharTokenizer.java 4KB
Indexer.java 3KB
SlugProvider.java 3KB
StringIncludeResolver.java 3KB
ExportCssFile.java 3KB
QueryParserTest.java 3KB
HtmlUtil.java 3KB
TextLinesBuilder.java 3KB
SlxToken.java 3KB
EffectiveStyle.java 3KB
TokenCombinerTest.java 3KB
InfobaseFieldOptsSet.java 3KB
Popups.java 3KB
DirectXmlExporter.java 3KB
HtmlTidy.java 3KB
Stopwatch.java 3KB
CleanupSlxStuff.java 3KB
BaseFileSplitter.java 3KB
FixHttpLinks.java 3KB
DirectSlxExporter.java 3KB
FileIncludeResolver.java 3KB
Main.java 3KB
LinkMapper.java 3KB
TokenBaseReader.java 3KB
RegexBugs.java 2KB
XmlRecord.java 2KB
TestExportRunner.java 2KB
LineColTracker.java 2KB
Notes.java 2KB
SlxTokenTest.java 2KB
ApplyProcessor.java 2KB
ExportInventory.java 2KB
StaticFileNode.java 2KB
FolioTokenReaderTestFile.java 2KB
MultiRunner.java 2KB
FolioTokenTest.java 2KB
ExportMappingsFiles.java 2KB
TokenCombiner.java 2KB
FolioEnuTokenizer.java 2KB
FolioLinkUtilsTest.java 2KB
ExportSlxFile.java 2KB
共 188 条
- 1
- 2
资源评论
LeonardoLin
- 粉丝: 17
- 资源: 4659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 使用NetBeans连接SQLserver2008数据库教程中文WORD版最新版本
- XPath实例中文WORD版最新版本
- XPath语法规则中文WORD版最新版本
- XPath入门教程中文WORD版最新版本
- ORACLE数据库管理系统体系结构中文WORD版最新版本
- Sybase数据库安装以及新建数据库中文WORD版最新版本
- tomcat6.0配置oracle数据库连接池中文WORD版最新版本
- hibernate连接oracle数据库中文WORD版最新版本
- MyEclipse连接MySQL的方法中文WORD版最新版本
- MyEclipse中配置Hibernate连接Oracle中文WORD版最新版本
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功