没有合适的资源?快使用搜索试试~ 我知道了~
ISATabParser:ISA-Tab 数据格式的 Tika 解析器
共34个文件
txt:16个
java:9个
jar:4个
需积分: 20 0 下载量 146 浏览量
2021-06-05
10:45:58
上传
评论
收藏 64.94MB ZIP 举报
温馨提示
ISAtab解析器 这是为 Tika 添加解析 ISA-Tab 数据格式的能力的初步工作。 ISA-Tab 文件与相关。 这项工作旨在提供以下功能: 基于全局模式和头值模式匹配的检测。 每个 ISA-Tab 文件类型一个 Tika 解析器(三个解析器:调查、研究、分析) 调查解析器仅获取元数据。 由于 ISA-Tab 文件是自上而下组织的,我正在努力扩展它,以便从调查开始解析相关文件(研究和分析文件)。 Study 和 Assay 解析器依靠 Apache Commons CSV 来执行解析,因为研究和分析文件都是按行组织的,它们本质上是使用制表符作为分隔符的 CSV 文件。 下一步是什么 最重要的改进是细化这三个解析器并将它们组合起来,以便尽可能好地解析 ISArchive。 另一个改进是在 XHTML 结构上更好地映射研究和分析数据。 TIKA-1580 已在 Tika 问
资源推荐
资源详情
资源评论
收起资源包目录
ISATabParser-master.zip (34个子文件)
ISATabParser-master
build.sh 670B
BII-I-1
s_BII-S-2.txt 6KB
a_transcriptome.txt 18KB
a_proteome.txt 6KB
a_microarray.txt 8KB
a_metabolome.txt 42KB
s_BII-S-1.txt 41KB
i_investigation.txt 23KB
a_bii-s-2_metabolite profiling_NMR spectroscopy.txt 8KB
src
TestISATabAssay.java 1KB
TestISATabStudy.java 1KB
TestISATabInvestigation.java 2KB
org
apache
tika
parser
isatab
ISATabInvestigationParserTest.java 2KB
ISATabStudyParserTest.java 2KB
ISATabAssayParser.java 4KB
ISATabAssayParserTest.java 2KB
ISATabStudyParser.java 4KB
ISATabInvestigationParser.java 4KB
lib
tika-app-1.8-SNAPSHOT.jar 42.98MB
commons-csv-1.1.jar 36KB
junit-4.12.jar 308KB
tika-app-1.7.jar 29.59MB
run.sh 1KB
LICENSE 11KB
test
test-documents
testISATab_BII-I-1
s_BII-S-2.txt 6KB
a_transcriptome.txt 18KB
a_proteome.txt 6KB
a_microarray.txt 8KB
a_metabolome.txt 42KB
s_BII-S-1.txt 41KB
i_investigation.txt 23KB
a_bii-s-2_metabolite profiling_NMR spectroscopy.txt 8KB
README.md 1KB
.gitignore 629B
共 34 条
- 1
资源评论
HMI前线
- 粉丝: 22
- 资源: 4590
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功