没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Hext-从HTML提取数据 Hext是一种特定于域的语言,用于从HTML文档中提取结构化数据。 有关,和实时演示,请参见 。 可以在上找到Hext网站的镜像。 Hext项目是根据Apache License v2.0的条款发布的。 例子 假设您要从网页中提取所有超链接。 超链接具有锚标记<a>,名为href的属性和访问者可以单击的文本。 以下Hext代码段将为每个匹配的元素生成一个字典。 每个字典将包含键link和title ,这些键和link引用href属性和匹配的<a>的文本内容。 # Extract links and their text <a> 访问以了解有关Hext的更多信息。 有关使用libhext C ++库的示例,请查看/libhext/examples和。 通过Pip快速安装 您可以通过pip安装htmlext
资源推荐
资源详情
资源评论
收起资源包目录
hext:特定于域的语言,用于从HTML文档中提取结构化数据 (525个子文件)
htmlext.1 3KB
htmlext.bats 5KB
HextEnableWarnings.cmake 2KB
FindPHP.cmake 675B
HextOptionRunRagel.cmake 655B
FindRapidJSON.cmake 464B
FindGumbo.cmake 459B
HextForceCppStd.cmake 409B
FindPocoFoundation.cmake 350B
HextCompilerIsClangOrGcc.cmake 178B
HextDefaultBuildRelease.cmake 153B
HextConfig.cmake 152B
Parser.cpp 76KB
html-tag.cpp 13KB
rule-matching.cpp 8KB
RuleMatching.cpp 8KB
NodeUtil.cpp 7KB
Rule.cpp 6KB
StringUtil.cpp 5KB
nth-child-match.cpp 5KB
rule.cpp 5KB
ProgramOptions.cpp 5KB
NthChildMatch.cpp 4KB
Rule.cpp 4KB
extract-href.cpp 4KB
main.cpp 4KB
mixed.cpp 3KB
Json.cpp 3KB
function-capture.cpp 2KB
File.cpp 2KB
Html.cpp 2KB
attribute-capture.cpp 2KB
chaining.cpp 2KB
AttributeCapture.cpp 2KB
contains-words-test.cpp 2KB
AttributeMatch.cpp 2KB
FunctionCapture.cpp 2KB
NegateMatch.cpp 2KB
trim-and-collapse-ws.cpp 2KB
collapsews-pipe.cpp 2KB
FunctionValueMatch.cpp 2KB
StringPipe.cpp 2KB
ChildCountMatch.cpp 1KB
OnlyChildMatch.cpp 1KB
PatternValues.cpp 1KB
function-value-match.cpp 1KB
attribute-count-match.cpp 1KB
ContainsWordsTest.cpp 1KB
Builtins.cpp 1KB
Html.cpp 1KB
string-pipe.cpp 1KB
only-child-match.cpp 1KB
print-numbered-lines.cpp 1KB
regex-test.cpp 1KB
regex-replace-pipe.cpp 1KB
ErrorOutput.cpp 1KB
attribute-match.cpp 1KB
negate-match.cpp 1KB
NegateTest.cpp 1KB
child-count-match.cpp 1KB
function-match.cpp 1KB
regex-pipe.cpp 1KB
node.cpp 1KB
begins-with-test.cpp 1KB
is-space.cpp 1KB
text-builtin.cpp 1KB
contains-test.cpp 1KB
equals-test.cpp 1KB
RegexPipe.cpp 1KB
char-position.cpp 1KB
BeginsWithTest.cpp 1KB
AttributeCountMatch.cpp 1KB
ends-with-test.cpp 1KB
EndsWithTest.cpp 1KB
inner-html-builtin.cpp 990B
FunctionMatch.cpp 986B
ContainsTest.cpp 982B
CasePipe.cpp 977B
parse-hext.cpp 957B
RegexReplacePipe.cpp 933B
TrimPipe.cpp 922B
case-pipe.cpp 921B
RegexTest.cpp 908B
ParseHext.cpp 904B
html.cpp 898B
EqualsTest.cpp 889B
negate-test.cpp 889B
Rule.cpp 884B
PrependPipe.cpp 866B
AppendPipe.cpp 844B
strip-tags-builtin.cpp 812B
trim-pipe.cpp 812B
CollapseWsPipe.cpp 800B
Html.cpp 797B
prepend-pipe.cpp 770B
append-pipe.cpp 767B
SyntaxError.cpp 765B
Hextjs.cpp 730B
main.cpp 721B
Dockerfile 106B
共 525 条
- 1
- 2
- 3
- 4
- 5
- 6
资源评论
华笠医生
- 粉丝: 33
- 资源: 4679
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功