没有合适的资源?快使用搜索试试~ 我知道了~
html5lib-python:符合标准的库,用于在Python中解析和序列化HTML文档和片段
共135个文件
py:59个
html:32个
rst:14个
需积分: 50 2 下载量 198 浏览量
2021-02-25
10:22:31
上传
评论
收藏 294KB ZIP 举报
温馨提示
html5lib html5lib是用于解析HTML的纯Python库。 它被设计为符合WHATWG HTML规范,所有主要的Web浏览器都实现了该规范。 用法 简单用法遵循以下模式: import html5lib with open ( "mydocument.html" , "rb" ) as f : document = html5lib . parse ( f ) 或者: import html5lib document = html5lib . parse ( "<p>Hello World!" ) 默认情况下, document将是xml.etree元素实例。 html5lib尽可能选择加速的ElementTree实现(即Python 2.x上的xml.etree.cElementTree )。 支持其他两种树类型: xml.dom.minidom和lx
资源推荐
资源详情
资源评论
收起资源包目录
html5lib-python:符合标准的库,用于在Python中解析和序列化HTML文档和片段 (135个子文件)
make.bat 7KB
setup.cfg 154B
.coveragerc 113B
tests1.dat 12KB
.pytest.expect 129KB
.gitignore 2KB
.gitmodules 109B
idbindex_get8.htm 876B
html.html 229KB
big5_chars_extra.html 121KB
test-plan.src.html 90KB
grid-auto-fill-rows-001.html 9KB
fetch.http.html 6KB
align-content-wrap-002.html 4KB
image-orientation-from-image-content-images-ref.html 3KB
masonry-item-placement-006.html 3KB
worker-constructor.https.html 3KB
htb-ltr-ltr.html 2KB
filter-turbulence-invalid-001.html 2KB
shape-outside-content-box-002.html 2KB
euckr-encode-form.html 2KB
position-sticky-table-th-bottom-ref.html 1KB
2d.composite.image.destination-over.html 1KB
grouping-dl.html 1016B
pre-float-001.html 998B
will-change-abspos-cb-001.html 924B
background_shorthand_css_relative_url.html 915B
moz-css21-table-page-break-inside-avoid-2.html 862B
idlharness.html 830B
resize-004.html 812B
moz-css21-float-page-break-inside-avoid-6.html 802B
toBlob.png.html 594B
heavy-styling-005.html 448B
frame-ancestors-self-allow.html 426B
background-origin-007-ref.html 413B
li-type-unsupported-ref.html 268B
001.html 161B
beforeunload-on-history-back-1.html 151B
utf-8-bom.html 59B
us-ascii.html 53B
MANIFEST.in 227B
pytest.ini 614B
tox.ini 504B
LICENSE 1KB
Makefile 7KB
README.md 3KB
LICENSE.md 1KB
README.md 388B
html5parser.py 114KB
constants.py 82KB
_tokenizer.py 75KB
_inputstream.py 32KB
sanitizer.py 26KB
_ihatexml.py 16KB
serializer.py 15KB
etree_lxml.py 14KB
base.py 14KB
etree.py 13KB
optionaltags.py 10KB
test_stream.py 10KB
tokenizer.py 9KB
dom.py 9KB
test_serializer.py 8KB
test_treewalkers.py 8KB
parse.py 8KB
tree_construction.py 8KB
base.py 7KB
etree_lxml.py 6KB
support.py 6KB
__init__.py 6KB
test_sanitizer.py 6KB
_utils.py 5KB
test_encoding.py 5KB
test_whitespace_filter.py 5KB
setup.py 5KB
etree.py 4KB
conftest.py 4KB
test_parser2.py 4KB
conf.py 4KB
lint.py 4KB
__init__.py 4KB
inject_meta_charset.py 3KB
entities.py 3KB
genshi.py 2KB
test_alphabeticalattributes.py 2KB
test_tokenizer2.py 2KB
tokenizertotree.py 2KB
sanitizer.py 2KB
test_treeadapters.py 2KB
sax.py 2KB
py.py 2KB
genshi.py 2KB
bench_html.py 2KB
dom.py 1KB
whitespace.py 1KB
bench_wpt.py 1KB
__init__.py 1KB
test_meta.py 1KB
_base.py 1013B
alphabeticalattributes.py 919B
共 135 条
- 1
- 2
资源评论
缪之初
- 粉丝: 31
- 资源: 4720
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功