没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
phon 安装 该软件已在最新版本的macOS,Windows和ubuntu上经过测试。 您将需要受支持的python版本(上述)以及pip 。 $ pip install dphon 如果您使用的是Windows,并且在终端中看到格式错误的输出,请查看一下。 用法 基本 dphon的主要功能是在一组旧中文文本中查找文本重用的实例。 通过执行音素到音素转换,并根据在大声说出的段落中听起来是否相似(或押韵)来确定可能的重用,而不是仅仅依靠音素。 您将需要将文件以utf-8编码的纯文本( .txt )或json-lines( .jsonl )格式存储在本地。 对于前者,假定一个文件代表一个文档。 对于后者,一个文件可以包含任意多行,每行都是一个文档,具有必需的键id (唯一标识符)和text (文本内容)以及任意数量的可选键。 您可以通过从kanseki存储库中获得具有代表性的古汉语语料
资源推荐
资源详情
资源评论
收起资源包目录
dphon-main.zip (62个子文件)
dphon-main
MANIFEST.in 18B
.github
workflows
docs.yml 645B
codeql.yml 366B
ci.yml 2KB
.python-version 6B
requirements.txt 118B
dphon
ngrams.py 1KB
corpus.py 7KB
g2p.py 7KB
console.py 5KB
__init__.py 22B
align.py 4KB
match.py 2KB
index.py 6KB
cli.py 9KB
extend.py 7KB
data
oc-vowels.txt 176B
sound_table_v2.json 795KB
sound_table_v1.json 346KB
oc-consonants.txt 2KB
reuse.py 4KB
LICENSE 1KB
setup.cfg 34B
setup.py 2KB
README.md 9KB
requirements.lock 442B
docs
index.m.html 26KB
index.html 9KB
extend.html 28KB
cli.html 25KB
align.html 20KB
match.html 16KB
ngrams.html 11KB
reuse.html 25KB
console.html 20KB
g2p.html 31KB
corpus.html 24KB
tests
fixtures
shijing
shijing2.txt 4KB
shijing1.txt 2KB
wenzi
wenzi_1_1a-3b.txt 2KB
hanfeizi_11.txt 15KB
shuoyuan_16_8b.txt 656B
guanzi_14.txt 3KB
laozi
tiny.txt 30B
mwd_laozi.txt 19KB
gd_laozi.txt 4KB
laozi.txt 19KB
__init__.py 0B
unit
test_align.py 5KB
test_cli.py 1KB
test_g2p.py 5KB
test_match.py 2KB
test_ngrams.py 3KB
test_index.py 3KB
__init__.py 0B
test_reuse.py 3KB
test_extend.py 12KB
test_corpus.py 2KB
.gitignore 106B
dev-requirements.txt 142B
pyproject.toml 93B
.coveragerc 67B
共 62 条
- 1
资源评论
DaleDai
- 粉丝: 18
- 资源: 4724
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功