## A Simple Python Implementation of Part-of-Speech Tagging with HMM
See [隐马尔可夫模型词性标注及其Python实现](https://zhuanlan.zhihu.com/p/48260272) for detail.
#### Data
Click [here](https://pan.baidu.com/s/1gk28n6or4NHZfOuaiJg1Ag) to download the data.
#### Train
```
python learn_hmm.py pos_train.json
```
#### Decode
```
python viterbi.py
```
#### Forward Algorithm
```
python forward.py
```
#### Evaluate
```
python measure.py
```
没有合适的资源?快使用搜索试试~ 我知道了~
HMM完整代码,在原有代码基础上修改,如何运行看“资源描述”
共48个文件
sample:13个
json:11个
py:5个
需积分: 0 0 下载量 121 浏览量
2024-04-29
15:41:12
上传
评论
收藏 53.75MB ZIP 举报
温馨提示
1,python corpus_preprocess.py 生成 corpus.json corpus_train.json corpus_test.json数据文件 2,python learn_hmm.py corpus_train.json 训练生成 corpus_pi.json corpus_transition.json corpus_emission.json 学习后的文件 3,python viterbi.py 运行维特比算法,以代码中sent为例进行词性分析,输出结果 4,python forward.py 对corpus的测试数据,corpus_test.json进行处理 5,python measure.py 使用测试数据corpus_test.json进行评估,准确率92%
资源推荐
资源详情
资源评论
收起资源包目录
HMM_POS.zip (48个子文件)
HMM_POS
test_hmm.ipynb 7KB
forward.py 2KB
corpus_train.json 26.89MB
corpus_preprocess.py 2KB
pos_train.json 120.02MB
corpus_pi.json 1006B
viterbi.py 5KB
.git
index 545B
HEAD 23B
refs
heads
master 41B
tags
remotes
origin
HEAD 32B
objects
pack
pack-614f5751f61d07d98b04c4e1092858c41a450096.pack 183KB
pack-614f5751f61d07d98b04c4e1092858c41a450096.idx 2KB
info
description 73B
packed-refs 114B
info
exclude 240B
logs
HEAD 184B
refs
heads
master 184B
remotes
origin
HEAD 184B
hooks
post-update.sample 189B
prepare-commit-msg.sample 1KB
commit-msg.sample 896B
pre-receive.sample 544B
update.sample 4KB
pre-commit.sample 2KB
pre-rebase.sample 5KB
applypatch-msg.sample 478B
fsmonitor-watchman.sample 5KB
push-to-checkout.sample 3KB
pre-applypatch.sample 424B
pre-push.sample 1KB
pre-merge-commit.sample 416B
config 302B
pi.json 1004B
raw_pos_data.txt 26.62MB
corpus_test.json 26.89MB
emission.json 64.75MB
learn_hmm.py 4KB
corpus.json 26.89MB
transition.json 33KB
维特比递推演示.pdf 256KB
measure.py 1KB
corpus.txt 4.93MB
__pycache__
viterbi.cpython-38.pyc 2KB
corpus_transition.json 32KB
README.md 483B
corpus_emission.json 25.24MB
pos_test.json 10.74MB
共 48 条
- 1
资源评论
青州从事521
- 粉丝: 3
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功