没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
概述 在本作业中,您将为英语,中文和一种令人惊讶的语言编写“隐马尔可夫模型”词性标记器。 提供训练数据标记和标记。 测试数据将以标记形式提供,您的标记者将添加标记。 数据 数据将包括: 两个文件(一个英文,一个中文),带有单词/标签格式的带标签的训练数据,单词之间用空格分隔,每个句子换行。 两个文件(一个英文,一个中文),带有未标记的开发数据,单词之间用空格分隔,每个句子换行。 两个文件(一个英文,一个中文),带有单词/标签格式的带标签的开发数据,单词之间用空格分隔,每个句子用新的一行代替,用作答案键。 程式 您将编写两个程序: hmmlearn.py将从训练数据中学习隐藏的Markov模型, hmmdecode.py将使用该模型标记新数据。 学习程序将通过以下方式调用: > python hmmlearn.py /path/to/input 该参数是一个包含训练数据的文件; 该
资源推荐
资源详情
资源评论
收起资源包目录
HMM-Part-of-Speech-Tagger-master.zip (12个子文件)
HMM-Part-of-Speech-Tagger-master
hmmlearn.py 9KB
hmmoutput.txt 206KB
hmmdecode.py 11KB
hmmmodel.txt 3.21MB
README.md 3KB
coding1-data-corpus
zh_dev_tagged.txt 104KB
zh_train_tagged.txt 808KB
zh_dev_raw.txt 65KB
en_dev_raw.txt 126KB
en_train_tagged.txt 1.63MB
en_dev_tagged.txt 206KB
data.py 4KB
共 12 条
- 1
资源评论
不爱说话的我
- 粉丝: 17
- 资源: 4616
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 1美赛大纲资料.txt
- 2011-2020各省房地产业增加值-亿元
- 无外观自定义控件Demo
- 基于java与阿里云RDS数据库对于天天基金网上的基金公告进行爬取与查询.zip
- Unity3D((4.x5.x)版本游戏源码(4.x-5.x)横板跑酷游戏
- 毕业设计基于LabView+MATLAB的说话人识别系统源码+说明.zip
- 基于LabVIEW的音乐机器人源码课程设计.zip
- SaveShareFileSet(保存WINDOWS server所有共享用户,共享文件夹,和共享权限)
- 项目设计基于Labview的转子动平衡测控系统源码+系统软件说明书.zip
- 课程设计Layabox+Unity制作的模型展示场景,鼠标、手指操控.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功