# 中文命名实体识别
基于同样的语料([人民日报](https://github.com/buppt/ChineseNER/blob/master/data/renMinRiBao) ),分别训练了HMM、BiLSTM+CRF及基于ALBERT的多分类模型,运行如下图所示:
![](./ner.gif)
## 数据
实体类型:人名(nr)、地名(ns)、机构名(nt)、其它(o)
每个实体中字符按其位置,进行标记:(B | 词首),(M | 词中),(E | 词尾),因此数据标签共十种
## 训练模型
参见 [notebooks](./notebooks)
## 模型:
- HMM
- BiLSTM-CRF
- ALBERT(预训练模型来源:https://github.com/brightmart/albert_zh)
训练完成的模型:[百度网盘链接](https://pan.baidu.com/s/1lIVomat3AAff7HfFzfpRxQ) 提取码:xsdl
将模型文件保存在项目的 `ner/saved` 文件夹中
## 性能
- HMM
![](./hmm-performance.JPG)
- BiLSTM-CRF
![](./LSTM-performance.JPG)
- ALBERT
![](./albert-performance.JPG)
## 运行:
```shell
> cd ner
> python app.py
```
葡萄籽儿
- 粉丝: 581
- 资源: 2412
最新资源
- 料带自动上料机含bom和3D图纸和工程图机械结构设计图纸和其它技术资料和技术方案非常好100%好用.zip
- 使用Java多线程和同步机制实现生产者-消费者模式.zip
- 端子排自动切割设备含bom工程图机械结构设计图纸和其它技术资料和技术方案非常好100%好用.zip
- Python爬虫入门实例:利用requests和BeautifulSoup抓取网页标题
- HBase常用的Shell命令
- Linux下Oracle 11g的完整安装与配置指南
- MySQL多平台安装教程:Windows、macOS与Linux
- 新年快乐,喜庆html
- 单片机综合实验储物箱重庆邮电大学
- Screenshot_20241224_205242_com.tencent.tmgp.sgame.jpg
- html css网页制作成品.docx
- Selenium-ECShop项目文档
- 实验报告,重庆邮电大学,单片机,大作业
- 汽车防撞梁总成装配台3D图纸和工程图机械结构设计图纸和其它技术资料和技术方案非常好100%好用.zip
- Java平台Maven项目管理和构建工具的安装与配置
- 重庆邮电大学所有实验单片机,大作业,串口,双机编程,程序文件
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈