没有合适的资源?快使用搜索试试~ 我知道了~
1120192236-赖昱行-中文分词发展与技术研究(1)1
需积分: 0 0 下载量 180 浏览量
2022-08-03
14:17:35
上传
评论
收藏 603KB PDF 举报
温馨提示
试读
17页
摘要I第 1 章 中文分词的必要性和问题 11.1 必要性 11.2 问题 11.2.1 缺乏统一的分词标准 11.2.2 切分歧义 21.2.3 未登录词 2
资源详情
资源评论
资源推荐
计算机新技术专题论文
中文分词发展与技术研究
A survey of Chinese word segmentation development and
techniques
学 院:
计算机学院
专 业:
计算机科学与技术
学生姓名:
赖昱行
学 号:
1120192236
指导教师:
黄河燕
2021 年 11 月 19 日
计算机新技术专题(论文)
I
中文分词发展与技术研究
摘 要
在中文自然语言处理任务中,中文分词属于最基础的任务,长期以来是其他任务
的前提和基石。回顾中文分词技术的发展并进行归纳和总结,可以为后来的研究提供
参考。本文整理了中文分词的必要性和关键问题,梳理了机械分词、机器学习和深度
学习的典型算法和模型,并给出了优劣势的分析。同时选取了 31 篇来自各类期刊会
议的中英文文献进行观点佐证。结果显示,目前以深度学习为基础的模型最为突出,
在已有的成果上进一步提高了中文分词的准确率。本文未能对近年的优秀模型进行
深入的讨论和比较。中文分词领域在未来仍有集成算法、联合模型、迁移学习、多模
态等领域值得研究和开拓。
关键词:中文分词;机器学习;深度学习;语义理解
计算机新技术专题(论文)
II
A survey of Chinese word segmentation development and
techniques
Abstract
In Chinese natural language processing tasks, Chinese word segmentation is the most
basic task, and has long been the premise and cornerstone of other tasks. Reviewing the
development of Chinese word segmentation technology and making a summary and
conclusion can provide guidance for future research. This article sorts out the necessity and
key issues of Chinese word segmentation, gives a brief introduction to the typical algorithms
and models of mechanical word segmentation, machine learning and deep learning, and
gives an analysis of the advantages and disadvantages. At the same time, 31 Chinese and
English papers from various journals and conferences were referred to support my opinions.
The results show that the current deep learning-based model is the most prominent, and it
has further improved the accuracy of Chinese word segmentation compared with the
existing results. This article hasn’t yet conducted in-depth discussion and comparison of the
excellent models in recent years. In the field of Chinese word segmentation, there are still
areas worthy of research and development in the future, such as integrated algorithms, joint
models, transfer learning, and multi-modality.
Key Words: Chinese Word Segmentation; Machine Learing; Deep Learning;
Semantic Understanding
剩余16页未读,继续阅读
英次
- 粉丝: 20
- 资源: 306
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0