NLP(Natural Language Processing,自然语言处理)是计算机
科学领域以及人工智能领域的一个重要的研究方向,它研究用计算机
来处理、理解以及运用人类语言(如中文、英文等),达到人与计算
机之间进行有效通讯。
在一般情况下,用户可能不熟悉机器语言,所以自然语言处理技
术可以帮助这样的用户使用自然语言和机器交流。从建模的角度看,
为了方便计算机处理,自然语言可以被定义为一组规则或符号的集合,
我们组合集合中的符号来传递各种信息。
这些年,NLP 研究取得了长足的进步,逐渐发展成为一门独立的
学科,从自然语言的角度出发,NLP 基本可以分为两个部分:自然语
言处理以及自然语言生成,演化为理解和生成文本的任务,如图所示。
▲NLP 的基本分类
自然语言的理解是个综合的系统工程,它又包含了很多细分学科,
有代表声音的音系学,代表构词法的词态学,代表语句结构的句法学,
代表理解的语义句法学和语用学。