"模式识别与机器学习"
模式识别与机器学习是计算机科学和工程的两个重要领域,近年来,它们关心的共同问题(分类、聚类、特征选择、信息融合等)使得它们的界限变得模糊。模式识别是研究如何使机器具有感知能力,主要研究视觉模式和听觉模式的识别,而机器学习是研究让机器(计算机)从经验和数据获得知识或提高自身能力的科学。
模式识别的研究内容是指利用计算机对要分析的客观事物和标准模板的通过某种模式算法,对其进行分类,在错误概率最小的条件,使识别到的结果最接近于待识别的客观事实。先用一定数量的样本,根据它们之间的相似性进行分类器设计,而后用所设计的分类器对待识别的样本进行分类决策。
机器学习的研究主要在三个方面进行:一是研究人类学习的机理、人脑思维的过程;二是研究机器学习的方法;三是建立针对具体任务的学习系统。机器学习的研究是在信息科学、脑科学、神经心理学、逻辑学、模糊数学等多种学科基础上的。
机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题,包括图像视频分析、文档分析、信息检索和网络搜索等。机器学习今后主要的研究方向如下:人类学习机制的研究;发展和完善现有学习方法,建立实用的学习系统,特别是开展多种学习方法协同工作的集成化系统的研究;通过多个现有的具体例子进行分析,归纳为更一般的概念。
在模式识别和机器学习中,常用的算法包括近邻法、贝叶斯决策法、逆向传播神经网络等。近邻法是把点分为所属类别,贝叶斯决策法是基于概率统计的基本判别函数分类法,而逆向传播神经网络是基于人工神经网络的模式识别算法。
逆向传播神经网络的优点包括每个神经元的运算功能十分简单、各神经元之间是并行结构互使得其具有高速处理能力、在神经网络中,知识和信息的存储表现为神经元之间分布式的物理联系,知识存储容量很大、网状结构似的整个系统的工作不会因为个别的神经元的损失而大大降低系统性等。然而,它也存在一些缺点,如算法的稳定性和学习效率成反比、没有找到某一明确的规则确定学习效率的大小、训练过程也可能陷入局部最小等。
模式识别与机器学习是两个紧密相关的领域,它们的理论和方法可用来解决很多机器感知和信息处理的问题,未来 Machine Learning 和 Pattern Recognition 的发展方向将是人类学习机制的研究、发展和完善现有学习方法、建立实用的学习系统等。