机器学习作为一门研究计算机如何利用经验自动提高性能的学科,在近年来取得了突飞猛进的发展,并且在多个领域都取得了显著的应用成果。从信用卡欺诈检测的数据挖掘程序到个性化推荐系统,再到自动驾驶汽车,机器学习的应用范围广泛,其理论和实践都得到了深度的发展和广泛的关注。
在机器学习的学习过程中,其核心算法和理论是学习的重点。这些算法和理论并不是孤立的,而是融合了来自统计学、人工智能、哲学、信息论、生物学、认知科学、计算复杂性和控制论等多个学科的成果和概念。研究机器学习,需要从这些学科的视角来理解机器学习中的问题背景、算法和隐含的假设,这有助于深刻理解机器学习的多面性和复杂性。
本书的写作宗旨是为不同知识背景的读者提供机器学习的入门教材,即便没有相关领域的预备知识,也可以通过本书来学习机器学习。教材不仅覆盖了理论知识,还强调了理论与实践的平衡,旨在让学生能够理解机器学习的算法,并且能够实际应用这些算法来解决问题。
本书还特别提供了在线资源,包括多个实际应用中的机器学习算法的源代码和数据集,例如用于人脸识别的神经网络、用于信贷分析的决策树学习以及用于分析文本文档的贝叶斯分类器等。这些资源可以帮助读者更好地理解算法,并在实际编程中进行实践。
为了保证教材的质量,作者在写作过程中得到了来自机器学习领域的技术专家的帮助,他们在各自专业领域对书稿进行了审核,并提出了宝贵的建议。此外,大学里的讲师和学生也参与了草稿的测试,并给出了反馈。作者在此对所有给予帮助和支持的人表示了感谢,并且特别提到了为本书作出贡献的编辑、索引构建者以及家人的支持。
绪论部分强调了计算机学习能力的重要性,并展望了其可能带来的应用前景。例如,未来的计算机可能会从医疗记录中学习以获取治疗新疾病的方法,或者住宅管理系统分析用电模式以降低能源消耗。尽管我们目前还未达到让计算机学习能力与人类媲美的程度,但是已经有一些针对特定任务的算法被开发出来,并在实践中取得了成效。
本书的教材适合计算机科学与工程、统计学和社会科学等专业的大学生和研究生学习使用,同样也可作为软件研究人员和从业人员的参考资料。其写作原则是确保内容对在校大学生来说是易于理解的,并且包含博士生在开始研究机器学习前应掌握的知识。通过这样的内容设置,既保证了教材的普及性,也确保了其在专业领域的深度。