中英对比阅读你会有不一样的收获
最近ChatGPT等大模型的人工智能快速发展,表现的越来越亮眼,使人们越来有关注人工智能相关的技术动态。但其实对人工智能了解一些的人就知道目前人工智能的发展还是依托海量的数据。就像ChatGPT就是大量语料训练的结果。所以对于一些基础的机器学习和深度学习算法有一些了解后,我更加关注数据相关知识的学习。说起数据可能更多人推荐李航老师的《统计学习方法》,但我觉得统计学习方法更倾向于机器学习方法,而本书《introduction to data mining》数据挖掘导论更倾向于数据实战。
本书的第一作者密歇根州立大学计算机与工程系教授陈封能,是英文版第二版,也是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,是公认的数据挖掘领域经典的入门教程。我自己先前读过一本中文译本的(图灵和机工出版社都有中文译本),这次重温数据挖掘相关内容对于这本经典教材英文版拿来对比阅读。对比之下又对数据挖掘有了更深入的认知。
本书从基础算法的角度描述讲解数据挖掘所使用的主要原理与技术,从什么是数据挖掘、什么是数据以及数据预处理的方法,到具体的数据挖掘算法。书中使用大量的图表、综合实例、数据挖掘算法讲解等,尽可能地直接聚焦于数据挖掘的主要概念并且关注数据挖掘实战。从章节排布看,本书10各章节涵盖数据预处理、预测建模、分类、关联分析、聚类分析、异常检测和避免错误发现等主要章节,而对于主要算法章节可以看到一个主题分为两个章节进行讲解。前面一章讲述基本概念、代表性算法和评估技术,而后面一章较深入地讨论概念和算法。由浅至深地帮助读者透彻地理解数据挖掘的基础。
对于经典数据肯定是推荐的,中英对照阅读会有不一样的收获。本书虽然很基础,但更合适想要从事数据相关的工作和高年级大学生阅读。