一本偏向介绍性的数据挖掘入门必备书籍
数据挖掘越来越热,一本翻译良好、且条理清晰的书对读者详细理解数据挖掘相关知识非常重要。这里对笔者读过的清华大学出版社的《数据挖掘:概念、模型、方法和算法》(第2版)一书做出一点自己的评价。供希望学习数据挖掘的读者参考(若有措辞不当,还请见谅)。
在介绍之前,看回顾下两本经典数据挖掘书籍。一本是机械工业出版社的《数据挖掘概念与技术》(第3版)。本书偏向于概念性。不知是原文比较晦涩还是怎么说,本书的中文版的翻译有点生硬。(曾经看到有编辑和译者就共同抱怨过思科的一些书,这些书中英文本身的语句就非常晦涩,翻译起来不适合中文读者的理解。)
而人民邮电出版社的《数据挖掘导论》(完整版)作为初学者的教材不错,整书逻辑清晰。翻译的也很好。强烈建议作为入门必备,但该书是05年出版的,而这里介绍的书的英文版是11年出版的。至于这里的完整版,是曾经有一本该书的译本缺了附录。这本书补上去了,所以称为“完整版”。
上面两本经典图书是许多学习者最常接触的,但有好书就不能藏着掖着。所以就介绍下一本大家还不太熟悉的书《数据挖掘:概念、模型、方法和算法》(第2版)。
本书适合初学者的原因是因为该书介绍的面很广,描述语言也很通俗,能让读者读完后对数据挖掘有个大体的认识。如本书介绍早期数据准备等知识,虽然《数据挖掘概念与技术》也介绍了,但后者有点偏向专业短语的解释上,而本书更专注于让读者理解。
本书最值得看的一个亮点在于,每章的结束位置都有本章所引用的参考文献。或许有读者会说,其他书也有啊。但本书的不同之处在于其对每个参考文献都做了一定的介绍。这样读者就知道如果想进一步深入学习,应该看哪些文献。与其他书籍那样列出一些麻木的列出书籍或期刊名,这种方式对读者更为有好。毕竟,书和论文还是有点区别的。
但读者不要被这个书名所误解了。书名是《数据挖掘:概念、模型、方法和算法》,但本书主要关注与概念和模型。提到算法,读者的印象可能是一些代码或伪代码,但本书中几乎没有……这应该是一个不足之处,哪怕《数据挖掘导论》一书中也含有一定的伪代码。
同时,在内容上看。本书在介绍数据挖掘的同时,有些偏向与模式识别和机器学习。如本书分别以整整一章内容介绍了人工神经网络、集成学习、遗传算法等知识。
所以对初学者来说,在这本书的帮助下,读者可以对数据挖掘有广泛的认识,并能通过每章末尾的参考文献哪里了解进一步学习的方向。但最后提醒一句,本书是概念性的,不要被书名的算法二字误解了。。。因此,我认为学习数据挖掘的读者除了有一本《数据挖掘导论》之外,还应该有一本《数据挖掘:概念、模型、方法和算法》
在介绍之前,看回顾下两本经典数据挖掘书籍。一本是机械工业出版社的《数据挖掘概念与技术》(第3版)。本书偏向于概念性。不知是原文比较晦涩还是怎么说,本书的中文版的翻译有点生硬。(曾经看到有编辑和译者就共同抱怨过思科的一些书,这些书中英文本身的语句就非常晦涩,翻译起来不适合中文读者的理解。)
而人民邮电出版社的《数据挖掘导论》(完整版)作为初学者的教材不错,整书逻辑清晰。翻译的也很好。强烈建议作为入门必备,但该书是05年出版的,而这里介绍的书的英文版是11年出版的。至于这里的完整版,是曾经有一本该书的译本缺了附录。这本书补上去了,所以称为“完整版”。
上面两本经典图书是许多学习者最常接触的,但有好书就不能藏着掖着。所以就介绍下一本大家还不太熟悉的书《数据挖掘:概念、模型、方法和算法》(第2版)。
本书适合初学者的原因是因为该书介绍的面很广,描述语言也很通俗,能让读者读完后对数据挖掘有个大体的认识。如本书介绍早期数据准备等知识,虽然《数据挖掘概念与技术》也介绍了,但后者有点偏向专业短语的解释上,而本书更专注于让读者理解。
本书最值得看的一个亮点在于,每章的结束位置都有本章所引用的参考文献。或许有读者会说,其他书也有啊。但本书的不同之处在于其对每个参考文献都做了一定的介绍。这样读者就知道如果想进一步深入学习,应该看哪些文献。与其他书籍那样列出一些麻木的列出书籍或期刊名,这种方式对读者更为有好。毕竟,书和论文还是有点区别的。
但读者不要被这个书名所误解了。书名是《数据挖掘:概念、模型、方法和算法》,但本书主要关注与概念和模型。提到算法,读者的印象可能是一些代码或伪代码,但本书中几乎没有……这应该是一个不足之处,哪怕《数据挖掘导论》一书中也含有一定的伪代码。
同时,在内容上看。本书在介绍数据挖掘的同时,有些偏向与模式识别和机器学习。如本书分别以整整一章内容介绍了人工神经网络、集成学习、遗传算法等知识。
所以对初学者来说,在这本书的帮助下,读者可以对数据挖掘有广泛的认识,并能通过每章末尾的参考文献哪里了解进一步学习的方向。但最后提醒一句,本书是概念性的,不要被书名的算法二字误解了。。。因此,我认为学习数据挖掘的读者除了有一本《数据挖掘导论》之外,还应该有一本《数据挖掘:概念、模型、方法和算法》
有关键情节透露