《IBM SPSS Modeler数据与文本挖掘实战》试读

第 1 章 数据挖掘概述

1.1 什么是数据挖掘 数据挖掘是一种通过数理模式来分析大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。数据挖掘可以描述为:是按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进、有效的方法。数据挖掘(Data Mining),又译为资料探勘、数据采矿,它是数据库知识发现中的一个步骤。数据挖...

  1. 数据挖掘对于大多数人来说都是一个陌生的事物,让读者在较短的时间内快速熟悉它就是本书第1章的主要任务,我们将会从最基础的知识开始讲起,由浅入深,逐步介绍数据挖掘的知识,最后结合实例进行详细阐述。 本章首先介绍数据挖掘的一些基本知识,包括数据挖掘定义、发展历史、技术特征,以及与传统技术的关系比较,同时还介绍了三种主要的数据挖掘软件。随后重点介绍了使用SPSS Modeler软件对电信行业的目标客户进行深入研究的基本步骤,主要是为了让读者了解什么是数据挖掘以及如何进行数据挖掘等问题。

第 4 章 回归分析

4.1 回归分析模型概述 所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归方程。在回归分析中,当研究的因果关系只涉及因变量和一个自变量时,称为一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,称为多元回归分析。此外,在回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为..

  1. 回归分析法是最基本的数据分析方法,回归预测就是利用回归分析方法,根据一个或一组自变量的变动情况预测与其相关的某随机变量的未来值。 本章将首先介绍回归分析模型的基本知识,包括模型定义、模型应用、建模步骤和一些重要的模型注意事项,随后将详细介绍利用SPSS Modeler软件,使用回归分析的方法对电信行业客户流失的影响因素进行研究,并得出相应的研究结论。

第 11 章 人工神经网络

11.1 人工神经网络模型概述 人工神经网络(Artificial Neural Network,缩写ANN),简称神经网络(Neural Network,缩写NN),是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元连接进行计算。在大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性的统计模型,常用来对输入和输出间复杂的关系...

  1. 人工神经网络分析法是一种较新的分析方法,人工神经网络通常是通过一个基于数学统计学类型的学习方法(Learning Method)得以优化,所以人工神经网络也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,在人工智能学的人工感知领域,我们通过数学统计学的应用可以来做人工感知方面的决定问题(也就是说通过统计学的方法,人工神经网络能够类似人一样具有简单的决定能力和简单的判断能力),这种方法比起正式的逻辑学推理演算更具优势。 本章将首先介绍人工神经网络分析

第 15 章 文本挖掘算法

15.1 特征选择文本分类算法 15.1.1 文本特征表示 特征表示是指以一定特征项(例如词条或描述)来代表文档,在文本挖掘过程中,只需要对这些特征项进行处理,就可以实现对非结构化文本的处理。特征表示方法有很多种,常用的有布尔逻辑法、概率法、向量空间等方法。现有的绝大部分文本分类器都是使用向量空间模型中的“词袋法”来表示文本。这种方法有一个关键的假设,就是文章中出现的...

  1. 随着文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。现代文本分类和聚类领域面临巨大的挑战,而且随着学者研究的不断深入,其中的一些深层次问题也逐渐暴露出来,一些问题也已经成为本学科进一步发展的阻碍。但是,从另一个角度来说,它们也揭示了文本分类和聚类领域下一步应该重点研究的内容和方向。 文本自动分类是指将一个文本自动指定到一个或几个前期预定义的文本类别中。文本分类在文本检索、信息过滤、数据组织、信息管理以及互联网搜索等方面都有十分广泛的应用,有效地提高了信息服务的质量。文本自动分类及其相关技

>IBM SPSS Modeler数据与文本挖掘实战

IBM SPSS Modeler数据与文本挖掘实战
作者: 王国平,郭伟宸,汪若君, 王国平
isbn: 7302372128
书名: IBM SPSS Modeler数据与文本挖掘实战
页数: 308
定价: 55.00元
出版社: 清华大学出版社
出版年: 2014-11-1
装帧: 平装