Select Language

AI社区

数据要素产业

数据挖掘:实用机器学习技术

目录:Contents序    Foreword前言  Preface第一部分:机器学习工具与技术第1章 绪论 What's it all about?1.1 数据挖掘和机器学习说明结构模式机器学习数据挖掘1.2 简单例子:天气问题和其它天气问题隐形眼镜:一个理想化的问题 Contact lenses: An idealized problem鸢尾花:一个一流的数值型数据集 Irises: A classic numeric datasetCPU性能:介绍数值的预测 CPU performance: Introducing numeric prediction劳资协商: 一个更实际的例子 Labor negotiations: A more realistic example大豆分类法:一个经典的机器学习的成功案例 Soybean classification: A classic machinelearning success1.3 应用领域包括评判的决策 Decisions involving judgment筛选图像 Screening images  图像筛选负载预测 Load forecasting诊断 调查分析 Diagnosis市场和销售 Marketing and sales其它应用 Other applications1.4 机器学习和统计学 statistics1.5 用于搜索的概括总结 Generalization as search各种概念 Enumerating the concept space 枚举概念空间倾向性 Bias  偏差1.6 数据挖掘和伦理观   数据挖掘和道德1.7 补充读物第2章 输入:概念、实例和属性2.1 概念2.2 样本2.3 属性2.4 输入准备数据整理 Gathering the data together  数据收集ARFF文件格式 ARFF format稀疏型的数据 Sparse data属性类型 Attribute types遗漏的值 Missing values   残缺值不准确的值 Inaccurate values了解你的数据 Getting to know your data2.5 补充读物第3章 输出:知识表达 Knowledge representation3.1 决策表 Decision tables3.2 决策树 Decision trees3.3 分类规则 Classification rules3.4 关联规则 Association rules3.5 包含例外的规则 Rules with exceptions3.6 包含联系的规则 Rules involving relations3.7 数据预测树 Trees for numeric prediction3.8 基于实例的表达 Instance-based representation3.9 Clusters 聚类3.10 补充读物 Further reading第4章 算法:基本方法 Algorithms:The basic methods4.1推断基本规则:Inferring rudimentary rules遗漏的数值和数据属性 Missing values and numeric attributes 残缺值和数值属性论述 Discussion  讨论4.2 统计模型 Statistical modeling 统计建模遗漏的数值和数据属性  残缺值和数值属性用于文档分类的贝叶斯定理模型 Bayesian models for document classification讨论 Discussion4.3 分治法:创建决策树 Divide-and-conquer:Constructing decision trees计算信息量 Calculation information高度分支属性 Highly branching attributes讨论4.4 覆盖算法:建立规则 Covering algorithms:Constructing rules对比规则和树 Rules versus trees一个简单的覆盖算法 A simple covering algorithm规则和决策对比表 Rules versus decision lists 规则与决策列4.5 挖掘关联规则 Mining association rules条目集或项目集 Item sets  项集关联规则 Association rules建立有效的规则 Generating rules efficiently 有效地建立规则讨论4.6 线性模型 Linear models数据预测:线性回归 Numeric prediction:Linear regression线性预测:逻辑回归 Logistic regression应用感知器的线性分类 Linear classification using the perceptron应用辨别筛选的线性分类 Linear classification using Winnow4.7 基于实例的学习距离函数 The distance function高效的发现近邻 Finding nearest neighbors efficiently 有效地寻找最近邻讨论4.8 聚类 Clustering基于距离的迭代聚类 Iterative distance-based clustering更快的距离计算 Faster distance calculations 快速的距离计算讨论4.9 补充读物第5章 可信度:评估机器学习成果 Credibility:evaluating what's been learned5.1 训练和测试5.2 预测性能 Prdicting performance5.3 交叉验证 Cross-validation5.4 其它估计法 estimates留一交叉校验法 Leave-one-out仿真程序 The bootstrap 自引导法5.5 比较数据挖掘方法5.6 预测概率二次方程损耗函数 Quadreatic loss function信息损耗函数 Informational loss function讨论5.7 计算成本敏感成本分类 Cost-sensitive classification 成本敏感分类敏感成本学习 Cost-sensitive learning升降图表 Lift charts  上升图无线曲线 Roc curves ROC曲线回叫精确曲线 Recall-precision curves 反馈率-精确率曲线讨论成本曲线 Cost curves5.8 评估数字预测 evaluating numeric prediction5.9 最短表达(描述)长度原理 The minimum description length principle5.10 聚类方法中应用MDL原理 Applying the MDL principle to clustering5.11 补充读物第6章 实现:真正的机器学习方案 Real machine learning schemes6.1 决策树 Decision trees数值属性 Numeric attributes筛选值 Missing values修剪整理 Pruning估算错误比率 Estimating error rates复杂决策树介绍 Complexity of decision tree induction从树到规则 From trees to rules精选和任意选择 C4.5 Choices and options论述6.2 分类规则 Classification rules选择标准测试 Criteria for choosing tests筛选值和数值属性 Missing values numeric attributes创建良好的规则 Generating good rules应用全局优化 Using global optimization从局部决策树获取规则 Obtaining rules from partial decision trees包含例外的规则 Rules with exception6.3 扩展线性模型 Extending linear models最大边缘超平面 The maximum margin hyperplane非线性类别边界 Nonlinear class bou

 
更多>数据要素产业相关信息
最新发布
点击排行