[转]《面向程序员的数据挖掘指南》——(八)聚类 发表于 2015年03月9日 | 分类于 面向程序员的数据挖掘指南 | 内容: 什么是聚类 层次聚类 单链聚类、全链聚类、平均链接聚类 聚类狗品种 聚类早餐麦片 k-means聚类 k-means++聚类 聚类安然邮件 阅读全文 »
[转]《面向程序员的数据挖掘指南》——(七)朴素贝叶斯和文本数据 发表于 2015年03月9日 | 分类于 面向程序员的数据挖掘指南 | 内容: 自动判别文本中的感情色彩 使用朴素贝叶斯进行分类 去掉常用词和停词 分类新闻组 使用Python实现贝叶斯 情感分析 阅读全文 »
[转]《面向程序员的数据挖掘指南》——(六)朴素贝叶斯和概率 发表于 2015年03月8日 | 分类于 面向程序员的数据挖掘指南 | 内容: 被动与主动学习 概率术语 条件概率:一个购物车的例子 贝叶斯法则 使用Python编写朴素贝叶斯分类器 美国国会投票数据集 高斯分布和概率密度函数 Python实现概率密度函数 阅读全文 »
[转]《面向程序员的数据挖掘指南》——(五)进一步探索分类 发表于 2015年03月8日 | 分类于 面向程序员的数据挖掘指南 | 内容: 效果评估算法和kNN 留一法 混淆矩阵 代码示例 Kappa指标 优化近邻算法 新的数据集,新的挑战 阅读全文 »
[转]《面向程序员的数据挖掘指南》——(四)分类 发表于 2015年03月8日 | 分类于 面向程序员的数据挖掘指南 | 内容: 潘多拉推荐系统简介 特征值选择的重要性 示例:音乐特征值和邻域算法 数据标准化 修正的标准分数 Python代码:音乐,特征,以及简单的邻域算法实现 一个和体育相关的示例 特征值抽取方式一览 阅读全文 »