欢迎来到gulucn的博客


  • 首页

  • 分类

  • 归档

  • 标签

[转]《面向程序员的数据挖掘指南》——(八)聚类

发表于 2015年03月9日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 什么是聚类
  • 层次聚类
  • 单链聚类、全链聚类、平均链接聚类
  • 聚类狗品种
  • 聚类早餐麦片
  • k-means聚类
  • k-means++聚类
  • 聚类安然邮件
阅读全文 »

[转]《面向程序员的数据挖掘指南》——(七)朴素贝叶斯和文本数据

发表于 2015年03月9日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 自动判别文本中的感情色彩
  • 使用朴素贝叶斯进行分类
  • 去掉常用词和停词
  • 分类新闻组
  • 使用Python实现贝叶斯
  • 情感分析
阅读全文 »

[转]《面向程序员的数据挖掘指南》——(六)朴素贝叶斯和概率

发表于 2015年03月8日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 被动与主动学习
  • 概率术语
  • 条件概率:一个购物车的例子
  • 贝叶斯法则
  • 使用Python编写朴素贝叶斯分类器
  • 美国国会投票数据集
  • 高斯分布和概率密度函数
  • Python实现概率密度函数
阅读全文 »

[转]《面向程序员的数据挖掘指南》——(五)进一步探索分类

发表于 2015年03月8日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 效果评估算法和kNN
  • 留一法
  • 混淆矩阵
  • 代码示例
  • Kappa指标
  • 优化近邻算法
  • 新的数据集,新的挑战
阅读全文 »

[转]《面向程序员的数据挖掘指南》——(四)分类

发表于 2015年03月8日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 潘多拉推荐系统简介
  • 特征值选择的重要性
  • 示例:音乐特征值和邻域算法
  • 数据标准化
  • 修正的标准分数
  • Python代码:音乐,特征,以及简单的邻域算法实现
  • 一个和体育相关的示例
  • 特征值抽取方式一览
阅读全文 »
123…11

55 日志
19 分类
27 标签
RSS
Links
  • 结构之法&算法之道
  • 数盟-数据科学家联盟
  • 36大数据
© 2018
由 Hexo 强力驱动
主题 - NexT.Mist