欢迎来到gulucn的博客


  • 首页

  • 分类

  • 归档

  • 标签

[转]《面向程序员的数据挖掘指南》——(三)隐式评价和基于物品的过滤算法

发表于 2015年03月8日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 显式评价
  • 隐式评价
  • 哪种评价方式更准确?
  • 基于用户的协同过滤
  • 基于物品的协同过滤
  • 修正的余弦相似度
  • Slope One算法
  • Slope One的Python实现
  • MovieLens数据
阅读全文 »

[转]《面向程序员的数据挖掘指南》——(二)推荐系统入门

发表于 2015年03月8日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 推荐系统工作原理
  • 社会化协同过滤工作原理
  • 如何找到相似物品
  • 曼哈顿距离
  • 欧几里得距离
  • 闵可夫斯基距离
  • 皮尔逊相关系数
  • 余弦相似度
  • 使用Python实现K最邻近算法
  • 图书漂流站(BookCrossing)数据集
阅读全文 »

[转]《面向程序员的数据挖掘指南》——(一)简介:数据挖掘是什么

发表于 2015年03月8日   |   分类于 面向程序员的数据挖掘指南   |  

内容:

  • 寻找事物
  • 本书结构
  • 阅读完本书后你可以做些什么?
  • 为什么数据挖掘很重要?哪些内容可以为我所用?
  • 标题里的“Numerati的古老艺术”是什么意思?
阅读全文 »

Ubuntu vsftpd 服务器的安装和简单配置

发表于 2015年03月7日   |   分类于 系统   |  

一、初衷

由于写博客可能需要图片,而在网上找了一下资料,虽然国内都有提供一些免费的云存储,如又拍,七牛,但是这又拍需要手机认证,而七牛更严格地需要身份验证,虽然写博客并不是为了什么,但是也不想提供一些真实的资料。而对于国外的云存储,如GoogleDrive,OneDrive,Dropbox,还有其他一些提供图床服务的网站,基本上都被墙。
另外,这些网站提供的外链方式获取比较麻烦,而本身图片也不多,因此就想在vps建立一个ftp服务器,把图片保存在上面,然后再建立一个虚拟主机,如img.gulucn.tk,这样也可以获取到图片。

阅读全文 »

[转]18大经典数据挖掘算法小结

发表于 2015年03月7日   |   分类于 数据挖掘 , 工具   |  

本文所有涉及到的数据挖掘代码的都放在了我的github上了。

地址链接: https://github.com/linyiqun/DataMiningAlgorithm

大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面。也算是对数据挖掘领域的小小入门了吧。下面就做个小小的总结,后面都是我自己相应算法的博文链接,希望能够帮助大家学习。

阅读全文 »
1234…11

55 日志
19 分类
27 标签
RSS
Links
  • 结构之法&算法之道
  • 数盟-数据科学家联盟
  • 36大数据
© 2018
由 Hexo 强力驱动
主题 - NexT.Mist