内容:
- 显式评价
- 隐式评价
- 哪种评价方式更准确?
- 基于用户的协同过滤
- 基于物品的协同过滤
- 修正的余弦相似度
- Slope One算法
- Slope One的Python实现
- MovieLens数据
内容:
内容:
由于写博客可能需要图片,而在网上找了一下资料,虽然国内都有提供一些免费的云存储,如又拍,七牛,但是这又拍需要手机认证,而七牛更严格地需要身份验证,虽然写博客并不是为了什么,但是也不想提供一些真实的资料。而对于国外的云存储,如GoogleDrive,OneDrive,Dropbox,还有其他一些提供图床服务的网站,基本上都被墙。
另外,这些网站提供的外链方式获取比较麻烦,而本身图片也不多,因此就想在vps建立一个ftp服务器,把图片保存在上面,然后再建立一个虚拟主机,如img.gulucn.tk,这样也可以获取到图片。
本文所有涉及到的数据挖掘代码的都放在了我的github上了。
地址链接: https://github.com/linyiqun/DataMiningAlgorithm
大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面。也算是对数据挖掘领域的小小入门了吧。下面就做个小小的总结,后面都是我自己相应算法的博文链接,希望能够帮助大家学习。