数据挖掘分类的实践报告

数据挖掘分类的实践报告

问:有没有大神推荐一个简单的数据挖掘的实践项目作为课堂报告,越简单越好,要个分就行
  1. 答:做简单的数据挖掘我推荐weka软件。这个软件用的是java语言,里面有现成的分类和聚类算法,以及预处理工具,只要导入数据集就行。分析之后它给的结果也很完整。
    至于数据集,你可以用weka自带的数据集,也可以用这个网址的
    这是UCI的专门拿来做数据挖掘和机器学习的数据集库,非常好用。
问:python数据挖掘入门与实践1.5什么是分类的完整代码
  1. 答:分类应用的目标是,根据已知类别的数据集,经过训练得到一个分类模型,再用模型对类别未知的数据进行分类。
    例如,我们可以对收到的邮件进行分类,标注哪些是自己希望收到的,哪些是垃圾邮件,然后用这些数据训练分类模型,实现一个垃圾邮件过滤器,这样以后再收到邮件,就不用自己去确认它是不是垃圾邮件了,过滤器就能帮你搞定。
问:如何系统地学习数据挖掘
  1. 答:找一本教材,个人推荐李航的《统计机器学习》
    可以去看网易上关于机器学习的公开课,是Standford的Prof. Ng的视频课程,超级棒。
    结合教材和视频,将机器学习算法的公式推一遍,然后用Matlab或者python跑一跑数据,找点感觉。
    对于数学也要加强,特别在概率论方面。
    最后特别重要的是,一定要实践,可以DataCastle上找些比赛
数据挖掘分类的实践报告
下载Doc文档

猜你喜欢