中国海洋大学数据挖掘秋季课程
仅供参考, 请勿抄袭
理论上会在DDL之后一天更新
(咕咕)
实现了Apriori算法和Eclat算法
两种算法的实现细节在效率和空间上都没有达到最优
请尽情优化
DBLP合作关系挖掘
数据源: AMiner, 下载数据集: DBLP-Citation-network V14
分析结果保存在 measures.csv
PrefixSpan算法的实现
数据集下载: SPMF
数据集很大的时候, PrefixSpan的第一遍扫描开销很大
实现了两个很经典的聚类算法
但其实本次实验给的十个数据集大部分都是用来测试密度聚类算法的
有兴趣的话建议用 DBSCAN 跑一下
CART决策树算法和可视化, 没有进行剪枝
在iris, page-blocks, statlog数据集上进行了测试