环境

Ubuntu 14.10 x64,Hadoop 2.5.2(Local),Mahout 0.9。Hadoop 2.2 以上需自己编译 Mahout 0.9 并修改相应 .pom 版本号。

数据准备

注意行数据列数一致;默认 HDFS 输入路径可能为 /user/hadoop/testdata。用 hadoop fs -put 上传数据。

数据转换与 Kmeans

数据转换对跑例子非必须。Kmeans 聚类后检查输出路径与结果。