首页 > 代码库 > mahout推荐10-尝试GroupLens数据集
mahout推荐10-尝试GroupLens数据集
数据集下载地址:http://grouplens.org/datasets/movielens/ 之前用的是100K的,现在需要下载MovieLens 10M,使用里面的ratings.dat
前提:因为文件不符合mahout要求的文件输入格式,需要进行转换,但是example里提供了一个解析这个文件的类GrouplensDataModel,所以直接用了。
package mahout;import java.io.File;import org.apache.mahout.cf.taste.common.TasteException;import org.apache.mahout.cf.taste.impl.eval.LoadEvaluator;import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;import org.apache.mahout.cf.taste.model.DataModel;import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;import org.apache.mahout.cf.taste.recommender.Recommender;import org.apache.mahout.cf.taste.similarity.UserSimilarity;import org.apache.mahout.cf.taste.similarity.precompute.example.GroupLensDataModel;public class GroupLensDataModelTest { public static void main(String[] args) throws Exception { //使用定制的GrouplensDataModel,如果没有转换数据集成为csv格式的 DataModel dataModel = new GroupLensDataModel(new File( "data/ratings.data")); //皮尔逊相关系数,衡量用户相似度 UserSimilarity userSimilarity = new PearsonCorrelationSimilarity( dataModel); //构建用户邻居,100个 UserNeighborhood userNeighborhood = new NearestNUserNeighborhood(100, userSimilarity, dataModel); //推荐引擎 Recommender recommender = new GenericUserBasedRecommender(dataModel, userNeighborhood, userSimilarity); //运行 LoadEvaluator.runLoad(recommender); }}
运行试试,如果你的内存足够大的话。
输出结果:
我的文件还没有下载下来呢!!!!!!!!!!
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。