`
yugouai
  • 浏览: 492371 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

Mahout入门

 
阅读更多

1.简介:

    Mahout为推荐引擎提供了一些可扩展的机器学习领域的经典算法实现,可以使开发人员更为快捷的创建智能应用程序。

 

2.安装:

    (1)下载(0.8版本,包含源码):

sudo svn co http://svn.apache.org/repos/asf/mahout/trunk mahout

   (2) Maven build(若存在权限问题,则使用chmod进行权限修改):

 cd $MAHOUT_HOME
 sudo mvn install -DskipTests

    (3)安装Hadoop:问度娘

    (4)检查Mahout是否安装成功:

cd $MAHOUT_HOME/bin
./mahout

     一般没有报错就是安装成功了(忘了截图了...),so easy,另若在/etc/profile中设置环境的变量的,则使用source /etc/profile,若没有则手工export HADOOP_HOME与JAVA_HOME。

 

3.测试Mahout:

    (1)下载测试数据:

    包含600行60列的一个测试数据

wget http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data

    (2)将数据上传到Hadoop:

hadoop fs -mkdir testdata
hadoop fs -put synthetic_control.data testdata

    必须使用该路径,文件会上传到HDFS路径:/user/hadoop/testdata/synthetic_cotrol.data,测试代码已经写死了,所以必须按照此路径作测试数据。

    (3)测试各种算法

cd  $MAHOUT_HOME/examples/target
# canopy
hadoop jar mahout-examples-0.8-job.jar org.apache.mahout.clustering.syntheticcontrol.canopy.Job
# kmeans
hadoop jar mahout-examples-0.8-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

    观察输出,其中canopy算法与kmeans算法以后补充。

 

上述为mahout的安装与案例测试。

 

分享到:
评论

相关推荐

    mahout 入门例子

    mahout入门 下载即可运行 适合新手入门

    mahout 简介,中文

    mahout 入门中文材料,是IBM文章汇总,值得一看

    9.Hadoop入门进阶课程_第9周_Mahout介绍、安装与应用案例.pdf

    9.Hadoop入门进阶课程_第9周_Mahout介绍、安装与应用案例.pdf

    Mahout in action 中文版

    Mahout in action 中文版,简介,快速入门

    Hadoop安装学习-入门教程

    Hadoop 安装 学习 入门教程 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, ...

    elasticsearch-taste:基于Mahout Taste的Elasticsearch建议

    Elasticsearch Taste插件概述Elasticsearch Taste插件是基于的协作过滤实现。 该插件提供了Elastic...)安装安装Taste插件$ $ES_HOME/bin/plugin install org.codelibs/elasticsearch-taste/2.3.0入门插入资料在本

    大数据开发的技巧总结以及入门教程知识点总结.docx

    分布式系统理解:掌握分布式计算原理,理解MapReduce、Spark、Flink等计算框架的工作机制。...数据分析:具备基本的数据挖掘和统计学知识,会使用Mahout、MLlib等机器学习库。 容器化部署:利用Docker、Kuber

    Behavior-Analytic-Starter-Kit:行为分析入门套件

    行为分析入门套件 Behavioral Analytics Starter Kit 是一个面向开发人员的云实验室,他们可以在其中学习如何使用 Hadoop 和 Mahout 创建强大的行为分析应用程序,并使用 Qubell Adaptive PaaS 将它们部署在 Amazon ...

    nosql 入门教程

    11.3 MapReduce和Apache Mahout 196 11.4 小结 197 第12章 使用Hive分析大数据 199 12.1 Hive基础 199 12.2 回到电影评分 203 12.3 亲切的SQL 209 12.4 HiveQL连接 211 12.4.1 计划解释 213 12.4.2 分区表 ...

    Hadoop应用开发技术详解(中文版)

    第3章是MapReduce的使用入门,让读者了解整个开发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了MapReduce的工作原理;第7章讲解了如何利用Eclipse来编译Hadoop的源代码,以及如何对...

    Hadoop应用开发技术详解

    第3章是MapReduce的使用入门,让读者了解整个开发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了MapReduce的工作原理;第7章讲解了如何利用Eclipse来编译Hadoop的源代码,以及如何对...

    HADOOP实战,很实用

    从入门到实战,从多角度做了全面的修订和补充。不仅详细讲解了新一代的Hadoop技术,而且全面介绍了Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等重要技术,是系统学习Hadoop技术的首选之作

    毕设&课设&项目&实训-基于Structs+mysql 实现的网上书店前后台系统.zip

    基于Structs+Hibernate+Spring+mahout+bootstrap+junit+tomacat+mysql 实现的网上书店前后台系统, 毕业设计。所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一...

    开源力量——数据挖掘原理与实战

    整套大数据课程从hadoop入门开始,由浅入深,内置“hadoop源码解析与企业应用开发实战”,“Hive开发实战”,“Hbase开发实战”,“Spark,mahout,sqoop,storm诸模块开发实战”,“数据挖掘基础。这个系列课程有几...

    java中型项目源码-Machine-Learning-in-Java:Java_code中的机器学习

    应用机器学习快速入门 用于机器学习的 Java 工具和库 基本算法:分类、回归和聚类 客户关系预测 亲和力分析 带有 Apache Mahout 的推荐引擎 欺诈和异常检测 使用 DeepLearning4java 进行图像识别 使用手机传感器进行...

Global site tag (gtag.js) - Google Analytics