你好,游客 登录 注册 搜索
背景:
阅读新闻

Mahout的安装配置与使用

[日期:2013-10-28] 来源:Linux社区  作者:Linux [字体: ]

Mahout 是Apache旗下的一个机器学习和数据挖掘的分布式框架,包括聚类,分类,协同过滤,关联规则挖掘等经典的算法。
 
    1. 安装Maven
 
    wget http://apache.etoak.com//maven/maven-3/3.0.4/binaries/apache-maven-3.0.4-bin.tar.gz 下载
最新版本的Maven. tar xvf apache-maven-3.0.2-bin.tar.gz 解压后配置路径,vi ~/.bashrc 在此文件添加如下两行
 
export M3_HOME=maven的实际安装路径
export PATH=${M3_HOME}/bin:${PATH}
 
 然后执行. ~/.bashrc使之生效,通过mvn -version 查看版本来看是否安装成功。
 
    2. 安装Mahout
 
    svn co http://svn.apache.org/repos/asf/mahout/trunk mahout 将mahout从代码库中下载下来,在mahout
 
目录执行mvn install 安装,如果想快一点就跳过单元测试检验的那些个环节,使用mvn clean install -DskipTests=true。
 
如果过程中没有报错的话说明安装成功。
 
    3.  运行Mahout中的示例程序
 
    在/mahout/examples/bin下有个聚类的测试脚本,我们可以运行来看一下,不过事先要配置好Hadoop的运行环境,
在《Hadoop Ubuntu下的安装》《Hadoop集群安装注意事项》有介绍如何配置Hadoop可以参考,我们运行下面这个脚本,cluster-syntheticcontrol.sh

xxx@xxx: ./cluster-syntheticcontrol.sh

Please select a number to choose the corresponding clustering algorithm

1. canopy clustering

2. kmeans clustering

3. fuzzykmeans clustering

4. dirichlet clustering

5. meanshift clustering

Enter your choice : 

更多详情见请继续阅读下一页的精彩内容http://www.linuxidc.com/Linux/2013-10/92026p2.htm

相关阅读

Mahout驾驭Hadoop之详解 http://www.linuxidc.com/Linux/2013-09/89921.htm

Ubuntu 10.04下Mahout 安装步骤详解 http://www.linuxidc.com/Linux/2011-10/44550.htm

linux
相关资讯       Mahout  Mahout安装 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款