手机版
你好,游客 登录 注册
背景:
阅读新闻

关于Hadoop的API写文件的备份数问题

[日期:2013-01-25] 来源:Linux社区  作者:qiuchenl [字体: ]

今天用Hadoop API打算往hadoop集群创建几个文件,然后写入数据试试,结果问题发生了,我的配置文件备份数是1,但是不管我怎么创建,创建的文件备份数都是3。代码如下:

 public static void testHDFS() throws IOException{
  String str="hdfs://cloudgis4:9000/usr/tmp/";
  Path path=new Path(str);
  Configuration conf=new Configuration();
  FileSystem hdfs=path.getFileSystem(conf);
  long begin=System.currentTimeMillis();
  for(int i=0;i<10000;i++){
   byte [] kkk=new byte[10000+1*i];
   FSDataOutputStream fsDataOut=hdfs.create(new Path(str+i));
   fsDataOut.write(kkk);
   fsDataOut.close();
   //hdfs.close();
  }
  long end=System.currentTimeMillis();
  System.out.println("hdfs:"+(end-begin));
 }

很奇怪,上网搜了一下发现了这个API:setReplication。用了这个之后,创建的文件备份数还是3,搜了下这个API的使用,发现这个API只能更改已经存在的文件的备份数。如果先创建再修改备份,无疑增加了框架的负担。后来想了想,明明配置文件修改成了1,那么就应该是这个应用程序没有读取配置文件。所以手动读取下配置文件就可以了。

conf.addResource(new Path("/usr/local/hadoop/conf/hdfs-site.xml"));

ps:hbase 权威指南上有这样一句话:

If you are configuring an IDE to run an HBase client, you could include the conf/

directory on your classpath. That would make the configuration files discoverable by

the client code.

更多Hadoop相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

linux
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款