通过 HDFS 的 API 访问文件系

xiaoxiao2021-02-28 58

准备工作： 1.导入所需要的jar包（最好把hadoop的jar包全部导入） 2.把集群的hdfs-site.xml和core-site.xml文件复制到src目录下代码：

package com.peng.hdfs; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IOUtils; //别忘了导入所需要的jar包，最好hadoop的包全部导入 //通过 HDFS 的 API 访问文件系 public class HDFSCatWithAPI { public static void main(String[] args) { //制定Configuration Configuration conf=new Configuration(); //定义一个DataInputStram FSDataInputStream in=null; try { //得到文件系统的实例 FileSystem fs=FileSystem.get(conf); //通过FileSystem的open方法打开一个指定的文件(注意这个前缀与core-site.xm中fs.defaultFS的value值相同 //加了端口号会出现错误 in=fs.open(new Path("hdfs://mycluster/output/weibo1/part-r-00003")); //将InputStream中的内容通过IOUtils的copyBytes方法复制到System.out中 IOUtils.copyBytes(in, System.out, 4096,false); //seek到position 1 in.seek(1); //执行一边复制一边输出工作 IOUtils.copyBytes(in, System.out, 4096,false); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); }finally{ IOUtils.closeStream(in); } } }

结果：

转载请注明原文地址: https://www.6miu.com/read-76690.html

技术

最新回复(0)