前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >HPDFS on Docker

HPDFS on Docker

作者头像
陆道峰
发布2020-06-17 22:01:39
5690
发布2020-06-17 22:01:39
举报

Hadoop伪分布式文件系统

HPDFS:Hadoop Pseudo Distributed File System,是我自己构建的Docker HDFS镜像,可以快速搭建一个Hadoop伪分布式文件系统,适合初学者和探索学习、或者测试,不能用于生产环境。

GitHub地址:Dockerq/docker(https://github.com/dockerq/docker-hdfs) by adolphlwq(https://github.com/adolphlwq)

Step

1. 安装必备软件,并配置好Java环境变量

  • openssh-server
  • openssh-client
  • rsync
  • openjdk-8-jre
  • curl
  • sudo

2. 下载解压hadoop 2.6.0

3. 修改SSH配置

  • 允许root登录:sed -i "28s/.*/PermitRootLogin yes/g" /etc/ssh/sshd_config(Dockerfile中)
  • 修改sshd的端口(容器net模式为host时,并且主机也运行sshd时会冲突)
  • 取消主机验证:sed -i "35s/.*/ StrictHostKeyChecking no/g" /etc/ssh/ssh_config(entrypoint.sh中)
  • ssh无密码登录到localhost

4. 下面就可以构建/运行镜像了

Usage

1. quick start

docker run -d --net host --name hdfs dockerq/docker-hdfs

浏览器浏览 localhost:50070查看HDFS的WebUI界面

2. 挂载数据卷

容器中hdfs的datanode和namenode默认文件夹是/hdfsdata

docker run -d --name --net host -v host_data_path:/hdfsdata dockerq/docker-hdfs

3. 修改sshd默认端口

docker run -d --net host -e SSH_PORT=2222 --name hdfs dockerq/docker-hdfs

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-11-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与系统 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器镜像服务
容器镜像服务(Tencent Container Registry,TCR)为您提供安全独享、高性能的容器镜像托管分发服务。您可同时在全球多个地域创建独享实例,以实现容器镜像的就近拉取,降低拉取时间,节约带宽成本。TCR 提供细颗粒度的权限管理及访问控制,保障您的数据安全。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档