HDFS 02 - macOS 系统安装 HDFS（Apache Hadoop 3.2.1）

shoufeng 2021-02-18 原文

在 macOS 系统上搭建 HDFS 单机环境，用来开始大数据练习。

1 – 准备安装包
2 – 准备配置文件
3 – 配置 Hadoop 环境变量
- 3.1 修改本机的 profile 文件
- 3.2 添加 host 信息
4 – 启动 Hadoop 集群
5 – 查看集群页面
6 – 常见问题及解决方法

始发于2021-06-06，修改于2021-12-13。
为了快速测试和体验，在本机环境中安装 Hadoop。
后续如果要模拟真实的分布式环境，可以开3台 Linux 虚拟机，然后搭建分布式 Hadoop 集群，暂时搁置。

1 – 准备安装包

到官网下载安装包 http://hadoop.apache.org/releases.html，这里以 3.2.1 版本为例，下载 binary 二进制文件即可。

下载后，拷贝到本地安装目录，比如我拷贝到了 ~/bigdata/ 目录（这里的 ~ 是当前用户的 home 目录）。

# 解压安装包到指定目录
mkdir ~/bigdata
cp hadoop-3.2.1.tar.gz  ~/bigdata
tar -zxf hadoop-3.2.1.tar.gz

# 查看 Hadoop 对本地库的支持情况：
cd ~/bigdata/hadoop-3.2.1/ && ./bin/hadoop checknative

可以看到，从官网下载的安装包，不支持 snappy、bzip2 等压缩方式。如果有需要，我们可以自己重新编译安装包 ——

Hadoop – macOS 上编译 Hadoop 3.2.1

2 – 准备配置文件

说明：各个服务的配置文件中涉及到的端口号，都适用默认值。

2.1 修改 core-site.xml

cd ~/bigdata/hadoop-3.2.1/etc/hadoop
vim core-site.xml

官方详细文档：https://hadoop.apache.org/docs/r3.2.1/hadoop-project-dist/hadoop-common/core-default.xml

修改后的内容如下：

<configuration>
    <property>
        <!-- fs.default.name 已过期，推荐使用 fs.defaultFS -->
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop:9000</value>
    </property>
    <!-- 缓冲区大小，根据服务器性能动态调整 -->
    <property>
        <name>io.file.buffer.size</name>
        <value>4096</value>
    </property>
    <!-- 开启垃圾桶机制，删除掉的数据可以从垃圾桶中回收，单位分钟 -->
    <property>
        <name>fs.trash.interval</name>
        <value>10080</value>
    </property>
</configuration>

2.2 修改 hdfs-site.xml

cd ~/bigdata/hadoop-3.2.1/etc/hadoop
vim hdfs-site.xml

官方详细文档：https://hadoop.apache.org/docs/r3.2.1/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

修改后的内容如下：

本文链接：https://www.cnblogs.com/shoufeng/p/14411399.html

HDFS 02 - macOS 系统安装 HDFS（Apache Hadoop 3.2.1）的更多相关文章

机器学习 – LSTM应用之sequence generation

概述 LSTM在机器学习上面的应用是非常广泛的，从股票分析，机器翻译到语义分析等等各个方面都有它的用武之地 […]...

怎么才能学会查看电脑配置？ – chiuschen

怎么才能学会查看电脑配置？ 2013-06-26 10:30 chiuschen 阅读(215) 评论( […]...

linux时区时间问题 – 但使龍城飛將在

linux时区时间问题同步网络时间（需要连接互联网）参考：https://blog.csdn.net/ […]...

Spring扩展：替换IOC容器中的Bean组件 — @Replace注解

1、背景：工作中是否有这样的场景？一个软件系统会同时有多个不同版本部署，比如我现在做的IM系统，同时 […]...

Microsoft Windows 2000 应用程序兼容性 2 – csdnexpert

组件检查我们发现导致无法在 Windows 2000 上安装应用程序的另一个原因是组件检查功能。显然，我们操 […]...

搭建Hadoop集群(超详细版）

用三台云服务器搭建hadoop完全分布式集群硬件准备集群配置集群规划Hadoop、Zookeeper、Java、CentOS版本基础环境配置关闭防火墙修改主机名主机映射时间同步查看主机时间选择时区时间同步协议NTP定时任务crontab配置...

Python – 开发短视频资讯平台作业

目录需求分页示例代码示例代码 video.csv 返回Python目录需求需求参考有video.c […]...

IT职业规划与行业分析[原] – Kerry Chen

IT职业规划与行业分析[原] 俗话说，“行行出状元”，说的是无论什么行业，干一行爱一行，总能做出成绩。又有一说 […]...

随机推荐

原生js显示和隐藏

一、display默认属性值的选择显示的元素设置的值分情况（如果选择属性值错误，会影响已经写好的样式）块 […]...

数据结构与算法之两种查找方法

本节的内容：什么是列表查找；顺序查找(线性查找)；二分查找；顺序查找与二分查找比较；运行时间；增速 […]...

Bind和Eval的区别详解

1.简单描述Eval和Bind的区别绑定表达式 <%# Eval(“字段名”) […]...

前端每周学习分享–第3期

1.项目工具相关 1.1.浏览器小技巧原文网页长截图按 F12 弹出控制台，按 ctrl+shift+p […]...

Apache Mahout之协同过滤原理与实践

Apache Mahout之协同过滤原理与实践读书时期，选课是令人怀念的，因为自由，学生可以挑 […]...

Mac 10.12安装7zip/rar解压/压缩工具7zip-Keka

说明：Keka支持解压和压缩，基本这个软件全部格式都搞定。下载：（链接: https://pan.baid […]...

OLED显示模块（原理讲解、STM32实例操作） – 一郎哥哥

OLED显示模块（原理讲解、STM32实例操作）一、OLED的基础介绍OLED的定义和优势OLED，即有机发 […]...

Proxifier使用教程

前言成功搭建使用shadowshocks实现代理访问google，然而只能浏览器代理方式使用，不能其他程序使 […]...