跳到主要内容

大数据集群:Cloudera CDH安装手册中文版 pdf高清版

大小:1.69MB       时间:2024-12-07

Apache Hadoop 作为目前最主流、应用范围最广的分布式应用架构,根据 Google 公司发表的 MapReduce 和 Google 档案系统的论文自行实作而成,提供在 x86 服务器上构建大型应用集群的能力,它采用Apache 2.0 许可协议发布开源协议,官方版本也称为社区版 Hadoop。

社区版本的 Hadoop 具备很多的优点,例如:完全的开源免费, 活跃的社区,文档资料齐全。但由于 Hadoop 的生态圈过于复杂,包 括 Hive、Habase、Sqoop、Flume、Spark、Hue、Oozie 等,需要考虑 版本和组件的兼容性;同时集群部署、安装、配置较为复杂,需要手 工调整配置文件后,对每台服务器的分发配置分发操作,较为容易出 错;同时缺少配套的运行监控和运维工具,需要结合 ganglia、nagois 等实现运行监控,运维成本较高。
而 Cloudera 的 CDH 版本为目前最成型的发行版本,拥有最多的部
署案例。通过 CDH 提供更为稳定商用的 Hadoop 版本;提供强大的部 1 / 23
署、管理和监控工具,通过统一的可视化管理后台,实现集群的动态 监控,大大提高了集群部署的效率;同时 CDH Express 版本完全免费, 不涉及昂贵的商业授权费用