跳到主要内容

Apache Kudu1.4.0 中文文档 完整版PDF

大小:1.71MB       时间:2024-12-07

Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 Hadoop 生态系统应用的常见技术特性: 它在 commodity hardware(商品硬件)上运行,horizontally scalable(水平可扩展),并支持 highly available(高可用)性操作。

Kudu 有许多不错的设计,它的一些优点包括 :

OLAP 工作的快速处理。

与 MapReduce,Spark 和其他 Hadoop 生态系统组件集成。

与 Apache Impala(incubating)紧密集成,使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案。

强大而灵活的一致性模型,允许您根据每个 per-request(请求选择)一致性要求,包括 strict-serializable(严格可序列化)一致性的选项。

针对同时运行顺序和随机工作负载的情况性能很好。

易于管理以及可以使用 Cloudera Manager 来进行管理。

High availability(高可用性)。Tablet Servers 和 Masters 使用了 Raft Consensus Algorithm,确保只要有一半以上的副本可用,该 tablet 便可用于读写。例如,如果 3 个副本中有 2 个或 5 个副本中的 3 个可用,则该 tablet 可用。即使在 leader tablet 出现故障的情况下,读取功能也可以通过 read-only(只读的)follower tablets 来进行服务。

结构化数据模型。