服务器

Apache Kudu1.4.0 中文文档完整版PDF

大小：1.71MB 时间：2024-12-07

Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 Hadoop 生态系统应用的常见技术特性: 它在 commodity hardware（商品硬件）上运行，horizontally scalable（水平可扩展），并支持 highly available（高可用）性操作。

Kudu 有许多不错的设计，它的一些优点包括 :

OLAP 工作的快速处理。

与 MapReduce，Spark 和其他 Hadoop 生态系统组件集成。

与 Apache Impala（incubating）紧密集成，使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案。

强大而灵活的一致性模型，允许您根据每个 per-request（请求选择）一致性要求，包括 strict-serializable（严格可序列化）一致性的选项。

针对同时运行顺序和随机工作负载的情况性能很好。

易于管理以及可以使用 Cloudera Manager 来进行管理。

High availability（高可用性）。Tablet Servers 和 Masters 使用了 Raft Consensus Algorithm，确保只要有一半以上的副本可用，该 tablet 便可用于读写。例如，如果 3 个副本中有 2 个或 5 个副本中的 3 个可用，则该 tablet 可用。即使在 leader tablet 出现故障的情况下，读取功能也可以通过 read-only（只读的）follower tablets 来进行服务。

结构化数据模型。