Apache Kafka

Apache Kafkaは、大規模なデータを高速に取り込むためのオープンソースツールであり、リアルタイムのストリーミングワークロードをはじめ、さまざまなツールやユースケースにデータを柔軟に開放することができます。Kafkaは、ClouderaオープンソースプラットフォームのCDHと完全に連携しており、Cloudera Enterpriseでは商用サポートも受けることができます。

多くのオープンソースコントリビューターやHadoopエコシステムとの互換性の向上により、Kafkaは、Clouderaプラットフォームを介して本番環境に適用できるオープンスタンダードとして頭角を現しています。

容易で柔軟なデータの取り込みをHadoopスケールで実現 

Kafkaの特長:

高いスループットと低遅延性

Kafkaは、低スペックのハードウェアでも、数ミリ秒の遅延で秒間数十万のメッセージを処理します
 


スケーラビリティ:

ダウンタイムなしにKafkaクラスターを柔軟、透過的に拡張することができます

 


耐久性と信頼性:

データロスを避けるため、メッセージはディスク上に保存され、クラスター内でレプリケーションされます
 


フォールトトレランス:

Kafkaクラスターは、高い障害耐性をもっています

 


高い並列性:

多岐にわたる数千ものクライアントに同時対応し、同様にKafkaに対してWriteとRead処理を行なうことができます
 


Clouderaプラットフォームの一部としてKafkaを使用し、さまざまなユースケースに対応するワークロードを、1つのシステム内だけで構築することができます。一般的なユースケースとしては、ログの集約、大規模なメッセージング、カスタマーアクティビティのトラッキング、運用警告やレポーティング、Apache Spark StreamingやApache HBaseと組み合わせたストリーミング処理などがあります。

Apache Kafkaのサポート

Clouderaは、Hadoopやプラットフォームに対する豊富な専門知識によって、Kafkaだけでなくワークフロー内のすべてのコンポーネントをサポートします。またCloudera Enterpriseでは、Kafkaの導入やその後の総合的なセキュリティやガバナンス、ゼロダウンタイムのアドミニストレーションといったサポートに加え、業務にすぐに応用の利く広範なパートナーエコシステムを活用することができます。

Cloudera Enterpriseについて詳しく知る >