integrations-apache-spark

Apache Spark
統合

Riak の Apache Spark Connector は、Spark と Riak 間で自動的にデータを同期します。これにより、Riak の障害回復力や拡張性と、Apache Spark のインメモリ分析が両立します。

Riak のように書き込み、Spark のように分析する。

区切り線上

昨今の Big Data アプリケーションでは、データをリアルタイムに処理して、パターンや動向、関連付けを明らかにすることが求められます。Riak の Apache Spark Connector により、Riak から Spark へデータを移動し、インメモリ分析を行うことができます。さらに、将来のデータ処理のために、分析結果を Riak に保存することも可能です。

Apache Spark や Riak を選ぶべき理由は?

Apache Spark は、Big Data 用の分析フレームワークです。Riak は、大規模なスケーラビリティ、高可用性、容易な運用を実現できるように設計された分散 NoSQL データベースに Big Data を保存することを目的とした製品です。Riak と Apache Spark を統合し、Spark のリアルタイム分析に Riak の可用性とスケーラビリティを組み合わせています。これにより、構造化されていないデータのリアルタイム分析が可能になりました。Spark が登場するまで、分散システムに必要な、リアルタイム分析の負荷に対処できる単一処理フレームワークはありませんでした。

区切り線下

SPARK 機能

データを迅速に移行

Riak のデータを Spark に追加。
データを Spark クラスタにインテリジェントにロードすることで、ネットワークトラフィックや処理のオーバーヘッドを最小限に抑えます。

Riak に保存

データの永続性を容易に実現。
中間結果と最終結果を Riak KV に保存することで、Spark または他の Big Data アプリケーションコンポーネントによる追加処理が可能です。

大規模なパフォーマンス向上

高速化ニーズに対応。
Apache Spark Add-On は、優れたパフォーマンス、リアルタイムの分析、 Riak KV でのビッグデータの保存を念頭に設計されています。

シンプルなアプリケーション

自動処理に任せる。
リアルタイム分析、キャッシング、検索テクノロジーを統合することで、Big Data アプリケーションの設計および運用を簡素化します。