Cloudera + DataRobot

エンタープライズデータハブが支える自動機械学習

デモのお問い合わせ

エンタープライズグレードの拡張性と予測モデリングを統合してデータの価値を最大限に高める

Cloudera + DataRobot
Website
管理

管理

DataRobot では、アプリケーションの管理と監視に Cloudera カスタムサービスディスクリプタが使用されます。そのため、現在お使いのツールで DataRobot を管理および監視できます。また、Cloudera Manager を使用して Hadoop データノードにランタイムライブラリを配布できるので、ノードの追加時に新たなインストール作業や設定作業は不要です。

セキュリティと暗号化

セキュリティと暗号化

DataRobot では、Sentry を使ってきめ細かなロールベース認証が行われ、Kerberos プロトコルと LDAP プロトコルがサポートされます。セキュリティプロトコルは他のアプリケーションと同じものを使用できます。また、HDFS がネイティブに統合および利用され、Cloudera で実装している暗号化ポリシーが引き継がれます。そのため、データを保護するための機能を別途導入する必要はありません。

監査とリネージ

監査とリネージ

Cloudera Manager では、DataRobot のライフサイクルイベントとセキュリティ関連イベントが、Cloudera クラスタで実行されている他のプロセスと同様に追跡されます。また、DataRobot の分析ファイルとモデルファイルも追跡され、Cloudera Navigator でデータリネージを視覚的に表示できます。

YARN によるワークロード管理

YARN によるワークロード管理

DataRobot ワークロードは YARN コンテナ内で実行されるので、DataRobot と他のアプリケーションを共存させることができます。クラスタをパーティション分割しなくても、YARN によってリソースの競合を回避できます。

軽量

軽量

DataRobot は、Hadoop の要件に対応した標準的なハードウェアで動作します。Hadoop データノードに長期実行プロセスは必要ありません。他の一部の商用ツールとは異なり、Hadoop サーバーをリプレースまたはアップグレードする必要はありません。さらに専用のストレージレイヤーも不要であり、HDFS と直接連携します。DataRobot ユーザーは HDFS ファイルを直接操作でき、アプリケーションでは HDFS を使用して予測データセットや予測モデルが保存されます。

Spark によるスコアリング

Spark によるスコアリング

DataRobot では、Apache Spark によってモデルのスコアリングがインメモリで高速に行われます。Cloudera のスケールアウトアーキテクチャを適用できるため、必要なスコアリング量を必要なスループットで処理するようにプロビジョニングできます。

DataRobot パートナーになることをご検討中の方はお気軽にご連絡ください。

パートナーになる パートナーポータル