DataRobot の特徴量探索機能と Snowflake を連携

2021/03/19
執筆者:
· 推定読書時間 1  分

(このブログポストは DataRobot Integrates Feature Discovery Capability with Snowflake の和訳です)

DataRobot とデータクラウド企業の ​​Snowflakeが 2018 年に新たなパートナーシップを発表した際、「企業内での AI の導入を加速させる」という目標を掲げました。両社は、それから 2 年以上にわたり緊密に協力し合い、お客様のニーズに応えるためのシームレスな連携について理解を深めてきました。

数か月にわたる有益なコラボレーションを経て、DataRobot と Snowflake はこの度、両社のパートナーシップの下で初となる製品連携を発表しました。​​​DataRobot の特徴量探索特徴量エンジニアリングの自動化により、機械学習モデルで使用する重要な特徴量の新規作成が可能)が、Snowflake で利用できるようになりました。これにより、Snowflake の顧客は AI と機械学習を活用してイノベーションを加速させ、ビジネスを促進する予測インサイトを手にすることができます。

DataRobot の特徴量探索: 次世代の特徴量エンジニアリングの自動化

特徴量エンジニアリング​は AI において最も重要なタスクの 1 つです。なぜなら、作成する特徴量によって、機械学習プロジェクトの成否が決まることがよくあるからです。

問題は、データに適切な特徴が存在することは稀であり、複数のデータソースを 1 つのデータセットに統合してモデルをトレーニングし、予測を行う必要があることです。これには通常、複数のテーブルを結合させ、異なる派生ウィンドウ(直近の 30 日間、先週など)で多くの集計データ(合計値、最大値、平均値、カウント、エントロピーなど)を探索することが含まれます。

​DataRobot の自動特徴量探索は、エキスパートレベルのデータサイエンスのベストプラクティスを自動化することで、特徴量エンジニアリングのプロセスを簡素化して高速化します。

L02 Suggested to use for print 2

一般的な特徴量エンジニアリングの自動化ソリューションと比較して、DataRobot の場合、1 つだけでなく複数のデータセットからデータを活用して、機械学習モデルで使用する数百の重要な特徴量を新たに見つけ、テストし、作成することで、それらモデルの精度を劇的に向上させることができます。

Snowflake でさらに高速化

複数のデータソースを探索するには、常に大量のデータをシステム間で転送する必要があり、これには多くのリソースと時間がかかりました。

DataRobot と Snowflake との新たな連携により、特徴量探索の処理を Snowflake に組み込むことで、データの移動を最小限に抑えることができます。その結果、素早く結果を導き出せるので、運用コストを削減できます。

特徴量探索は、データサイエンスのプロセスに自動化をもたらすという観点において、さまざまな意味で ​​DataRobot の AutoML​​(Automated Machine Learning)製品の拡張機能と言えます。この連携により、Snowflake のデータクラウドからより精度の高いモデルを開発できます。

特徴量探索機能について詳しくは、​特徴量探索の製品ページ​​をご覧ください。

イベント
DataRobot AI Experience Japan

DataRobot x Snowflake コラボセッション:
データをつなぐグローバルネットワークでAIサイクルを高速化

登録はこちら
執筆者について
Josh Klaben-Finegold (ジョシュ・クラーベン-ファインゴールド)
Josh Klaben-Finegold (ジョシュ・クラーベン-ファインゴールド)

プロダクトマネージャー

ビジネスオペレーションとデータ準備の経験を持ち、セールスエンジニアを経て現在はプロダクトマネージャーを務めている。DataRobot の AI カタログと戦略的テクノロジーアライアンスのための製品戦略、ビジョン、およびインパクトの高い機能の構築に注力している。

Josh Klaben-Finegold (ジョシュ・クラーベン-ファインゴールド) についてもっとくわしく