Feature Discovery jp

特徴量探索

複雑なデータスキーマや複数の関連データソースから強力な特微量を自動的に検出できるため、精度が向上します。

特微量探索によって、特微量エンジニアリングの自動化がレベルアップしました。DataRobot なら、さまざまソースシステム内の複雑なデータスキーマやデータセットから、機械学習モデルにおいて重要な特微量を新たに何百も自動的に検出、テスト、作成できるため、モデルの精度を劇的に高め、目の前の問題について全体的な理解を深めることができます。

次世代の特微量エンジニアリングの自動化

最適な特微量をすばやく検出

特徴量エンジニアリングは、データサイエンスの最も重要なタスクの 1 つです。作成する特徴量によって、機械学習プロジェクトの成否が決まることがよくあります。しかし、特徴量エンジニアリングは、手作業だと時間も手間もかかります。新しい特微量が生成されるたびに、非常に複雑なデータ準備作業を繰り返す必要があるからです。また、特微量エンジニアリングでは、プロセスにエラーが発生しないように慎重な検証も必要です。

 

Feature Discovery 1

DataRobot の特微量探索は、エキスパートレベルのデータサイエンスのベストプラクティスを自動化することで、特微量エンジニアリングを高速化します。特徴量探索では、データソース間および複雑なデータスキーマ内の関係性を使用して、モデルに適した特微量がインテリジェントに生成されるので、モデルの全体的なパフォーマンスを大幅に向上できます。

視覚的かつ直感的

特微量探索によって、データサイエンティスト、データエンジニア、ビジネスアナリストは高度な特徴量エンジニアリングの技術を活用できます。DataRobot の視覚的な関係性エディターを使用すると、プロジェクトで使用するデータセットをすべて選択し、数回クリックするだけで、データセット間の関係性をすばやく宣言できます。また、DataRobot では、事前に関係性がわからない場合に結合が提案されることもあります。特微量探索を使用すれば、非常に複雑なデータスキーマを誰でも簡単に定義でき、それに対して自動化された特微量エンジニアリングを数分で実行できます。

時間を認識

DataRobot の特微量探索では、時間を完全に認識できます。使用するデータセットに時間的特性がある場合、派生ウィンドウを設定して、
新しい特微量を算出する際にどの程度過去のデータを使用するかを管理できます。たとえば、フライト番号別に飛行機の遅延を予測する場合、30 日間の履歴データのみを考慮するように DataRobot に指示することができます。特微量探索はガードレールも備えており、将来のデータを確実に除外するなど、
新しい特微量を生成するときに起こりがちなリーケージの問題を回避できます。

実用的、かつ説明や追跡が可能

DataRobot AI プラットフォームのすべての自動化機能と同様に、特微量探索も非常に高い透明性を備えています。生成されたすべての特微量を可視化し、探索することで、予測される可能性を把握できます。また、生成された各特徴量の系統全体がわかりやすく表示されるため、特徴量がどのように派生したかを把握できます。詳細ログにアクセスすれば、どの特微量が探索、破棄、生成されたかを正確に把握できます。また、トレーニングデータセット全体を、派生した新規特徴量と一緒にダウンロードして、さらに分析したり、他のアプリケーションで利用したりすることもできます。

特微量探索の活用事例
  • 高周波数の生理学的データにDataRobot の特徴量探索を使用したところ、その後の分析でインパクトのある新しい特徴を発見することができました。
    Austin Chou 博士
    Austin Chou 博士

    Lead Data Scientist, UCSF Brain and Spinal Injury Center Zuckerberg San Francisco General Hospital and Trauma Center

    人気のリソースを見る

    Snowflake との特徴量探索の連携