DataRobot AI Cloud – 2022 年 5 月リリース

いろいろな組織に導入された AI 環境が成熟していくにつれ、規模やスピードに加えて、AI モデルの公平性や精度の保証という面でも、求められるレベルが高まっています。クラウドベース AI プラットフォームのマンスリーリリースシリーズの第一弾、DataRobot AI Cloud 2022 年 5 月リリースでは、ユーザーがスクリプティングやデータのアップロードに費やす時間を減らし、モデルの改善やインパクトのある成果の実現に注力する時間を増やすのに役立つ新機能に重点が置かれています。

DataRobot AI Cloud 2022 年 5 月リリースでは、変化の激しい世界でデータサイエンティストやビジネスリーダーが AI で成功を収める助けとなる、40 近くの新機能が提供されています。

バイアスの軽減

AI のバイアスは常に話題に上るトピックの 1 つです。DataRobot AI Cloud では、公平で精度の高い AI モデルを作成して維持する助けとして、DataRobot の堅牢な既存機能を基盤に、新たなレベルのバイアス軽減機能を開発・導入しました。モデルをデプロイする前でも、AI モデルのバイアスを軽減する 2 つの柔軟なワークフローのいずれかを選べます。作成した個別のモデルで特徴量を選択してバイアスを軽減するか、バイアス軽減機能を自動的に実行して上位 3 つのモデルで公平性を高めます。DataRobot は今回のリリースで、初期設定のままバイアスの検知、監視、軽減を行えるコーディング不要のソリューションを導入して、バイアス軽減処理を簡素化しました。ユーザーは、バイアスの軽減がどのように実行されたかを把握したり、バイアス軽減対象の特徴量を選択したりもできます。

バイアス軽減の詳細についてはこちら

コーディング不要の AI アプリケーション: 時系列 What-if シナリオ

コーディング不要の AI アプリケーションによって、AI のパワーを現場のビジネスユーザーも実感できます。今回、柔軟性とカスタマイズ機能が強化され、コーディング不要の AI アプリケーション内で AI に対応した時系列および What-if シナリオ機能を利用できるようになりました。精度と効率の向上でビジネス上の意思決定が促進されることに加え、強化された柔軟性とカスタマイズ機能に基づいて、ユーザーがシナリオを作成して保存し、選択した複数のシナリオを 1 つのチャート上に表示できる新機能が実現しました。人員配置レベル、営業時間、燃料価格などの変わりやすい特徴量変数がビジネス成果にどのように影響するかを、シナリオのシミュレーションと探索で簡単に把握できます。

AI アプリケーションビルダーの詳細についてはこちら

Composable ML での新しいテキスト前処理タスク

最新の DataRobot AI Cloud では、テキストベースのブループリントのタスクとして、自然言語処理(NLP)のハイパーパラメーター(見出し語認定、POS タグ付け、語幹抽出)に直接アクセスできるようになりました。これでデータサイエンティストは柔軟な作業が可能になります。これらのハイパーパラメーターは Composable ML に移行され、ユーザーが直感的に、ブループリントの微調整プロセスの一部として簡単に利用できます。ハイパーパラメーターにタスクとしてアクセスできるようになったことで、新しいブループリント設定も可能になりました。

Composable ML の詳細についてはこちら

オートパイロット用に強化された言語検出

DataRobot の言語検出機能がアップグレードされました。AI の開発者は、強化された DataRobot AI Cloud オートパイロットを利用して、テキストデータセットの言語を自動的に検出し、そのデータセット言語用に最適化されたハイパーパラメーターを含むブループリントを作成できます。AI Cloud オートパイロットでは、自然言語処理(NLP)モデルがテキストデータの言語に最適化されるように、ハイパーパラメーターを簡単にチューニングできます。この新しい言語検出およびハイパーパラメーター自動チューニング機能はすぐに使うことができ、AI プロジェクトの価値実現までの時間を短縮できます。これができるのは DataRobot だけです。

DataRobot オートパイロットの詳細についてはこちら

予測しきい値による画像埋め込みの強化

AI の開発者は新しいVisual Artificial Intelligence(AI)ツールを使って、モデルで生成された画像埋め込みを簡単に探索できます。ユーザーインターフェイスでは新しいオプションとして[予測しきい値]が追加され、[予測値でフィルタ]では、表示される画像を予測値で絞り込むことができます。これらの新しいツールやフィルターにより、個々のデータにフォーカスを当てて、トレンドや外れ値を簡単に見つけられるようになりました。強化された画像埋め込みは、モデリングの結果を直感的に確認するのに役立ちます。

予測 API のための XEMP 多クラス予測の説明

XEMP 多クラス予測の説明が利用できるようになりました。あらゆる多クラスモデルですぐに使えるこの機能は、DataRobot AI Cloud 独自のメリットです。多クラス予測の説明は、AI の利用者が多クラスモデルの予測結果を理解し、AI の判断に対する信頼を築く助けとなります。多クラス予測の説明を利用して、モデルを改善するための方法を見極めることもできます。潜在的なリーケージ、大規模な残差、モデルが 2 つのクラスを明確に区別できない状況などを識別できるからです。

多クラス予測の詳細についてはこちら

バッチ予測速度の向上

最新の DataRobot AI Cloud では、大規模なデータセットに依存する組織の増加に合わせて、AI Cloud のデプロイで要求される予測の速度が向上しています。プレビューテストでは、新規デプロイのバッチ予測速度が、以前のテストより 3 ~ 5 倍速くなりました。

オートパイロット用に強化された言語検出

DataRobot の言語検出機能がアップグレードされました。AI の開発者は、強化された DataRobot AI Cloud オートパイロットを利用して、テキストデータセットの言語を自動的に検出し、そのデータセット言語用に最適化されたハイパーパラメーターを含むブループリントを作成できます。AI Cloud オートパイロットでは、自然言語処理(NLP)モデルがテキストデータの言語に最適化されるように、ハイパーパラメーターを簡単にチューニングできます。この新しい言語検出およびハイパーパラメーター自動チューニング機能はすぐに使うことができ、AI プロジェクトの価値実現までの時間を短縮できます。これができるのは DataRobot だけです。

ジョブの優先順位付け

ビジネスニーズは短期間で変化するものです。最新の DataRobot AI Cloud では、ユーザーがプロジェクト内の特定のモデルのトレーニングを優先的に実行して、その結果をより早く分析できるようになりました。同様に、ニーズの高くないジョブは優先順位を落とし、リソースの空いたときにタスクを実行できます。

AI カタログでのデータセット一括処理

多くの場合、DataRobot AI Cloud のユーザーは、同時に複数のデータセットで作業します。この種のマルチタスク作業の時間短縮に役立つ新機能が、AI カタログのデータセット一括処理です。ユーザーはチェックボックスの選択操作だけで、複数のデータセットに対して削除、タグ付け、共有などの一括処理を指定できます。一括処理は最大 50 データセットまで指定でき、AI プロジェクトのスピードアップを図れます。

DataRobot ポータブル予測サーバー(PPS)でのセグメントモデルのサポート

DataRobot AI Cloud では、以前にリリースされたポータブル予測サーバーのサポートを基盤に、モデルパッケージ(mlpkg)として DataRobot ポータブル予測サーバーにエクスポートされたセグメントモデルを利用して、隔離された環境で予測ができるようになりました。MLOps ポータブル予測サーバーは、1 つ以上の実運用モデルをホストする、使いやすい Docker コンテナです。本番環境に対応できる REST インターフェイスでモデルにアクセスし、予測および予測の説明を作成できます。

大規模データのアップロードに役立つデータステージ

大規模なデータセットのアップロードの信頼性を高めるため、DataRobot AI Cloud で、大規模データセットのアップロードを中間ストレージ(データステージ)へのマルチパートアップロードとして処理する REST API がサポートされました。分割されたデータセットがすべてアップロードされると、データが DataRobot AI カタログまたはバッチ予測にプッシュされます。データステージの導入により、AI カタログで 100GB のデータセットに対してダウンサンプリングを実行できます。

DataRobot AI Cloud – 2022 年 5 月リリース全機能一覧

DataRobot AI Cloud 2022 年 5 月リリースに含まれているすべての機能の詳細については、DataRobot ドキュメンテーションのリリースセンター(英語)をご覧ください。