機械学習モデルのデプロイ

モデルのデプロイとは

デプロイは、データに基づく実際的なビジネス上の意思決定に使用できるよう、機械学習モデルを既存の本稼働環境へ統合するための方法です。これは機械学習のライフサイクルの最終段階の 1 つであり、非常に煩雑になる場合があります。組織の IT システムに、モデルの構築に使用される従来の言語との互換性がなく、データサイエンティストとプログラマーが貴重な時間と頭脳をコードの書き換えに費やさざるを得ない場合がよくあります。

モデルのデプロイが重要である理由

実用的な意思決定のためにモデルの使用を開始するには、本稼働環境への効果的なデプロイが必要です。信頼できる実践的なインサイトをモデルから得られなければ、モデルの影響はごく限られたものになります。

モデルのデプロイは、機械学習から価値を得るプロセスの中でも最も困難なプロセスの 1 つです。組織の本稼働環境でモデルが信頼性の高い状態で動作できるようにするには、データサイエンティスト、IT チーム、ソフトウェア開発者、ビジネスプロフェッショナル間で調整を行う必要があります。これには大きな課題があります。多くの場合、機械学習モデルが記述されたプログラミング言語と本稼動システムで認識できる言語が異なります。また、モデルを再コーディングすると、プロジェクトのスケジュールが週または月単位で延びる可能性があります。

機械学習モデルから最大限に価値を引き出すには、できる限りシームレスに本稼働環境にデプロイし、企業がそれらの使用を開始して実用的な判断を下せるようにすることが重要です。

機械学習モデルのデプロイ + DataRobot

DataRobot の自動機械学習プラットフォームでは、効果的なモデルデプロイに必要となる一般的な労力とスケジュールが数週間または数カ月から数時間に短縮されます。

  1. REST API。DataRobot で構築される機械学習モデルはすべて REST API エンドポイントを公開できるため、既存のアプリケーションとの統合も容易です。
  2. GUI によるオンデマンドの分析。DataRobot の予測機能はドラッグアンドドロップ操作の予測インターフェースで操作でき、ソフトウェア開発部門や IT 部門などへの依存をなくし、ユーザーが必要なときに自力で予測を得ることを可能にします。
  3. スコアリングコードエクスポート。 DataRobot のスコアリングコードエクスポートは、選択したモデルを簡単に自己完結型ファイルで提供します。コードは実行可能な .jar ファイルまたは Java ソースコードとして提供され、Java が実行可能な環境ならば自由にデプロイできます。
  4. スタンドアロン型のスコアリングエンジン。 DataRobot のスタンドアロン型スコアリングエンジンは 2 つの環境を分離するので、モデルのテストおよび本番運用は隔離され安定した環境で実行できます。このスタンドアロン型エンジンでは、エクスポート元の開発サーバーにまったく影響を与えることなく、インポートされたモデルを実行することができます。
  5. Spark によるスコアリング。 DataRobot では Spark を使用したスコアリングにより、企業は中央サーバーにデータを転送しホストする必要はなく、データが存在している場所で機械学習のためのデータをスコアリングできます。これにより、データのストレージ場所を Hadoop クラスタ上のインスタンスから移動させることなく、大容量化する可能性があるデータセットであってもDataRobot で作成したモデルを実行できます。