機械学習のライフサイクル

機械学習のライフサイクルとは

機械学習のライフサイクルとは、データサイエンスプロジェクトが従う循環的なプロセスです。ライフサイクルには、機械学習人工知能(AI)を利用して実用的なビジネス上の価値を実現するために組織が従うべきステップが 1 つずつ定義されています。

機械学習のライフサイクルには 5 つの主なステップがあります。そのすべてが等しく重要で、特定の順序に従う必要があります。

機械学習のライフサイクル

機械学習のライフサイクルの例

病院が機械学習を使用して患者の転帰と ROI の両方を改善する方法の例を段階を追って紹介します。

  1. プロジェクト目標の定義: ライフサイクルの最初のステップでは、運用効率の明確な改善や顧客満足度の向上、価値の創出などの機会を特定します。医療業界では、退院した患者の健康状態が悪化し、再入院を余儀なくされることがあります。このような再入院は、患者にとって危険で面倒なものですが、病院にとっても、同じ患者を再び治療するために時間とリソースをさらに費やすことになります。それに加え、患者が退院後 30 日以内に再入院した場合、病院に罰金が科されます。このような罰金を回避することはもちろん、さらに重要なことに、患者が病床に臥せる時間が長期化したり、生命を危険に晒しかねない再発に苦しむことがないように、病院は患者データを使用して、将来合併症の可能性を高める要因を把握し、先制的な行動をとりたいと考えています。
  2. データの取得と探索: 次に、機械学習で使用する関連データをすべて収集し、準備します。これは医療分野の専門家から助言を受けて、再入院率の予測に関連する可能性があるデータを判断し、このデータを患者の履歴レコードから収集し、分析に適した形式(通常は .csv などのフラットファイル形式)に変換するということです。
  3. データのモデリング: 機械学習を使用してデータからインサイトを得るには、深く理解しようとしている要素、つまりターゲット変数を決定する必要があります。この例では病院は「再入院」を選択して、データ収集時、履歴データセットにこれを特徴量として含めました。次に、データセットに対して機械学習アルゴリズムを実行します。アルゴリズムによってモデルが作成され、履歴データの例に基づいて学習します。最後に、病院はトレーニングしていないデータに対してトレーニング済みモデルを実行し、新しい患者が再入院する可能性があるかを予測することで、患者の治療についてより適切な判断を下せるようになります。
  4. 解釈とコミュニケーション: 機械学習プロジェクトで最も難しいタスクの 1 つは、データサイエンスの背景知識を持たない人にモデルの結果について説明することです。医療のような規制の厳しい業界では特に困難です。これまで、機械学習は「ブラックボックス」と考えられてきました。インサイトについて解釈し、その価値をステークホルダと規制当局の両方に伝えるのが難しいためです。モデルの解釈可能性が高ければ高いほど、規制要件を満たし、企業の経営陣など主要なステークホルダにモデルの価値を伝えるのが容易になります。
  5. 実施、文書化、維持: 最後のステップは、データサイエンスプロジェクトを実施、文書化、維持して、病院がモデルの活用と改善を継続できるようにすることです。多くの場合、モデルのデプロイは課題を伴います。コーディングとデータサイエンスの経験が必要とされることと、従来のデータサイエンス手法を使用する場合にはサイクルの最初から実装までの時間が法外に長くなることが原因です。

機械学習のライフサイクルが重要である理由

機械学習のライフサイクルが重要なのは、ビジネス部門からエンジニアリング部門まで、社内の各人がデータサイエンスのイニシアチブでどのような役割を果たすのかを描写するからです。1 つ 1 つのプロジェクトを開始から終了まで導き、データサイエンスプロジェクト全体をどのように構成すればリアルで実用的なビジネス上の価値が実現するのかについて、高レベルな観点をもたらします。これらのステップのどれかを正確に行わないと、実用的な価値のないモデルに終わるか、誤解を招くインサイトをもたらすモデルが完成してしまいます。

機械学習のライフサイクル + DataRobot

DataRobot の自動機械学習プラットフォームは、最も複雑で時間のかかるステップを自動化によって簡素化することにより、機械学習のライフサイクルを効率化します。データの探索とモデルの構築が遥かに簡単で利用しやすくなるため、ビジネスサイエンスプロジェクトの背後に潜むビジネス上の問題を理解する人が数十種類のモデルを迅速に構築し、テストできるようになり、従来の手法を使う場合と比べて時間が大幅に短縮されます。さらに、DataRobot には、モデルの解釈可能性を高め、モデルインサイトの伝達を容易にする独自の予測の説明機能などのツールが組み込まれており、機械学習の価値を組織全体のユーザーに伝えやすくなります。

それに加え、DataRobot はあなたやあなたの組織が機械学習のライフサイクルについての理解を深めるためのリソースを提供しています。DataRobot University に参加することで、機械学習プロジェクトの実行方法をゼロから学ぶことができます。