教師あり機械学習

教師あり機械学習とは

データサイエンス人工知能(AI)に関するほとんどのニュースで耳にするデフォルトタイプの機械学習です。教師なし機械学習はどれも実際には注目を集めていません。教師あり機械学習では、アルゴリズムモデルがラベル付きデータ(結果の変数、つまりターゲットがわかっているデータ)から学習し、その結果に対する予測を新しいデータセットに対して行います。教師あり機械学習のアルゴリズムは、トレーニングデータセットから学習します。トレーニングデータセットには、アルゴリズムが予測を学習しているターゲットの正しい答えなど、各レコードの情報(特徴量)が含まれます。トレーニング中に正しい答えをモデルに提供するので、モデルは間違いから「学習」し、ターゲットの予測を徐々に改善します。ほとんどの教師あり機械学習タスクは、以下のカテゴリのいずれかに分けられます。

  1. 回帰: アルゴリズムは、各例に対して数値ターゲットを予測します(新しいマーケティングキャンペーンからどれだけの収益が生成されるか、など)。
  2. 分類: アルゴリズムは、2 つ以上の異なるクラスから選択して、各例にラベルを付けることを試みます。2 つのクラスからの選択を二値分類と呼びます。たとえば、誰かがローンで債務不履行になるかどうかを予測します。3 つ以上のクラスからの選択は、多値分類と呼ばれます。たとえば、ピッチャーが次に投げる球種を予測します。

教師あり機械学習が重要である理由

教師あり機械学習は、データを実際の実用的なインサイトへと直接変換します。データをリソースとして使用することで、組織は不必要な結果がどのようなものかを理解して防止したり、予測しようとしているものが何であれ、望ましい結果を促進したりすることができます。たとえば、教師あり機械学習手法により、どの顧客が解約リスクが高いかを知ることができます。特定の顧客をターゲットにしたコミュニケーションやプロモーションを行うことで、顧客にリーチアウトして解約の可能性を減らすことができます。教師あり機械学習は、AI システムがビジネスの意思決定を人間よりも迅速かつ高い精度で実行できるようにする最も強力なエンジンの 1 つです。ただし、教師あり機械学習の実装を成功させるには従来、データサイエンティストのチームが長い時間と広範囲の専門知識を費やして、精度の高い予測モデルを構築、スケーリング、デプロイする必要がありました。さらに、教師あり機械学習モデルは過去のデータに基づいて実際の予測を行うので、世の中の変化と共に予測が陳腐化しないよう定期的にモデルを再構築する必要があります。

教師あり機械学習 + DataRobot

教師あり機械学習は DataRobot の主力業務です。DataRobot は、かつては実際のデータサイエンスの実行を必要としていた反復的なモデリングタスクを自動化し、プログラミング技術を不要にすることで、組織全体の分析チームの能力を飛躍的に強化します。DataRobot により、データサイエンティストもビジネスアナリストも、回帰および二値/多値分類のためのモデルを迅速に構築、反復、デプロイできます。これにより、組織は精度の高い機械学習モデルを、かつての数カ月ではなく数日または数時間で本稼働環境に導入でき、より多くの複雑な問題に対応できます。DataRobot のオートパイロットは、任意のデータセットを取り入れ、数百の教師あり機械学習モデルを自動的に構築します。生成されたモデルをリーダーボードに追加し、事前に決定された精度の指標に基づいて競争させ、最も精度の高いモデルのみが出現するようにします。次に、上位の機械学習モデルを統合して、可能な限り最も精度が高く、強力な予測を取得します。さらに、DataRobot は、各モデルを解釈および理解するためのツールを提供して、AI を「ブラックボックス」から組織のためのインサイトソースへと変換します。DataRobot は、組織のデータサイエンティストとそれ以外の人々とのギャップを埋め、データサイエンスをアナリストや専門家が利用しやすいものにします。DataRobot により、非常に簡単にデータサイエンスのイニシアチブを軌道に乗せ、真のビジネス価値の実現を開始することができます。