ターゲット

ターゲットとは

予測分析人工知能(AI)に関心を持っているのは、ビジネス価値へと変わる可能性がある結果をデータを使用して予測したいと考えているからでしょう。機械学習では、その結果のことをターゲットと呼んでいます。目標に応じて、ターゲットは、週単位の小売の売上を予測して、それに従って在庫を調整できるようにすることであったり、特定の入院患者が病気にかかる確率を予測して予防措置を講じることができるようにすることであったりします。ターゲットは、教師あり機械学習の問題の存在理由です。予測モデルは、一連の例を前提として、入力データを既知の結果の変数にマッピングしようとします。教師あり学習の問題では、ターゲットはデータセットで列の 1 つとして表示されます。教師ありのアルゴリズムは、データセット内の他の特徴量を使用して、そのターゲットを予測するのに役立つパターンを学習しようとします。既知のターゲットは、アルゴリズムがどのぐらい適切に学習しているかをフィードバックするために使用されます。

ターゲットが重要である理由

ターゲットがなければ、教師あり機械学習アルゴリズムは、利用可能なデータを予測結果にマッピングする方法を見つけ出すために非常に苦労します。少なくとも数回聞かなければ、猫を「猫」と呼ぶことを子供が理解できないのと同じです。商品またはブランドに対する感情が肯定的か否定的かによってツイートを分類するために学習しているとします。感情分析と呼ばれるものです。役に立つ可能性があるツイートの要素には、単語トークン、会話の各部分、顔文字などがあります。これらが特徴量となります。しかし、どのツイートが喜んでいて、どのツイートが悲しんでいるのかという例を最初に与えられなければ、モデルはこれらの特徴量がどのように感情に関連するのかを学習できません。こうした喜びや悲しみを表すようなターゲットは、多くの場合、手動でラベル付けされますが、自動的にデータセットにターゲット値でラベルを付ける方法があります。ターゲットが適切に定義されていることが重要です。アルゴリズムが実行するのは、入力データとターゲットをマッピングする機能を学習することだけです。ターゲットが意味をなしていなければ、その関係は無意味なものになるでしょう。

ターゲット + DataRobot

DataRobot なら、容易にターゲットを選択し、教師ありモデルの構築を開始できます。必要なのは、データセットをアップロードし、どの特徴量を予測したいかを指定することだけです。残りの難しい部分は DataRobot が実行します。 ターゲット DataRobot は、他の特徴量がターゲットにどのように関連するか、およびトレーニングされた各モデルがターゲットを予測するためにどのぐらい適切に学習しているかを示します。これにより、予測アプリケーションにデプロイする最適なモデルを容易に選択し、ターゲット(データ)漏えいなどの気付きにくいことで有名な問題を特定することができます。DataRobot はモデル予測を評価し理解するための多数のインサイトを提供して、ターゲットが予測とどのように関連するかをさまざまな方法で表します。予測はターゲットに近づいたか?時系列の問題の場合、予測は時間の経過と共にターゲットに近づいているか?説明的な特徴量の 1 つを削除すると、これはどのように変化するか?特定の予測において、どの特徴量により、予測はターゲットに近づいたか、またはターゲットから離れたか?トレーニングデータが増えると、モデルの予測精度を高めるのに役立つか?DataRobot はこれらのすべての質問に答えるのに役立ちます。しかも余分なコーディングや時間は一切不要です。