予測の説明

予測の説明とは

注: 2018 年 4 月まで、予測の説明は「リーズンコード」と呼ばれていました。 子どもから「なぜ空は青いの?」と聞かれたことはありますか?多分、満足に答えられなかったことでしょう。たとえ答えられたとしても、さらに質問が続いて、知識か忍耐(おそらく両方)が限界に達したのではないでしょうか。これまでの機械学習モデルは、そのような状況に追い込まれたあなたと同じような立場でした。少なくとも、なすすべがないのは同じです。何らかのデータを入れると、何らかの予測が出てきて、あなたは「なぜ?なぜ?なぜ?」と理由もわからず取り残されます。あなたにあるのはブラックボックスから教えられた情報だけで、モデルに基づいてあなたが下す決定を正当化したり説明する手段はありません。予測の説明を使用すれば、このような問題が解消されます。個々の観察に関して、リーズンコードから、モデルの予測に与えた効果が最も大きい属性または変数がわかります。

予測の説明が重要である理由

アルゴリズムに指示されたからといって、理由も告げずに大切な人と絶交したりはしないはずです(そう願います)。そうであれば、なぜ、適切な説明もなく融資申請を却下したり実際的なビジネス上の決定を下すのでしょうか?これは失礼な行為であり、業界によっては完全に違法です。リーズンコードは、モデルがその予測をした理由についてインサイトを提供します。ユーザーはこれを使用して、規制を遵守したり、モデルの結果をステークホルダに説明したり、影響の大きい要因を特定してビジネス戦略を集中させることができます。予測の説明は、ケースバイケースで予測の根拠が予測自体と同じくらい重要であるような状況に最適です。たとえば医療関係者は、予測の説明を見て、患者の健康状態の予測に最も貢献している要因について理解を深めることができます。保険業界では、融資を承認すべきかどうかの判定に予測を利用する場合、個々の申請が承認または拒否された理由についてインサイトを獲得するためにリーズンコードを使用できます。基本的に、予測に関する詳細情報が必要であれば、予測の説明から得ることができます。

予測の説明 + DataRobot

DataRobot 自動機械学習プラットフォームでは、構築した個々のモデルについて予測の説明を自動的に計算し、ダウンロードすることができ、追加のコーディングや作業は一切必要ありません。計算が完了したら、個々の予測について主な理由を 1 から 10 まで並べた番号付きリストとして予測の説明をダウンロードできます。このリストには、その予測の各特徴量の値についての情報や、その特徴量の影響の大きさ、最終的な予測にプラスの影響を与えるかマイナスの影響を与えるのかといった情報も含めることができます。