解釈可能性

解釈可能性とは

機械学習データサイエンスの文脈では、解釈可能性とは、アルゴリズムが予測に至るために用いるプロセスを人間がどれだけ簡単に理解できるかを表します。最近まで、人工知能(AI)アルゴリズムは「ブラックボックス」でした。何らかのデータを押し込んだら予測が出てくるだけで、アルゴリズムがなぜそのような予測を立てたのか判断する手段はありませんでした。ロジスティック回帰 など一部の統計的モデルは比較的単純だと考えられており、解釈可能性は高くなりますが、特徴量を追加したり、より複雑な機械学習モデル(ディープラーニングなど)を使用すると、解釈可能性はより複雑になっていきます。最終的には、アルゴリズムを盲目的に信用する羽目になり、災いを引き起こします。

解釈可能性が重要である理由

「脳みそがどこにあるか見えないのに、一人で勝手に考えることができるものは信用しちゃいけないって、教えただろう?」– アーサー・ウィーズリー、『ハリー・ポッターと秘密の部屋』より この知恵の言葉は、アルゴリズムの予測に基づいてリスクの高い決定を下す場合は特に重要です。モデルの解釈可能性がそれほど高くない場合はもちろん、獲得したインサイトを利用することが法的に許可されていない場合もあります。銀行、保険、医療といった規制の厳しい業界では、規制や業界のベストプラクティスを遵守するためには、導き出される結果に貢献した要因を理解することが必要不可欠です。

解釈可能性 + DataRobot

DataRobot を使用すれば、機械学習がブラックボックスであった時代は終わります。DataRobot には、人間にとって解釈可能性が高いモデルを生成できる以下のような複数のコンポーネントが用意されています。

  • モデルブループリントは、各モデルが予測を決定するために用いる前処理のステップについてインサイトを提供します。これにより、DataRobot を使用して構築するモデルを正当化し、必要に応じて規制当局に説明することができます。
  • モデル X-Ray は、アルゴリズムが各入力変数に対して使用するパターンを示します。これにより、ターゲット変数または予測しようとしている変数に対してより高い予測値を提示できる変数が明らかになります。
  • リーズンコードは、各レコードについて予測しようとしていることに最も貢献する可能性が高い主な変数を示します。これにより、モデルが特定の結果を予測している理由を正確に説明できるようになります。これよりも解釈可能性を高めることは果たしてできるでしょうか?

AI を利用して実際のビジネス上の問題を解決するためには、モデルがブラックボックスであってはいけないのです。DataRobot は、モデルの解釈可能性の強化に取り組むことで、モデルのリスクを最小限に抑え、すべての企業が規制とベストプラクティスを簡単に遵守できるようにしています。感謝には及びません。