インサイト

インサイトとは

人工知能(AI)機械学習予測分析に使用できるのはもちろん素晴らしいことですが、そのような予測によって現状の問題に対する理解が深まらないとしたら、何の役に立つのでしょうか?インサイトとは、分析を利用して獲得できる価値のことです。分析を通じて獲得したインサイトは非常に強力であり、機会のある領域を特定することはもちろん、ビジネスを成長させるために使用することができます。」- Localytics Blogインサイトとは、データの予測分析と統計分析を通じて獲得できる理解のことです。たとえば、顧客離れの可能性を予測する機械学習モデルは、(うまくいけば)解約率を高める要因についての理解に役立ち、根本原因に対処して解約率を効果的に下げる意思決定を行えるようになります。有益なインサイトを導き出す最適な方法の 1 つに、モデルの予測を可視化してくれるデータ分析ツールがあります。これにより、さまざまな方法でデータを探索し、理解を深めることができます。インサイトは気づきの瞬間を与えてくれます。つまり、モデルの予測が、イライラするほど不明瞭なものから、理解しやすいものに変わる瞬間のことです。視界が明瞭になると、データに基づいてより良い意思決定を下せるようになり、モデルの解釈可能性が向上するため、予測についてより簡単に説明できるようになります。

インサイトが重要である理由

インサイトにより、モデルが「舞台裏で」何を行っているのかを理解できます。特に、銀行や医療のような規制の厳しい業界での機械学習のユースケースでは、これが昔から機械学習と予測分析の課題となっていました。使用したモデルが特定の結論に至った理由を理解できない(つまり、内部の仕組みについてのインサイトがない)場合、予測モデルの実用性は非常に限定的になります。データ可視化ツールは、モデルからのインサイトを説明する方法として優れています。ワードクラウドなどのグラフィック表現や、Tableau ダッシュボードのようなさらに複雑で柔軟な可視化ツールを使用することで、理解が深まり、モデルの予測が伝達しやすくなり、より良い意思決定を下せるようになります。

インサイト + DataRobot

DataRobot のインサイト機能には、予測データ分析のためのツール一式が揃っています。どれを使用してもモデルを簡単に理解でき、ユーザーによる追加作業は必要ありません。たとえば、病院のデータセットに、医師のメモを自由形式のテキストとして格納する特徴量が含まれている場合、DataRobot はそれらのメモのどの単語が病院のターゲット変数の予測において意義があるのかを示すワードクラウドを自動的に生成します。以下の例は、そのようなデータセットから得た、患者の再入院率を予測することが判明した単語を示しています。赤色の単語は高リスク、青色の単語は低リスクを示し、単語の大きさはその単語の出現頻度を表しています。 ワードクラウドは、DataRobot のインサイトツールの 1 つに過ぎません。この他にも、個々の特徴量の影響を測定しランク付けするツールのほか、モデルの仕組みや入力データに対して行われる処理について詳細を提供するツールや、個別のレコードの予測について主な理由を提供するリーズンコードなどが含まれています。DataRobot を使用すれば、説明と正当化が困難だった「ブラックボックス」モデルは過去のものになります。