Wiki トピック

データインサイト

データインサイトとは

「インサイトとは、分析を利用して獲得できる価値のことです。分析を通じて獲得したインサイトは非常に強力であり、機会のある領域を特定することはもちろん、ビジネスを成長させるために使用することができます。」- Localytics Blog

データインサイトとは、機械学習人工知能(AI)技術を使用してデータセットを分析することで達成可能な特定のビジネス事象を理解することです。たとえば、顧客が解約する可能性を見積もる機械学習モデルでは、どの要因が解約率を高めるかを明らかにして、意思決定者がビジネス戦略およびプロセスを変更できるようにします。

データからの有益なインサイトを理解し伝達する最適な方法の 1 つに、モデルの結果を可視化するためのデータ分析ツールがあります。これにより、さまざまな方法でデータを探索し、理解を深めることができます。これは、広告活動に対する ROI の向上、ローンの債務不履行予測の精度向上などの形で実際のビジネス価値につながります。データインサイトからのビジョンが明確になることにより、ユーザーはより適切な意思決定を下すことができ、モデルの解釈可能性が向上するため、アナリストなど他のユーザーがモデルの結果を主要な関係者に説明できるようになります。

データインサイトが重要である理由

インサイトにより、モデルが「舞台裏で」何を行っているのかをどのスキルレベルのユーザーも理解できるようになります。特に、銀行や医療のような規制の厳しい業界での機械学習のユースケースでは重要です。使用したモデルが特定の結論に至った理由を理解できない(つまり、内部の仕組みについてのインサイトがない)場合、モデルの実用性は限定的になります。

データ可視化ツールは、機械学習モデルの結果からインサイトを理解し説明するのに役立ちます。ワードクラウドなどのシンプルなグラフィック表現であろうと、Tableau ダッシュボードのようなさらに複雑で柔軟な可視化ツールであろうと、これらのツールを使用することでモデルが明らかにする価値を理解し伝達しやすくなり、より良いビジネス上の意思決定を下せるようになります。

データインサイト + DataRobot

DataRobot のインサイト機能には、モデル解釈のためのツール一式が揃っています。どれを使用してもユーザーはモデルを簡単に理解でき、ユーザーによる追加作業は必要ありません。たとえば、病院のデータセットに、医師のメモを自由形式のテキストとして格納する特徴量が含まれている場合、DataRobot はそれらのメモのどの単語が病院のターゲット変数と関連があるのかを示すワードクラウドを自動的に生成します。

以下の例は、このようなデータセットからの、患者の再入院率に関連する単語を示しています。赤色の単語は高リスクの患者メモ、青色の単語は低リスクの患者メモと関連付けられています。単語の大きさは、データセット内に現れる頻度を表しています。

データインサイト

DataRobot にはこの他にも、個々の特徴量のインパクト(特徴量のインパクトを参照)を測定しランク付けするツールのほか、モデルの仕組みや入力データに対して行われる処理について詳細を提供するツールや、個々のレコードでのモデルの結果について主な理由を提供する予測の説明が含まれています。

関連資料(英語版を含む)