Excelでできる!機械学習活用術

2019/12/11
執筆者:
2 min

DataRobotでテクノロジーアライアンスを担当している進藤です。

DataRobotは2019年の7月にDataRobot Add-in for Microsoft ExcelというエクセルのAdd-in製品を発表しました。この製品はDataRobotユーザーであれば、どなたでも無償で使用することができます。

このAdd-inによって、DataRobotのUIで行なっていた主な作業がエクセル上の操作だけで完結します。例えば、これまでエクセルデータを教師データや予測データとして使いたい場合、ファイルをDataRobot UIにドラッグ&ドロップすることが一般的な方法でしたが、このAdd-inを使うと使い慣れたエクセルから直接DataRobotにアップロードすることができ、またその結果も直接エクセル上に表示することができます。さらに作成したモデルのデプロイ(予測APIを使う準備)と、そのデプロイを使った予測もエクセルから手軽に行うことができます。DataRobotとエクセルの画面を交互に行き来する必要がなくなり、またその操作もわずか数クリックで行うことができます。

今回はこのDataRobot Add-in for Microsoft Excelの使い方をご紹介します。 

まず、本DataRobot Add-inを使用できる環境は、下記のようになっていますので、お使いのPC環境を確認してください。

対応OS: Windowsのみ

Excelのバージョン: 2010以降(クライアント版のみ、Office Onlineでは使用頂けません)

*DataRobotアカウントが必要(クラウド・オンプレ版ともに使用頂けます)

確認ができましたら、DataRobot Add-inをこちらのフォームから必要事項を入力しダウンロードし、インストールしてください。

インストールプロセスの終了後、エクセルにDataRobotのリボンが表示されていたら、DataRobot Add-inのインストールは正常に完了しています。

 

「DataRobot Login」をクリックし、DataRobotのログインURLと、DataRobotアカウントのAPIキーを入力し、「Login to DataRobot」をクリックするとログインができます。

(APIキーはあらかじめDataRobotから取得する必要があります)

 

無事ログインができていれば、メニュー表示が切り替わります。

これで準備完了です。

 

今回のAdd-inの機能は大きく4つあります。

  1. モデルの作成 (Train models)
  2. モデルのテスト (Test model predictions)
  3. デプロイ (Deploy model)
  4. デプロイを使った予測 (Get deployment predictions)

1. モデルの作成(Train models)

モデルの作成を行うことができます。(2.モデルのテストと3.デプロイに進む為には、あらかじめこのモデルの作成を実行しておく必要があります)

モデルの作成に使用する教師データがあるシートで「Train models」をクリックします。

Create new modelというダイアログが表示されます。

 

プロジェクト名(Project name)、データの範囲(Data Range)、予測のターゲットが入っている列名(Column to predict)を指定します。さらにより予測の精度重視でモデルを作成したい場合には「Advanced Mode」をチェックします。これらを入力し「Create model」をクリックすると、モデルの作成が開始されます。

モデルの作成プロセスが終了すると新たにシートが作成され、作成されたモデルの情報が記載されます(DataRobotのリーダーズボードと呼ばれる、作成済モデルのリストの一番上のモデルが自動的に採用されます)。

 

2. モデルのテスト

1で作成したモデルを使って予測ができます。

1のモデル作成プロセス終了後、予測データがあるシートを表示した状態で、「Test model prediction」をクリックします。

 

Test model predictionsというダイアログが開きます。

 

 

データの範囲(Data range)とモデル(Models in this workbook)を選択して、「Get predictions」をクリックすると予測処理が開始されます。ここでは1.モデルの作成(Train models)で作成したモデルだけが選択できます。

予測処理が完了すると「Completed」ウィンドウが表示され、予測結果のシートが新たに作成されます(シート名の末尾に”Test Results”がつきます)。

 

予測データの全ての列に加えて、予測結果(Prediction), 確率(Probability)そして閾値(Prediction Threshold)の列が追加されています。

 

3. デプロイ

 

1で作成したモデルを、デプロイ(予測APIサーバに展開)することができます。

「Deploy model」をクリックします。

 

Deploy modelというダイアログが開きます。

 

ドロップダウンリストからデプロイするモデルが選び(Model to deploy)、デプロイにつける任意の名前(Deploy name)および説明(Deployment description)を記入します。

データドリフトの追跡機能を使用する場合には「Enable drift tracking」をチェックします。

 

「Deploy model」をクリックするとデプロイが開始されます。完了するとデプロイのURLが表示されます。

 

4. デプロイしたモデルを使って予測

過去にデプロイしたモデル(DataRobot上でデプロイしたモデルも含みます)を使って予測の実行ができます。

予測データがあるシートを表示し、「Get deployment predicitons」をクリックします。

 

Get deployment predictionsというダイアログが開きます

 

 

ドロップダウンリストから使用するデプロイを選択し(Select Deployment)、ヘッダー(Column headers)とデータの範囲(Datato score)をそれぞれ指定します。予測の値だけでなく説明を含める場合はInclude Prediction Explanationsをチェックします。「Get predictions」をクリックすると予測が実行されます。

予測処理が完了するとDoneウィンドウが表示され、予測結果のシートが新たに作成されます。

 

 

元の予測データに加えて、予測結果(Prediction), 確率(Probability), 閾値(Prediction Threshold)の列が追加され, 予測の説明をつけた場合はそれぞれのレコードに対して、強さ(Strength), 強さ:数値(Strength numeric), 特徴量名(Feature), 特徴量値(Value)が表示されます。

 

いかがでしたでしょうか?

この DataRobot Add-inにより、モデルの作成、テスト、デプロイ、デプロイを使った予測の4つの作業が使い慣れたエクセル上で完結し、これまで以上にDataRobotを使った予測結果を手軽に得ることができます。

エクセルで管理されている様々なデータをそのまま活用できますし、また少しずつデータの内容を変えて、様々なパターンの予測結果をシュミレーションするといった使い方もできます。さらに、マクロと併用してデータの加工から自動化するなど、使い方は無限にあります。ぜひ一度、DataRobot Add-inの手軽さを実感してみてください。

DataRobot Add-inのダウンロードは、こちらのフォームから!

 

メンバー募集

DataRobotではAIの民主化をさらに加速していくメンバーを募集しています。データサイエンティスト、マーケティングから営業まで多くのポジションで募集していますので、興味を持たれた方はご連絡ください。

 

 

執筆者について

Newsletter Subscription
Subscribe to our Blog