DataRobot Japanの副社長をしています小川です。
2025年1月15日(水)より「第3回金融データ活用チャレンジ」が開催されます。今回は、「生成AIを活用した資産運用アドバイス」をテーマに、初となる金融庁との共催です。J-LAKE(JPX総研)の投資関連情報データでRAGを構築するチャレンジとなります。
私も金融データ活用推進協会(FDUA)では企画出版委員会で本を執筆したり、生成AI WGで生成AIガイドラインのアドバイザーを務めていたりしますが、今回はFDUAのデータコンペ委員会のメンバーとしてコンペの企画、テーマ決めなどから参加させていただきました。今回もコンペティションのプラットフォームとしては、SIGNATE社の環境を使わせていただき、協力パートナーとしてRAG構築環境としてはDataRobotを利用できます。
DataRobotのRAG構築環境は全てGUIで完結しているので、初めてRAGを作る、プログラミングが苦手という方でも問題なく試していただくことが可能です。LLMとの接続やGPU構築を個別に行う必要はなく、ベクターデータベースの構築からRAGの構築まで10分程度で完了することができます。
トライアル環境では、LLMやベクターデータベースの構築に制限がありますが、今回第3回金融データ活用チャレンジの期間限定で、以下のように環境を増強し、より多くのデータで実験、検証できるようになっています。
- 利用期間が14日から30日間に延長
- DataRobotに付属するLLMコール数を1000回から2000回に増加
- DataRobot内でのベクターデータベース構築回数を15回から30回に増加
それでも制限に達してしまったという参加者の方は、BYO(Bring Your Own)機能を使えば、お手持ちのLLMやベクターデータベースをDataRobotに登録して使用することもできます。今回は同じくコンペティション協力会社の日本マイクロソフトよりLLMがAPI経由で使える形で提供されるため、そちらとDataRobotを接続して使用することも可能です。
DataRobot環境にはNotebook/Codespace 環境もあるので、GUIでの操作だけでなく、Pythonコードによる前処理や高度なRAGフローの構築も可能です。ぜひこれらの機能も活用してみてください。
DataRobotでのRAG構築
DataRobotのRAG構築に関してはPDFなどの対象の文章データをZipで固めてあれば、データサイズにもよりますが、だいたい10分程度あれば構築が完了します。そのステップはぜひこちらのマニュアルからデモデータや今回のコンペデータを活用して試してみてください。ハンズオンも1月22日に実施します。以下に簡単にDataRobotでRAGを作る時のステップを紹介します。
DataRobotトライアル環境申請ページはこちら
- ベクターデータベース化したいPDFデータを一階層のフォルダでzipで圧縮

- ユースケースを作成(プロジェクト管理するフォルダのような役割)


- ベクターデータベースを構築(エンベディングモデルやチャンキング設定)


これだけでRAG構築は完了です。
性能評価の機能もありますし、トレースから各パラメータ含めて全てトラッキングされているので、どの時点の設定がどの質問でうまくいっていたのか簡単に確認できます。
DataRobot賞
今回のコンペでは精度争いは全体の戦いとして繰り広げられますが、DataRobotを深く活用してくれた方にはDataRobot賞もご用意しています。上記のスタートアップマニュアルで実現できること以外にも、DataRobotには様々な生成AI機能があります。
- 外部サービスを活用したBring Your Own LLM (BYO LLM)、ベクターDB、エンベディングモデル
- メタデータによるフィルタリング機能
- 本番環境を見据えた評価とガードレール機能(アセスメント&ガードレール)
- AIアプリホスティング(Chatボット化、Streamlitホスティング対応)
- ノートブック/コードスペースからのAPIによる高度な活用
- オブザーバビリティ機能(システムの監視機能)
- コンプライアンステスト機能
上記の生成AIアプリの本番利用を想定した機能をどのように活用したかをまとめたブログなどを投稿し、コンペ用Slackチャネルにリンクをシェアしていただくことが対象条件になります。
今回のコンペで金融機関で求められる生成AI活用イメージ、RAG構築がどういうものなのか、コンペに参加する経験、DataRobotサービスについて知っていただける機会になれば幸いです。多くのみなさまのご参加をお待ちしております。
Related posts
See other posts in その他
複雑化する意思決定プロセスにおいて、適切なインサイトを迅速に得ることは、ビジネスリーダーにとって不可欠です。しかし、従来のアナリティクス手法や多忙を極めるデータチームの存在が、このプロセスを遅延させています。また、AI導入の現場では、長期にわたる実装サイクルやシステム統合の課題が、進捗を妨げています。 実際、AI導入の責任者の66%が、企業目標に沿ったAIソリューションを展開するための適切なツールが不足していると回答しています。特に、7ヶ月以上に及ぶ導入期間やシステム統合の困難さは、経営層の期待に応える上での大きな障壁となっています。 生成AIとAIエージェントは、これらの課題を解決する可能性を秘めていますが、導入は依然として容易ではありません。ビジネスリーダーの77%が、競争における後れを懸念し、チームに導入の加速を強く求めています。 この状況を打開するためには、より複雑なツールへの投資ではなく、即戦力となる構成済みのAIエージェントアプリケーションの導入が最も効果的です。


こんにちは、DataRobotデータサイエンティストの長野です。普段はDataRobotでデータサイエンティストとして製造業・ヘルスケア業界のお客様を担当しています。技術面では生成AIプロジェクトのリードを担当しています。本記事では、DataRobotのBYOLLM(Bring Your Own LLM)と呼ばれる仕組みを用いて、Hugging Face Hubから取得したLLMをDataRobot環境にホスティングする方法をご紹介します。