本ブログはグローバルで公開された「DataRobot + Nebius: An enterprise-ready AI Factory optimized for agents」の抄訳版です。
DataRobotとNebiusは、AIエージェントの開発・運用・ガバナンスを加速する共同ソリューション「エンタープライズ AIファクトリー(AI Factory for Enterprises)」を発表しました。本ソリューションにより、エージェントを数か月ではなく数日で本番環境に投入できるようになります。
エンタープライズ AIファクトリーは、スケーラブルかつコスト効率に優れ、ガバナンスとマネージドサービスを備えたエンタープライズグレードのエージェント基盤です。DataRobotのAgent Workforce Platform——業界で最も包括的で柔軟性・セキュリティ・エンタープライズ対応力に優れたエージェントライフサイクル管理プラットフォーム——と、Nebiusが提供するAI専用設計のクラウドインフラストラクチャを組み合わせることで、これを実現しています。
パートナーシップの概要
Nebius:AI専用設計のクラウド基盤
現在の課題は、汎用クラウドプラットフォームではパフォーマンスのばらつき、レイテンシの増大、そして仮想化に起因する「仮想化税」が発生し、継続的な本番規模のAIワークロードを阻害してしまうことにあります。
この課題を解決するため、DataRobotはNebius AIクラウドを採用しています。Nebius AIクラウドは、ハードウェアレイヤーからAI向けに設計されたGPUクラウドプラットフォームであり、ベアメタル級のパフォーマンス、低レイテンシー、安定したスループットを提供します。これにより、他テナントの負荷が影響する「ノイジーネイバー問題」を排除し、最も要求の厳しいエージェントワークロードでも安定した結果と透明性のあるコスト構造で運用できます。
また、NebiusのToken Factoryは、主要なオープンソースモデルに対してトークン従量課金でアクセスできるレイヤーを提供します。エージェントの構築・実験フェーズではToken Factoryを利用し、本番運用時には同じモデルをDataRobot上にデプロイするという使い分けが可能です。
DataRobot:エージェントの構築・運用・ガバナンスをシームレスにスケール
DataRobotのエージェントワークフォースプラットフォームは、エージェントの構築・運用・ガバナンスをシームレスに実現する、業界で最も包括的なエージェントライフサイクル管理プラットフォームです。
本プラットフォームは、大きく2つのコンポーネントで構成されています。
- 1. ランタイム:エンタープライズグレードのスケーラブルで信頼性の高いコスト効率に優れたモデル/エージェント実行環境。ガバナンスとモニタリングを標準搭載。
- 2. エージェントビルダー環境:本番対応のエージェントを数日・数か月ではなく数時間で構築できる、使いやすい開発環境。
エンタープライズグレードの包括的なランタイム機能
- スケーラブルでコスト効率の高いランタイム:50以上のNIMやHugging Faceモデルをワンクリックでデプロイでき、オートスケーリングに対応。また、Workload APIを通じて任意のコンテナ化されたアーティファクトもデプロイ可能です(いずれもモニタリング/ガバナンスを内蔵)。エンドポイントレベルのマルチテナンシー(トークンクォータ)による利用率の最適化や、高可用性推論にも対応しています。
- ガバナンスとモニタリング:業界で最も包括的な標準搭載メトリクス(振る舞い指標・運用指標)、エージェント実行パスのトレーシング機能、フルリネージ/バージョニングと監査ログ、セキュリティ・運用・コンプライアンスの各リスクに対する業界トップレベルのガバナンスをリアルタイム介入と自動レポートで実現。
- セキュリティとアイデンティティ管理:OAuth 2.0による統合ID・アクセス管理、リソース全体にわたる最小権限のきめ細かなRBAC、暗号化ボールトによるシークレット管理を備えています。
エンタープライズグレードの包括的なエージェント構築機能
- ビルダーツール:主要フレームワーク(LangChain、CrewAI、LlamaIndex、NVIDIA NeMo Agent Toolkit)をサポートし、MCP、認証、マネージドRAG、データコネクタを標準搭載。Nebius Token Factory連携により、構築中のオンデマンドモデル利用も可能です。
- 評価とトレーシング:LLM-as-a-Judge、Human-in-the-Loop、Playground/APIによる業界トップレベルの評価機能とエージェントトレーシング。振る舞い指標(タスク遵守度など)と運用指標(レイテンシ、コスト)を包括的に提供し、カスタムメトリクスにも対応。
- 標準搭載の本番対応機能:エンタープライズフックが、インフラ、セキュリティ、認証、データの複雑さを抽象化。エージェントは1コマンドでデプロイでき、DataRobotがコンポーネントのデプロイからエージェント全体および個別コンポーネント/ツールレベルでのモニタリング・ガバナンスの組み込みまでを処理します。
エンタープライズ AIファクトリーを使った構築とデプロイ
他の環境で構築済みのエージェントやオープンソースの業界特化モデルを、AIファクトリー上でスケーラブルかつセキュアにガバナンスを効かせてデプロイしたいですか?あるいは、本番化に必要な作業を気にせずエージェントを構築したいですか?このセクションでは、その両方の方法をご紹介します。
1. Nebius上のDataRobot STS
DataRobotシングルテナントSaaS(STS)はNebius Managed Kubernetes上にデプロイされ、GPU対応ノードグループ、高性能ネットワーキング、AIワークロードに適したストレージオプションがバックエンドとして利用可能です。専用NVIDIAクラスタ(H100、H200、B200、B300、GB200 NVL72、GB300 NVL72)により、テンソル並列処理やKVキャッシュを多用する推論パターンを効率的に処理でき、InfiniBand RDMAによる高スループットのクロスノードスケーリングにも対応しています。DataRobot/Nebiusパートナーシップは、以下のような堅牢なAIインフラストラクチャを提供します。
- マネージドKubernetes:GPU対応スケジューリングにより、STSのインストールとアップグレードを簡素化。NVIDIAオペレーターが事前構成済み。
- 専用GPUワーカープール:(H100、B200など)高負荷のSTSサービス(LLM推論、ベクターデータベース)を汎用CPU専用ワークロードから分離。
- 高スループットのネットワーキングとストレージ:大規模モデルアーティファクト、エンベディング、継続的な評価とログ記録のためのテレメトリをサポート。
- セキュリティとテナンシー:STSは専用テナント境界を使用し、Nebius IAMとネットワークポリシーによりエンタープライズ要件に対応。
- ノードヘルスモニタリング:GPU/ネットワークの問題をプロアクティブに検知・対処し、クラスタの安定稼働とスマートなメンテナンスを実現。
2. ガバナンス・モニタリングを備えたモデル推論デプロイ
生成AIの課題は、モデルを動かすことではなく、組織が求めるモニタリング・ガバナンス・セキュリティと同等の水準で動かすことにあります。DataRobotのNVIDIA NIM連携では、NGCからNIMコンテナをNebiusのGPU上にわずか4クリックでデプロイできます。
1. Registry > Modelsで「Import from NVIDIA NGC」をクリックし、NIMギャラリーを閲覧。
2. モデルを選択し、NGCモデルカードを確認、パフォーマンスプロファイルを選択。
3. NIMの要件に基づいて自動推奨されたGPUリソースバンドルを確認。
4. 「Deploy」をクリックし、サーバーレス環境を選択してデプロイ。

デプロイ済みモデルの標準搭載オブザーバビリティとガバナンス
- 自動モニタリングとリスク評価:NeMo Evaluatorとの連携により、モデルの忠実性(faithfulness)、根拠性(groundedness)、関連性(relevance)を自動スコアリング。バイアス、PII、プロンプトインジェクションのリスクも自動検知。
- リアルタイムモデレーションと高度なオブザーバビリティ:DataRobotはNIMのモデレーションとモニタリング基盤を提供。PII、プロンプトインジェクション、有害コンテンツ、コンテンツセーフティに対する標準搭載のガードを展開。OTel準拠のモニタリングにより、NIMの運用健全性、品質、安全性、リソース使用状況を可視化。
- エンタープライズガバナンスとコンプライアンス:DataRobotは、組織全体での安全なスケーリングに必要な管理レイヤーを提供。モニタリングと評価のデータをコンプライアンスドキュメントに自動集約し、パフォーマンスを規制基準にマッピングすることで、監査やレポーティングに対応。
3. Workload APIによるエージェントデプロイ
MCPツールサーバー、LangGraphエージェント、FastAPIバックエンド、LLMとcuOptやPhysicsNemoなどのドメイン特化ライブラリを組み合わせた複合システム——これらはモデルではなくコンテナであり、本番環境への独自のパスが必要です。Workload APIなら、オートスケーリング、モニタリング、RBACを備えたガバナンス付きエンドポイントを、1回のAPIコールで作成できます。
curl -X POST "${DATAROBOT_API_ENDPOINT}/workloads/" \
-H "Authorization: Bearer ${DATAROBOT_API_TOKEN}" \
-H "Content-Type: application/json" \
-d '{
"name": "agent-service",
"importance": "HIGH",
"artifact": {
"name": "agent-service-v1",
"status": "locked",
"spec": {
"containerGroups": [{
"containers": [{
"imageUri": "your-registry/agent-service:latest",
"port": 8080,
"primary": true,
"entrypoint": ["python", "server.py"],
"resourceRequest": {"cpu": 1, "memory": 536870912},
"environmentVars": [
],
"readinessProbe": {"path": "/readyz", "port": 8080}
}]
}]
}
},
"runtime": {
"replicaCount": 2,
"autoscaling": {
"enabled": true,
"policies": [{
"scalingMetric": "inferenceQueueDepth",
"target": 70,
"minCount": 1,
"maxCount": 5
}]
}
}
}'
エージェントは /endpoints/workloads/{id}/ ですぐにアクセス可能となり、モニタリング、RBAC、監査証跡、オートスケーリングが即座に有効になります。
デプロイ済みエージェントワークロードの標準搭載オブザーバビリティとガバナンス
DataRobotは、エージェントワークロードに対する堅牢なガバナンスとオブザーバビリティを提供することで、AIファクトリーの中核を担います。
- オブザーバビリティ(OTel標準):DataRobotはOpenTelemetry(OTel)——ログ、メトリクス、トレース——を標準化し、デプロイされたすべてのエンティティに対して一貫性のある高精度なテレメトリを確保します。
- エージェント固有メトリクス:エージェントタスク遵守度(Agent Task Adherence)やエージェントタスク精度(Agent Task Accuracy)など。
- トレーシングとロギング:OTel準拠のトレーシングにより、コンテナレベルのログと実行スパンを紐づけ、複雑なロジックループ内の根本原因分析を容易にします。
• ガバナンスとアクセス制御:DataRobotは、OAuthベースのアクセス制御とRBACを組み合わせ、デプロイ済みエージェント全体にエンタープライズ規模の認証・認可プロトコルを適用します。
4. エンタープライズ対応のエージェント構築機能
Nebius上のエージェントワークフォースプラットフォームによる包括的なビルダーツールキット
DataRobot のエージェントワークフォースプラットフォームは、既存のワークフローを拡張することで開発者のエージェント構築を加速します。複雑なマルチエージェントワークフローからシンプルな単機能ボットまで、多様なツールと環境に対応するビルダーキットを提供しています。
キットのネイティブサポートには以下が含まれます。
- オープンソースフレームワーク:LangChain、CrewAI、LlamaIndexとのネイティブ連携。
- NAT(Node Architecture Tooling):DataRobot独自のモジュラー型ノードベースエージェント設計フレームワーク。
- 高度な標準機能:スキル、MCP(Model Context Protocol)によるデータ/ツール連携、バージョニング/最適化のための堅牢なプロンプト管理。
Nebiusの利点:DataRobotのAgent Workforce PlatformはNebius Token Factoryと連携しており、開発者は実験フェーズにおいてNemotron 3(およびその他のオープンソースモデル)をトークン従量課金で利用できます。これにより、大規模なインフラプロビジョニングなしに、高速かつ低コストなイテレーションが可能です。完成したエージェントは、Token Factoryからエンタープライズスケールかつ低レイテンシの専用デプロイ環境(例:NVIDIA NIM)へシームレスに移行できます。
はじめ方:Node Architecture Tooling(NAT)を使えば、構築はシンプルです。エージェントノードをYAMLで構造化されたテスト可能なステップとして定義します。
まず、Nebius Token FactoryにデプロイしたLLMをDataRobotに接続し、DataRobot CLIでエージェントスターターアプリケーションにDataRobotデプロイメントを追加します。

DataRobot CLIを使い、構築したAgentic Starter ApplicationにDataRobotのデプロイ機能(デプロイメント)を組み込みます。

functions:
planner:
_type: chat_completion
llm_name: datarobot_llm
system_prompt: |
You are a content planner. You create brief, structured outlines for blog articles.
You identify the most important points and cite relevant sources. Keep it simple and to the point -
this is just an outline for the writer.
Create a simple outline with:
1. 10-15 key points or facts (bullet points only, no paragraphs)
2. 2-3 relevant sources or references
3. A brief suggested structure (intro, 2-3 sections, conclusion)
Do NOT write paragraphs or detailed explanations. Just provide a focused list.
writer:
_type: chat_completion
llm_name: datarobot_llm
system_prompt: |
You are a content writer working with a planner colleague.
You write opinion pieces based on the planner's outline and context. You provide objective and
impartial insights backed by the planner's information. You acknowledge when your statements are
opinions versus objective facts.
1. Use the content plan to craft a compelling blog post.
2. Structure with an engaging introduction, insightful body, and summarizing conclusion.
3. Sections/Subtitles are properly named in an engaging manner.
4. CRITICAL: Keep the total output under 500 words. Each section should have 1-2 brief paragraphs.
Write in markdown format, ready for publication.
content_writer_pipeline:
_type: sequential_executor
tool_list: [planner, writer]
description: A tool that plans and writes content on the requested topic.
function_groups:
mcp_tools:
_type: datarobot_mcp_client
authentication:
datarobot_mcp_auth:
_type: datarobot_mcp_auth
llms:
datarobot_llm:
_type: datarobot-llm-component
workflow:
_type: tool_calling_agent
llm_name: datarobot_llm
tool_names:
- content_writer_pipeline
- mcp_tools
return_direct:
- content_writer_pipeline
system_prompt:
Choose and call a tool to answer the query.
評価機能:その実践方法
構築は半分にすぎません。残り半分は「それが正しく機能するか」を知ることです。DataRobotの評価フレームワークは、単純な「いいね/よくない」を超えた、データドリブンな検証を提供します。
エージェントを評価するには、以下の方法があります。
- 1. テストスイートの定義:期待されるクエリと正解データ(Ground Truth)からなる「ゴールデンデータセット」をアップロード。
- 2. 自動メトリクス:忠実性、関連性、有害性に対するビルトイン評価器でエージェントを自動テスト。
- 3. LLM-as-a-Judge:「批評家」モデルを使用して、独自の評価基準(例:「エージェントはブランドのトーン&ボイスに従っていたか?」)に基づいてエージェントの応答を採点します。
- 4. サイドバイサイド比較:同一データセットに対して2つのバージョンのエージェント(例:NAT版とLangChain版)を実行し、コスト、レイテンシ、精度を1つのダッシュボードで比較。
エンタープライズフック:初日から本番対応
DataRobotは、ノートブック環境と本番サービスの間に立ちはだかる「本番化に伴う運用負荷」——セキュリティ、ログ記録、認証——を、構築時に組み込む「フック」で自動化します。
- オブザーバビリティ:OTel準拠のトレーシングがすべてのステップを自動的にキャプチャ。ボイラープレートコードは不要。
- ID管理と認証:OAuth 2.0とサービスアカウントを標準搭載し、エージェントが社内API(CRM、ERPなど)を呼び出す際にユーザーの実際の権限を使用することで、厳格なセキュリティを維持。
- 本番環境への移行:デプロイ時に、環境、コンポーネント、認証フックをセキュアでガバナンスの効いたコンテナにパッケージング。開発から本番まで一貫性のあるエージェントを保証。複雑なエージェントは自動的にパースされ、オーケストレーションされた複数コンテナとしてきめ細かなモニタリングが可能でありながら、単一のパイプラインエンティティとしてデプロイされます。
ガバナンスを備えたスケーラブル推論
DataRobotとNebiusのパートナーシップは、NVIDIAアクセラレーテッドコンピューティング上に構築された、検証済みのエンタープライズ対応デプロイスタックをエージェンティックAI向けに提供します。実験フェーズを超え、継続的な本番推論へと進むチームにとって、ガバナンスとスケーラビリティを両立した確かな道筋となります。
本内容に関するプレスリリースもご覧ください。