デジタル・クオンツ:JointFM が実現する即時ポートフォリオ最適化

本ブログはグローバルで公開された「The digital quant: instant portfolio optimization with JointFM」の抄訳版です。

要約

JointFM は、多変量時系列システムにおける「ゼロショット共同分布予測」を実現した世界初の AI ファウンデーションモデル(基盤モデル)です。わずか数ミリ秒で整合性のある将来シナリオを生成できるため、従来の数値シミュレーションのようなタイムラグなしに、リアルタイムでのポートフォリオ意思決定を可能にします。JointFM は、クオンツモデリングにおけるパラダイムシフトを象徴する存在です。合成的な確率微分方程式(SDE)の無限のダイナミクスで学習された JointFM は、まさにあなたの「デジタル・クオンツ」として機能するのです。

背景:クオンツモデリングに新たなアプローチが必要な理由

複雑なシステムのモデリングには、従来、痛みを伴うトレードオフがつきものでした。相関コピュラや結合 SDE といった古典的なクオンツ手法は、数学的な忠実度は高いものの、硬直的で速度が遅く、コストもかさみます。市場環境や資産構成が変わるたびにモデルを再構築するための専門チームが必要になることも少なくありません。一方で、既存の時系列基盤モデルはスピードと柔軟性に優れていますが、単一のターゲットに特化しているため、システムリスクを定義する上で不可欠な「変数間の相互依存関係」を見落としてしまうという欠点がありました。

JointFMは、このギャップを埋める「デジタル・クオンツ」です。 合成確率微分方程式(SDE)から生成される無限のストリームで事前学習されたJointFMは、時系列ダイナミクスの普遍的な法則を学習しており、真にドメイン非依存なモデルです。電力網であれ株式ポートフォリオであれ、システムの完全な共同確率分布を数ミリ秒で予測できるようになります。電力網であっても株式ポートフォリオであっても、システム全体の同時確率分布をミリ秒単位で予測します。これは、高度に複雑な環境における「即時的意思決定」の基盤であり、アドホックなビジネス判断を行うエージェントとの統合にも十分な速度を備えています。

図1:JointFMは、合成クオンツモデルのダイナミクスを用いて事前学習された、あなたの「デジタル・クオンツ」です
図1:JointFMは、合成クオンツモデルのダイナミクスを用いて事前学習された、あなたの「デジタル・クオンツ」です。

本プロジェクトでは、NVIDIA のクオンツ・ポートフォリオ最適化ブループリントをベースに、金融クオンツにおける JointFM の威力を実証します。JointFM は「即時ポートフォリオ最適化(Instant Portfolio Optimization: IPO)」を可能にし、脆弱な夜間のバッチ処理をデジタル・クオンツへと置き換えます。これにより、再学習なしでリアルタイムにポートフォリオをリバランスし、新しい資産や市場環境に適応することが可能になるのです。

主な成果

  • 同時分布に対する世界初のゼロショット基盤モデル: JointFM は、相関関係やテールリスクを捉えつつ、多変量分布全体を即座に予測します。
  • ポートフォリオ規模での即時シミュレーション: ポートフォリオの複雑さに依存せず、数ミリ秒で数千もの整合性のある将来シナリオを生成。リアルタイムの意思決定や AI エージェントへの統合を支えます。
  • 古典的なベンチマークに匹敵するリスク調整後リターンを達成: 200 回の制御された合成データ試行において、JointFM はベンチマークと同等のリスク調整後パフォーマンスを達成しました。
  • 合成確率プロセスによる事前学習: 数百万もの生成されたダイナミクスから学習することで、JointFMは再学習なしで新しい資産や市場環境に汎化できます。
  • 金融モデリングから金融 AI へ: JointFM は、従来のパイプラインを、スケーラブルでドメインに依存しない基盤モデルへと置き換えます。

本質的な課題:スピード、忠実度、そして柔軟性

金融クオンツにおいて、ポートフォリオマネージャーは長らく特有の「トリレンマ」に直面してきました。

  1. 高速だが欠陥がある: 幾何ブラウン運動(GBM)のようなモデルは計算負荷が低い反面、正規分布や一定の相関を前提としています。資産間の相関が急まり、ファットテール(太い裾)が現れる市場暴落時には、無残にも失敗するものです。
  2. 高精度だが遅い: 複雑なコピュラやレジーム・スイッチングを用いた重厚なモンテカルロ・シミュレーションは、現実をより正確に捉えますが、校正(キャリブレーション)と実行に多大な時間を要します。短時間でポートフォリオのリバランスが必要な場面では、実用的とは言えません。
  3. 硬直的で高コスト: 高精度なモデルの開発には、専門のクオンツチームと多大な時間、そして資金が必要です。さらに悪いことに、これらのモデルは脆弱です。市場環境が変化したり、アセットクラスを入れ替えたりする場合、多くの場合ゼロからモデリングをやり直す必要があるのです。

JointFM の登場:同時分布のための基盤モデル

JointFM は、モデリングのステップを「スキップ」することでゲームのルールを変えます。毎日各時系列のパラメータをフィッティングする代わりに、JointFMは事前学習済みモデルとして、未知のデータに対しても追加学習なしに汎化します。ここでは金融市場に適用していますが、モデル自体はドメインに依存しません。JointFMが学習しているのは、株式のティッカーシンボルではなく、確率過程の「言語」そのものです。

イノベーションの本質

これまで、共同分布のモデリングには大きな妥協が必要でした。複雑な SDE システムを定義するか(数学的に困難)、特定のデータセットに古典的なモデルを適合させるか(低速で再学習が必要)、あるいはコピュラを使用するか(個別対応が必要で硬直的)のいずれかでした。

これらのいずれもゼロショットではありません。

一方で、既存の基盤モデルはゼロショットであっても、変数間の相互依存関係を捉えることができません。JointFM はこの隔たりを解消する初めてのモデルであり、基盤モデルが持つスケールとゼロショットの速度を維持しながら、厳密な共同確率フレームワークという数学的深みを備えているのです。

このゼロショット能力こそが、硬直性の問題を解決します。基礎となるダイナミクスが不明な新しい市場環境に直面した場合や、モデリングが困難な資産を即座に入れ替えたい場合でも、JointFM は同様に機能します。多様な事前学習を通じてあらゆるダイナミクスから将来の共同分布を予測することを学んでいるため、専門のクオンツチームを介さずとも、未知の環境に対する最良の出発点となるのです。

主要な機能

  • 同時分布予測: 変数ごとに個別の確率を予測する標準的な単変量モデルとは異なり、JointFM はすべての変数の完全な多変量分布を同時に明示的にモデリングします。金融において、これは分散投資を行う上で極めて重要です。資産がどのように連動するかを理解せずして、ポートフォリオを最適化することはできません。
  • ゼロショット推論: ユーザーのデータによる学習は不要です。モデルは事前学習を通じてすでに「すべてを経験済み」です。
  • シナリオ・スライシング: 外部要因(例:「外部要因が上昇した場合の変数分布を表示せよ」など)に基づいて予測を条件付けることが可能です。

時系列やテーブルデータの基盤モデルについて詳しく知りたい方は、生成AIデータサイエンス革命に関する記事もぜひご覧ください。JointFM のようなモデルがなぜ次なる論理的なステップであるかが詳しく解説されています。

内部構造:アーキテクチャとスピード

JointFM は、多変量時系列特有の高次元な制約を処理するために設計された、専用の Transformer ベースのアーキテクチャを採用しています。

1. 効率的な高次元コンテキスト

多数の資産と長い履歴ウィンドウを持つポートフォリオをモデリングするため、JointFM は標準的なアテンション機構の計算量問題を克服しました。ファクタリングされたアテンション戦略を用いることで、時間的なダイナミクスと変数間の依存関係を効率的に分離しています。これにより、数百の資産を計算のボトルネックなしに処理できる線形のスケーラビリティを実現しています。

2. ファットテール対応の分布ヘッド

現実世界のデータが正規分布に従うことは稀であり、多くの場合、裾が重く歪みが生じます。JointFM は、堅牢でファットテールな多変量分布をパラメータ化できる柔軟な出力レイヤーを備えています。これにより、正確なリスク評価に不可欠な「ブラックスワン(極端な事象)」の確率を自然に捉えることができるようになります。

3. 即時結果のための並列デコーディング

スピードこそが、即時ポートフォリオ最適化を実現する鍵です。このモデルは、将来のすべての期間を単一のフォワードパスで同時に予測できるよう最適化されています。従来の逐次的な生成モデルとは異なり、GPU 上で数ミリ秒以内に数千もの整合性のある市場シナリオを生成できるのです。

成功の秘訣:合成データによる事前学習

なぜ JointFM は、実データを見ることなくこれほどまでに高い性能を発揮できるのでしょうか。その答えは「合成データによる事前学習」にあります。

歴史的な実データは、有限でノイズが多く、特定の時期(レジーム)に偏りがちです。真に汎用的な基盤モデルを構築するため、JointFM は柔軟なエンジンによって生成された無限の合成データカリキュラムで学習されています。

  • SDESampler: システムの核となる部分です。ジャンプ、複雑なドリフト、経路依存のメモリなどを備えた複雑な確率微分方程式(SDE)を生成します。
  • FinanceSampler: 金融特有のアセットクラスに対応するための専用サンプラーです。今回のベンチマークでは、株式、貴金属、外国為替(FX)といった基本的なアセットクラスを選択しています。
  • カスタム拡張性: 金融以外にも、気象、エネルギー、センサーデータなど、異なるドメインをターゲットにしたサンプラーの構築も可能です。

このアプローチにより、モデルは何百万ものレジームにさらされ、単なる過去パターンの暗記ではなく、時系列ダイナミクスの「根本的な物理」を学習することになるのです。

パフォーマンス評価:古典的な手法との比較

JointFM で最適化したポートフォリオと、古典的な幾何ブラウン運動(GBM)で最適化したポートフォリオを比較しました。

実験設定

NVIDIA のブループリントを参考に、GBM シミュレーションと Mean-CVaR 最適化を利用しつつ、シナリオ生成エンジンとして JointFM を採用しました。入力データには FinanceSampler による合成データと、S&P 500 の実際の株価データを使用しています。

図2:実験アーキテクチャ。この図は、合成データを用いた主要な実験における構成を示しています
図2:実験アーキテクチャ。この図は、合成データを用いた主要な実験における構成を示しています。

1. 入力:

  • 合成データによる現実: FinanceSampler(確率的ボラティリティ、相関ドリフトなどを持つSDE)を使用して複雑な資産履歴を生成します。これにより、客観的な評価のための将来の可能性のグラウンドトゥルース多元宇宙が確保されます。
  • 実データ(二次的検証): 実際の過去リターン(S&P 500)も取り込み、モデルがノイズの多い不完全な実世界に汎化することを確認します。

2. 推論:

  • GBM — NVIDIAブループリントからの古典的SDE キャリブレーションとパス生成。
  • JointFM — 類似しているが同一ではない合成物理で学習されたモデルが、ミリ秒単位で10,000以上のもっともらしい将来のリターンシナリオを生成します。資産を支配する統計法則を深く理解した「未来のオラクル」として効果的に機能します。

3. リスク最適化:

  • Mean-CVaR(条件付きバリュー・アット・リスク)オプティマイザーが、リスク調整後リターンを最大化する(期待リターンとテールリスクのバランスをとる)ポートフォリオウェイトを求解します。

4. 実行とスコアリング:

  • 最適ウェイトを既知の将来に展開します:
    • 合成データのグラウンドトゥルースは、実験ステップごとに数千のシナリオで評価を提供します。
    • 実データは、各過去の実験に対して一つの既知の将来を持ちます。

速度:将来をインスタントにシミュレーション

JointFMはミリ秒単位でシナリオを生成し、比較的シンプルな幾何ブラウン運動(GBM)シミュレーションよりも桁違いに高速です。

図3:シミュレーション時間の比較。この図は、GBM(幾何ブラウン運動)シミュレーションに要する時間と、JointFMの予測に要する時間を比較したものです
図3:シミュレーション時間の比較。この図は、GBM(幾何ブラウン運動)シミュレーションに要する時間と、JointFMの予測に要する時間を比較したものです。時間は、使用する将来のサンプル数に依存します。

このアーキテクチャ上の優位性により、市場変動への迅速な対応が可能となり、高度なシミュレーションとポートフォリオ最適化をAIエージェントに直接統合することが実用的になります。その結果、投資家は追加の運用オーバーヘッドなしに、投資判断をリアルタイムで探索・議論することができます。

周辺分布に関する性能:個別資産の視点

JointFMは、複雑な資産の周辺分布をある程度回復します。以下に、ある1回のシミュレーション/予測における各パーセンタイルおよび2つのランダムな資産のQ-Q(分位点-分位点)プロットを示します。

周辺予測の精度をさらに向上させることを明確に目指していますが、ここで理解すべき重要な点が2つあります:

  1. 金融資産のダイナミクスは、予測が非常に困難であることで知られています(ここでは63日先を予測)。
  2. 周辺予測だけが優れていても、リスク管理にはあまり役立ちません。資産間の相関を捉えることが不可欠です。
図4:個別事例におけるパフォーマンス。周辺分布に基づく2つのモデリング手法を比較したQ Qプロット
図4:個別事例におけるパフォーマンス。周辺分布に基づく2つのモデリング手法を比較したQ Qプロット。

高次元の同時確率分布を直接比較することは現実的ではありません。代わりに、JointFMがポートフォリオ最適化に対して一貫した信頼性の高い予測を提供し、ベースラインの定量的手法と同等以上の結果を出すことを示すシンプルなデモンストレーションを提示します。

ポートフォリオ評価(合成データのグラウンドトゥルース)

性能を厳密に評価するため、真の将来の同時分布が既知である合成データを使用して、200回の繰り返しポートフォリオ最適化試行を実施しました。この制御された環境により、JointFMが生成したポートフォリオと我々のベースラインを、グラウンドトゥルースの最適解と直接比較することができます。

結果

  • 単純リターン: JointFMポートフォリオは、平均で1.17%高いリターンを達成しました。
  • リスク調整後リターン: シャープレシオはほぼ同一です。JointFMはわずかに良好なリスク調整後リターンを示しています。
図5:系統的比較。この比較は、単純収益率(左)とリスク調整後収益率(右:シャープレシオ)を通じて評価された、GBM(幾何ブラウン運動)に対する
図5:系統的比較。この比較は、単純収益率(左)とリスク調整後収益率(右:シャープレシオ)を通じて評価された、GBM(幾何ブラウン運動)に対するJointFMのパフォーマンスを強調しています。

合成オラクルデータにおいて、JointFMポートフォリオは平均で1.17%高いリターンを示しましたが、リスク調整後リターン(シャープレシオ)はほぼ同一であり、このアウトパフォーマンスはより多くのリスクテイクに起因しています。より重要な指標であるリスク調整後リターンにおいてほぼ同等のパフォーマンスを示したことから、JointFMの初期バージョンは、ベースラインのアプローチに対する高速、低コスト、柔軟、かつシンプルなドロップイン代替として機能することが示されました。

実世界でのサニティチェック

我々のモデルが学習元の特定の合成問題の解決にしか優れていないという懸念に対処するため、実際のS&P 500データ(Yahoo Finance)で検証を行いました。S&P 500の391銘柄のユニバースから、10銘柄をランダムに抽出し、200の異なる期間にわたってテストしました。

結果

JointFMポートフォリオは、合成テストデータセットでの性能と同様に、より高い単純リターンを示しました。リスク調整後リターンは比較対象とほぼ同等であり、わずかにアウトパフォームしています。これにより、モデルが特定のデータ生成プロセスを記憶しているのではなく、ボラティリティと相関の汎化可能なルールを学習していることが確認されました。

図6
図6:S&P 500株価データの比較。この図は、S&P 500のデータにおけるJointFMとGBMのパフォーマンスを比較したもので、単純収益率(左)とリスク調整後収益率(右:シャープレシオ)を示しています。

まとめ:インスタント・ポートフォリオ最適化

硬直的な統計的仮定を柔軟な事前学習済み基盤モデルに置き換えることで、JointFMは新しいクラスのトレーディングおよびリスク管理エージェントを実現します。これらのエージェントは、価格変動に単に反応するのではなく、最適な進路を見つけるために将来の多元宇宙を即座に再シミュレーションします。JointFMは、大規模な科学的モデリングを学習段階にフロントローディングすることで、推論実行をほぼ瞬時に行うことを可能にし、大幅な推論の高速化を実現します。

これは、金融モデリング(方程式のフィッティング)から金融AI(基盤モデルの活用)への移行を意味しており、現代の市場が求める速度と、生存に必要な深さの双方を提供します。

ご質問がございましたら、https://www.datarobot.com/jp/contact-us/までお問い合わせください。

AI で迅速にビジネス価値向上を実現。今すぐ始めましょう。