予測のスピードがその信頼性に及ぼす影響

機械学習のスピードには 2 つの意味があります。1 つはモデルの開発にかかる時間の長さ、もう 1 つはモデルを使用した予測結果のスコアリングにかかる時間の長さです。モデル開発時間の短縮は、モデルを使用して価値を実現するうえで主要な関心事の 1 つではありますが、モデルのパフォーマンスで重要なのは、予測結果のスコアリングにかかる時間です。

モデルスコアリングには、以下に説明する 2 つの代表的なパラダイムがあります。

バッチ予測
バッチ予測

1 つ目はバッチ予測と呼ばれます。新しいレコードが一括して送信され、モデルですべてを一度にスコアリングします。これは、毎日、毎週、毎月など、一定間隔で実行されます。バッチスコアリングでの一括処理の規模は極めて重要です。インフラストラクチャから見ると、数値およびカテゴリーデータを含む数百のレコードのスコアリングと、何ギガバイトものデータのスコアリングには圧倒的な差があります。スコアリングのスピードは、状況によって程度の差はあれ、モデルの選択において重要な要素と言えるでしょう。スコアリング処理を月 1 回実行していて、それに毎回 1 時間かかる場合、10 分の時間短縮に精度低下を甘受するだけの価値があるとはまず考えられません。巨大なデータセットのスコアリング処理を毎日実行している場合は、計算負荷の低いモデリング手法を使用して結果出力までの時間を短縮するほうが望ましいアプローチになる可能性があります。

リアルタイム予測
リアルタイム予測

リアルタイムで出力される予測結果に対するニーズはますます高まっているようです。1 つの例はデジタル広告です。1 回のクリックだけを頼りに、特定の広告を特定のユーザーに割り当てることもあります。リアルタイム予測のスコアリングでは、ミリ秒単位の違いがモデルの選択に影響する場合があります。

スピードはパズルの 1 ピースにすぎません

スピードは、生成される予測モデルの信頼性に直接寄与しますが、モデルパフォーマンスに必要な要素の 1 つにすぎません。その他の要素には次のようなものがあります。

信頼できる倫理的な AI を今すぐ実現しましょう