Covalent


ワークロードを最もコスト効率の高いインフラストラクチャに動的にマッチング。コストを最適化するためにランタイムを手動で設定する方法では、スケーリングに対応できません。Covalent OSS は、価格、レイテンシー、タスクの要件に基づいて、ワークロード(スポットノード、予約済みノード、レガシーノード)を自動ルーティングすることで、コンピューティングコストを削減します。設定ファイルもスクリプトも不要で、手間もかかりません。

クラウドやリージョン間でタスクをルーティング、インフラストラクチャの管理は不要。書き換えや再設定を行わずに、クラウド、リージョン、オンプレミス間でワークロードを実行できます。各タスクは、動的なランタイム制約に基づいて、Python で定義された DAG から最適な環境に直接ディスパッチされます。

インフラストラクチャコードではなく、Python コードを作成。YAML、クラウド設定、インフラストラクチャコードを使わずに、複数ステップからなる動的なワークフローを Python で完全に定義できます。Covalent 側でコンテナ化、パッケージ化、実行が処理されるため、DevOps の専門知識は必要ありません。

LLM のファインチューニングにおいて、一時停止、再開、スケーリングが可能。オーケストレーションコードを記述せずに、マルチノード GPU トレーニングを開始できます。実行中にチェックポイントの一時停止、再開、抽出を行い、コンピューティングの無駄を抑えます。Covalent は、長時間実行されるジョブを完全に制御できるため、最初からやり直さずに反復処理を行うことが可能です。

リアルタイムで可視化し、迅速にデバッグ。実行中のすべてのタスクを追跡し、実行内容、失敗内容、失敗の原因を把握します。問題を早期に発見し、エラーを即座に追跡して、実行中に結果の一部を確認することができます。ワークフロー全体が失敗するのを待たずに、実行中に情報に基づいた調整を行えます。

コードを書き換えずに、再利用、再実行、共有。リファクタリングや再作業を行わずに、どこにおいてもワークフローの再利用が可能です。一度ビルドすれば、Redispatch を使用して複数の環境全体において一貫した動作で再実行されます。チームメンバーは、互換性のあるインフラストラクチャで実行している限り、同じ結果を得ることができます。

環境に依存しないワークフローで、どこでも実行。ワークフローを書き換えずに、オンプレミス、Kubernetes、パブリッククラウドなど、あらゆる環境にデプロイできます。Covalent のプラガブルエグゼキューターは、AWS、GCP、Azure、カスタムバックエンドをサポートしており、柔軟なハイブリッド/マルチクラウド構成を可能にします。

オープンソースのインフラストラクチャで状況に応じてオーケストレーションを実施。オープンソースのオーケストレーションを使用して、既存のツールやワークフローと統合します。Covalent は、独自の形式やプラットフォームの制約に縛られずに、お客様のインフラストラクチャ、CI/CD パイプライン、オブザーバビリティスタックと連携します。
