多値分類

多値分類とは?

分類アルゴリズムには、二値と多値の 2 つのタイプがあります。多値分類では、各レコードは 3 つ以上のクラスのいずれかに属し、アルゴリズムの目標は、与えられた新しいデータポイントが分類されるクラスを正確に特定する機能を構築することです。

たとえば、多値アルゴリズムは、映画が指定される可能性の高い保護者向けのガイドラインレーティング(「PG」、「TV-14」、「R」、「G」など)を以下のサンプル映画データセットから学習するパターンに基づいて判断します。

サンプル動画データセット

映画には、「General Audience(一般観衆向け)」、「Suitable for all ages(全年齢向け)」などの説明もタグ付けされています。これは、各映画を 1 つまたは複数のタグカテゴリによって説明することができるレーティングシステムとは異なります。このシステムはマルチラベル分類問題として知られています。

多値分類が重要である理由

多値分類によって、アナリストはより多くのビジネス上の実課題について、機械学習からインサイトを得ることができます。たとえば、顧客が次に購入する製品を複数のオプションから予測できるため、収益の見込みを立て、それに従ってビジネスプラクティスとリソースを調整できます。

DataRobot + 多値

DataRobot の自動機械学習プラットフォームでは、ターゲット変数に適した分類手法が自動的にデフォルト設定され、データに対してさまざまな分類アルゴリズムが実行されます。次に、特徴量のインパクト機能が、クラス判別に最も重要な入力を明らかにします。また、混同行列がデータセットに対する各アルゴリズムの精度を示します。