半教師あり機械学習

半教師あり機械学習とは

半教師あり機械学習とは、教師あり機械学習手法と教師なし機械学習手法を組み合わせたものです。

より一般的な教師あり機械学習手法では、各レコードに結果情報が含まれている「ラベル付き」データセットに基づいて機械学習アルゴリズムトレーニングします。これにより、アルゴリズムは、すでに持っている情報に基づいてパターンを推測し、ターゲット変数とデータベースの残り部分との関係を特定できます。一方、教師なし機械学習アルゴリズムは、結果変数のないデータセットから学習します。半教師あり機械学習では、アルゴリズムはラベル付きデータとラベルなしデータの両方を含むデータセットから学習します(通常、大半はラベルなしデータです)。

Why is Semi-Supervised Machine Learning Important?

When you don’t have enough labeled data to produce an accurate model and you don’t have the ability or resources to get more data, you can use semi-supervised techniques to increase the size of your training data. For example, imagine you are developing a model intended to detect fraud for a large bank. Some fraud you know about, but other instances of fraud are slipping by without your knowledge. You can label the dataset with the fraud instances you’re aware of, but the rest of your data will remain unlabelled:

半教師あり学習 1

You can use a semi-supervised learning algorithm to label the data, and retrain the model with the newly labeled dataset:

半教師あり学習 2

Then, you apply the retrained model to new data, more accurately identifying fraud using supervised machine learning techniques. However, there is no way to verify that the algorithm has produced labels that are 100% accurate, resulting in less trustworthy outcomes than traditional supervised techniques.

半教師あり機械学習 + DataRobot

トレーニングデータセットに既知の結果を含むレコードが数千行あり、結果を含まないレコードがさらに数千行ある場合、DataRobot の自動機械学習プラットフォームを使用することで、より多くのデータにラベルを付けることができます。ラベル付きデータに基づいて迅速にモデルが作成され、ラベルなしデータに適用されます。そして、そのデータを使用して、より多くのモデルがトレーニングされます。これによって、アナリストやデータサイエンティストがデータセットに手動でラベルを付けるための時間が大幅に短縮され、効率性と生産性が向上します。

{“@context”:”https://schema.org”,”@type”:”FAQPage”,”mainEntity”:[{“@type”:”Question”,”name”:”What is the difference between supervised and unsupervised machine learning?”,”acceptedAnswer”:{“@type”:”Answer”,”text”:”Unsupervised ML is used when the right answer for each data point is either unknown or doesn’t exist for historical data. Supervised ML is used when the right answer is known for historical data.”}},{“@type”:”Question”,”name”:”What is supervised machine learning?”,”acceptedAnswer”:{“@type”:”Answer”,”text”:”Supervised machine learning uncovers insights, patterns, and relationships from a dataset that contains a target variable, which is the outcome to be predicted.”}}]}