データサイエンティスト
米国大学研究員を経て、外資系コンサルティングファームでコンサルタント兼データサイエンティストとして AI Team の立ち上げを経験し、小売・製造・ヘルスケア等様々な業界向けに需要予測・レコメンデーション・営業戦略立案などに従事。 2021年から DataRobot 社のデータサイエンティストとしてテレコム・鉄道系のインダストリーを担当し、AI・データ利活用を推進している。 AI・データ利活用などについての講演活動も各所で行っている。
「データのパーティション」には多くの種類とそれぞれに特性があります。本稿では適切なパーティションを選択するために、各パーティションの手法ごとに利用シーンやメリット・デメリットを考察します。
モデリングを行う際に結果に大きく影響を与えるのが「データのパーティション」です。パーティションは特徴量エンジニアリングなどと異なり、表面上に見えにくいため軽視されがちですが、適切なパーティションを選ばないことにより運用で痛手を負うケースがあります。