シチズンデータサイエンティスト

シチズンデータサイエンティストとは

「シチズンデータサイエンティスト」ガートナー社が命名した用語であり、機械学習技術の実装を必要としている、または希望している高度なデータ分析の専門家やデータの専門家を指します。規模の大小を問わず、さまざまな業種の企業がデータ活用の促進に取り組んでいますが、熟練したデータサイエンティストは全世界で不足しています。そのため、企業はシチズンデータサイエンティストを育成するためのツールやサポートを提供し、データ分析の専門家やその他の情報関連エキスパートの能力強化を図っています。この用語自体は分類上使用される傾向が高く、自身が名乗るときに使用されることはほぼありません。

一般に、シチズンデータサイエンティストは営業、マーケティング、財務、人事などの事業部門に在籍し、各部門が直面しているビジネス課題に関して深い専門知識を持っています。これまでデータサイエンティスト、統計学者、または数学者を必要としていた作業においては、強力なソフトウェアを使用して詳細な診断分析を実行し、機械学習モデルを作成します。

シチズンデータサイエンティストは、多くの人工知能(AI)主導型企業でデータサイエンティストと連携して、詳細なビジネス専門知識を必要とするプロジェクトに取り組んでいます。これにより、従来の教育を受けたデータサイエンティストは、特定部門の KPI ではなく、企業全体に影響を及ぼす複雑なプロジェクトに専念できます。

シチズンデータサイエンティストが重要である理由

一般に、データ分析の専門家は、すでに発生したイベントに関するデータから傾向を見つけ(記述的分析)、その結果をダッシュボード、静的レポート、グラフで表します。しかし、現在は、データ分析の専門家よりも深く幅広くデータを活用できる強力なツールを利用することで、シチズンデータサイエンティスト、ソフトウェアエンジニア、データエンジニア、AI エンジニアでもビジネス上の問題を解決することができます。次善策の推奨、製品を購入する可能性が最も高い見込み客の特定、債務不履行になる可能性が最も高いローンの判定などを行うモデルの構築も可能です。シチズンデータサイエンティストの影響力は非常に大きく、ガートナー社では、シチズンデータサイエンティストによる高度分析の量とビジネス価値が2019 年中にデータサイエンティストによるものを上回ると予測しています。

DataRobot + シチズンデータサイエンティスト

データ分析の専門家は、部門の主なビジネス上の課題を認識できる深い専門知識を持ち、利用可能なデータを十分に理解していますが、すべてのデータサイエンスタスクを実行する十分な能力を持ち合わせているとは言えません。この点がアナリストとシチズンデータサイエンティストの違いです。DataRobot の自動機械学習ソフトウェアは、データサイエンスの博士号取得者が手作業で実行していたこれらのタスクとプロセスを複製し、ユーザーがコードを記述したりアルゴリズムを事前に選択しなくても機械学習ソリューションを実装できるようにします。

シチズンデータサイエンティストは、データセットを DataRobot にアップロードし、ターゲット変数を選択することで、解決したいと考えるビジネス上の実際の問題に基づいて理解を深めることができます。プラットフォームは、データの準備と前処理、特徴量エンジニアリング、モデルのトレーニングと検定に関するベストプラクティスを自動的に適用します。DataRobot は、データとターゲット変数に対して最も適切なアルゴリズムを選択し、精度に従ってトレーニング済みモデルにランク付けします。そのため、シチズンデータサイエンティストは、ビジネス上の問題に最も適したモデルを容易に解釈し、選択できます。DataRobot は、他の方法ではユーザーが気付かないであろうインサイトを自動的に見つけ出すだけでなく、ガードレールを維持してユーザーがモデルの出力を信頼できるようにします。

ビジネスアナリストからシチズンデータサイエンティストへの学習パス

データ分析の専門家からシチズンデータサイエンティストへの学習パス

Gartner 社は、2020 年までにデータサイエンスタスクの 40% 以上が自動化され、その結果、生産性が向上し、シチズンデータサイエンティスト、ソフトウェアエンジニア、データエンジニア、AI エンジニアによるデータと分析の利用が広がり、全体として組織の分析成熟度が高まると予測しています。