Feature Discovery header

Feature Discovery

Plus de précision grâce à la création automatique de variables dans des schémas de données complexes avec l’intervention de multiples sources de données.

La nouvelle génération de Feature Engineering automatisé

Feature Discovery est un outil automatisé de feature engineering d’un niveau inégalé. Qu’il s’agisse de schémas de données complexes ou de jeux de données de différentes sources, DataRobot découvre, teste et crée automatiquement des centaines de nouvelles variables précieuses pour vos modèles de machine learning. Il permet ainsi d’améliorer considérablement leur précision et de mieux comprendre votre donnée.

De meilleures variables, plus rapidement

Le feature engineering est l’une des tâches les plus importantes en data science. La réussite ou l’échec de vos projets de machine learning dépend bien souvent des variables que vous créez. Cependant, lorsqu’il est effectué manuellement, le feature engineering s’avère chronophage et laborieux. La création de chaque nouvel attribut implique de réaliser des tâches très complexes de préparation des données. Le feature engineering requiert également une validation minutieuse pour vous assurer que le processus est exempt d’erreur.

La fonctionnalité Feature Discovery de DataRobot accélère le feature engineering grâce à l’automatisation des bonnes pratiques qui ont été établies par des experts de la data science. Il se base sur les relations qui existent entre vos sources de données et au sein de schémas de données complexes pour générer intelligemment des variables adaptées à vos modèles, ce qui permet d’améliorer considérablement leurs performances globales.

Une fonctionnalité visuelle et intuitive

Feature Discovery permet aux data scientists, aux data engineers et aux business analysts d’exceller dans l’art du feature engineering. Grâce à l’éditeur du graphe de relations de DataRobot, vous pouvez sélectionner tous les jeux de données que vous souhaitez utiliser dans votre projet, puis indiquer les relations qui les lient en quelques clics. DataRobot vous suggère même des liens si vous ne connaissez pas ces relations à l’avance. Feature Discovery permet à tout le monde de définir facilement des schémas de données très complexes, puis de procéder à du feature engineering automatisé en quelques minutes.

FD7 e1605717117269 1

Prise en compte du contexte temporel

La fonctionnalité Feature Discovery de DataRobot tient compte des facteurs temporels. Si vos jeux de données ont une dimension temporelle, vous pouvez définir des créneaux de dérivation pour contrôler la quantité de données historiques qui doit être utilisée lors du calcul de nouvelles variables. Par exemple, vous pouvez demander à DataRobot de ne prendre en compte qu’une période de 30 jours lors de la prédiction des retards des compagnies aériennes pour chaque numéro de vol. Feature Discovery dispose également de garde-fous intégrés qui évitent les problèmes de fuite les plus courants, tels que l’exclusion de données futures lors de la génération de nouvelles variables.

FD5

Pratique, explicable et traçable

Comme toutes les fonctionnalités automatisées de la plateforme AI Cloud de DataRobot, Feature Discovery est incroyablement transparent. Elle vous permet de visualiser et d’explorer chaque variable générée pour comprendre son potentiel prédictif. Pour simplifier l’audit et la traçabilité, un linéage complet des données est également disponible pour chaque variable créée. Vous pouvez accéder à des registres des logs détaillés pour savoir exactement quelles variables ont été explorées, créées ou abandonnées. Par ailleurs, vous avez la possibilité de télécharger l’ensemble du jeu de données utilisé pour l’entraînement avec toutes les nouvelles variables dérivées pour effectuer une analyse plus approfondie et l’utiliser dans d’autres applications.

FD3
FD7 e1605717117269 1
FD5
FD3

Vous souhaitez en savoir plus sur Feature Discovery ?