eureqa jp hero banner

Modèles Eureqa pour séries temporelles

Notre approche de modélisation unique pour résoudre les problèmes les plus complexes du monde réel avec des formules mathématiques lisibles par l’homme.

Que sont les modèles Eureqa ?

Les modèles Eureqa sont un puissant complément ajouté au produit Automated Time Series de DataRobot. Ils vous aident à trouver des formules mathématiques lisibles par l’homme pour expliquer les tendances qui se dessinent dans vos données et créer des modèles précis, transparents et exploitables qui permettent de résoudre les problèmes du monde réel bien plus rapidement que d’autres approches.

E-book
Next-Generation Time Series Forecasting

Une IA qui utilise les lois de la physique pour résoudre les problèmes du monde réel

Les algorithmes Eureqa ont été conçus en 2007 par le Chief Scientist de DataRobot, Michael Schmidt. 

Son idée était de développer un algorithme génétique capable d’adapter différentes expressions analytiques aux données entraînées et de restituer la meilleure formule mathématique sous forme de modèle de machine learning. Il s’agit d’une approche fondamentalement différente de celle des modèles classiques du machine learning supervisés comme les arbres, la régression ou le deep learning. Depuis, cette méthode a été citée dans plus de 800 publications évaluées par des pairs et utilisée de la finance aux neurosciences.

En substance, les modèles Eureqa sont entraînés comme n’importe quel autre algorithme de machine learning supervisé. Vous fournissez à l’algorithme des données d’entraînement labellisées qui représentent des informations historiques, et il fera concorder une expression analytique avec ces données d’entraînement.

Eureqa est l’algorithme le plus efficace et le plus connu au monde pour mettre au jour des relations mathématiques dans les données. Des milliers de publications de recherche citent Eureqa dans leurs résultats. DataRobot contient plusieurs blueprints qui s’appuient sur Eureqa afin de créer des modèles prédictifs de séries temporelles, la régression et la classification.

Transparent et extensible

Si les modèles Eureqa sont si appréciés, c’est notamment parce que ces algorithmes renvoient des expressions analytiques lisibles et interprétables par l’homme, qui peuvent être rapidement examinées par les experts.

Ces derniers peuvent également intégrer leurs connaissances métier en toute simplicité. Par exemple, supposons que vous connaissiez les relations sous-jacentes dans le système que vous modélisez. Vous pouvez alors donner à Eureqa un indice, comme une formule de l’évolution des prix de l’immobilier dans un quartier en particulier. Les relations connues que fournissent les experts forment les bases ou le point de départ de l’apprentissage. Eureqa intégrera alors ces corrections et en tiendra compte.

EUreqa 3

Moins de complexité. De meilleurs résultats.

L’algorithme Eureqa est particulièrement doué pour la sélection des variables, car il est contraint de réduire la complexité pendant le processus de création du modèle. Par exemple, si les données comportent 20 colonnes différentes utilisées pour prédire la variable cible, la recherche d’une expression simple aboutit à une expression qui n’utilise que les prédicteurs les plus importants.

Cet algorithme fonctionne également très bien dans de petits jeux de données. C’est pourquoi les modèles Eureqa sont prisés par les chercheurs en science qui recueillent des données à partir d’expériences physiques qui ne produisent pas de grandes quantités de données.

Eureqa

Sélection intelligente des variables

Eureqa suit son propre processus de feature engineering. En fonction des contraintes de complexité spécifiées, les blueprints Eureqa font en sorte d’optimiser le processus pour générer le modèle le plus simple possible et restreindre ainsi le nombre de variables pouvant être utilisées par le modèle. Eureqa est un expert dans l’identification des variables les plus pertinentes pour se lancer.

Tout comme LASSO, la sélection des variables est intégrée dans le processus cible de l’algorithme.

Eureqa teste des millions de combinaisons de variables dans différentes formules avec une complexité limitée (ou pénalisée) et s’avère très efficace pour réduire le nombre de variables utilisées dans le modèle final.

eureca image3
EUreqa 3
Eureqa
eureca image3

Nos modèles Eureqa révolutionnaires sur l’autopilote

Inventés par Michael Schmidt, data scientist et directeur technique de DataRobot, les modèles Eureqa reposent sur l’idée qu’un algorithme génétique peut adapter différentes expressions analytiques aux données entraînées et générer une formule mathématique en tant que modèle de machine learning.

Vous souhaitez en savoir plus sur Automated Time Series ?