Skip Ribbon Commands
Skip to main content

Le recours à l’analyse avancée : l’importance de la possibilité d’interprétation et de l’adhésion par les parties intéressées

2018-02-07


De nos jours, très peu d’attention est accordée à la régression linéaire. Comparativement à l’engouement que suscitent l’apprentissage profond, l’intelligence artificielle et l’apprentissage machine automatisé, la régression linéaire, un type d’analyse prédictive couramment utilisé depuis longtemps, fait rarement les manchettes. Cependant, n’allez pas croire que la régression linéaire n’a plus sa place dans l’arsenal du scientifique des données.

Pourquoi? Elle constitue non seulement une technique robuste, efficace et bien comprise, mais elle est également facile à interpréter, ce qui en fait un outil essentiel pour bon nombre d’entreprises qui ont recours à l’analyse de données.


Les cinq étapes de l’analyse de données, d’abord popularisées par Thomas Davenport et Jeanne Harris dans leur livre Competing on Analytics, fournissent un cadre très utile pour évaluer les capacités analytiques d’une entreprise. Pour les entreprises qui en sont à l’étape 4, Entreprises ayant pris le virage analytique (soit une forte proportion des petites et moyennes entreprises), la possibilité d’interprétation demeure un élément clé.

Encore une fois, pourquoi? En gros, cela tient à l’adoption par les parties intéressées. Voici une anecdote pour l’illustrer.

Récemment, j’ai fait la rencontre d’un scientifique des données dont le travail consiste à surveiller un volume important de données transactionnelles pour prévenir les cas de fraude. Son algorithme préféré pour évaluer les résultats? La régression logistique. Bien entendu, il pourrait déployer un autoassociateur d’apprentissage profond ou se servir d’un arbre décisionnel fondé sur le concept du gradient boosting pour tenter d’accroître l’exactitude de son modèle. Toutefois, cette approche analytique ne servirait pas les intérêts de son équipe, car les parties intéressées doutent encore des avantages de l’analytique avancée et ne font pas encore confiance aux prédictions formulées à partir d’une boîte noire.

En revanche, les parties intéressées comprennent la régression logistique. Elles savent que chaque observation est évaluée en fonction de la probabilité qu’une transaction soit frauduleuse, et cette nouvelle information leur permet d’avancer dans leur travail. Petit à petit, elles finiront par faire confiance à ces prédictions. À mesure que l’enthousiasme et la confiance à l’égard des capacités analytiques grandiront, les occasions de recourir à des modèles plus avancés se multiplieront.

Toutefois, si le scientifique des données s’était empressé d’adopter des modèles avancés, il aurait pu perdre l’intérêt de personnes clés et ne pas atteindre les objectifs du service. Cette situation est un bel exemple de l’importance pour le scientifique des données de bien connaître son domaine d’activités.

En conclusion, la régression linéaire n’est peut-être pas aussi attrayante que d’autres algorithmes plus avancés, mais elle, ainsi que d’autres techniques similaires (la régression logistique et les modèles additifs généralisés), peuvent encore créer beaucoup de valeur pour les équipes d’analyse aujourd’hui.

Pour en savoir plus sur les Services d’analyse multidimensionnelle des données et de l’information de MNP, cliquez ici.