Analyse exploratoire
La finalité de cette catégorie d'analyses peut être multiple tout comme les méthodes qui permettent d'y parvenir, ce sont toutes les méthodologies de Machine Learning qui apportent de l'information et donc créent de la valeur par l'exploration approfondie des données.


Segmentation
La segmentation est un processus consistant à diviser un ensemble de données en groupes homogènes ou segments, en fonction de certaines caractéristiques ou critères communs. L'objectif de la segmentation est de regrouper les individus ou les observations similaires ensemble, afin de mieux comprendre les comportements, les préférences ou les caractéristiques des différents segments de la population étudiée.
Ce processus peut être réalisé de différentes manières, selon le domaine d'application et les objectifs spécifiques de l'analyse. Il existe plusieurs méthodes de segmentation, notamment le clustering non supervisé, qui divise les données en groupes naturels en fonction de similarités intrinsèques, et la segmentation supervisée, qui utilise des informations préalables ou des étiquettes pour guider le processus de segmentation.
La segmentation est largement utilisée dans divers domaines, tels que le marketing, la finance, la santé et la vente au détail, pour mieux comprendre les clients, les marchés et les tendances, et ainsi prendre des décisions plus éclairées et ciblées. Bien comprendre l'objectif et l'utilisation à posteriori des segments réalisés est primordial pour mener à bien efficacement un projet de segmentation. De même que la vérification de l'homogénéité à l'intérieur des groupes et de l'hétérogénéité entre les groupes.
De la RFM au clustering mixte, un large éventail de méthodes existent et sont valables en fonction du besoin, la vraie question est : "Quel est le but de cette segmentation et sur quoi allez vous actionner ces segments ?".


Prédiction
La prédiction a un nom assez transparent : utiliser des modèles statistiques ou d'apprentissage automatique pour estimer ou prédire des valeurs futures à partir de données existantes. L'objectif est d'utiliser les informations contenues dans les données historiques pour anticiper ou prédire les événements futurs.
Pour ce faire, on utilise généralement des techniques telles que la régression pour prédire des valeurs continues ou la classification pour prédire des catégories discrètes. Les modèles sont entraînés sur des ensembles de données historiques où les résultats sont connus, puis utilisés pour faire des prédictions sur de nouvelles données pour lesquelles les résultats sont inconnus. Elle permet aux entreprises et aux organisations de planifier efficacement et d'anticiper les tendances futures en se basant sur les informations extraites des données historiques, que ce soit pour du chiffre d'affaires, des stocks, des appels au service client, etc.
Un des aspects les plus fastidieux et important de ce type de projet est de prendre en compte le plus possible de variables impactant notre KPI, variables endogènes (propre à l'entreprise : le nombre de salariés, le budget pub, etc.) comme exogènes (extérieur à l'entreprise : la météo, les soldes, les vacances scolaires, etc.). Ainsi le modèle saura apprendre et prévenir de l'impact de ces variables sur notre KPI suivi.


Compréhension
La compréhension des insights fait référence à l'analyse approfondie des données pour extraire des informations significatives, des tendances ou des modèles cachés.
Les insights sont des connaissances précieuses et exploitables qui permettent de prendre des décisions éclairées ou de formuler des recommandations. Cette compréhension implique souvent l'utilisation de techniques d'analyse statistique avancées. Les insights peuvent aider à identifier des opportunités, à résoudre des problèmes, à optimiser des processus et à mieux comprendre le comportement des variables dans un contexte donné.
Ce type d'analyse est plus vaste et nécessite une bonne connaissance des problématiques métiers et une excellente culture méthodologique afin de réfléchir efficacement à des solutions innovantes et adéquats.
La clé pour mener à bien ce type de projet est de prendre du recul sur l'objectif puis de mettre à plat l'ensemble des méthodes statistiques pouvant répondre au problème pour pouvoir en sélection la plus adaptée (voir d'en combiner).
De manière synthétique, tout les besoins dont la méthode permettant d'y répondre n'est pas évidente est classé dans cette catégorie, par exemple "Quels sont les raisons de mes ruptures produits ?" "Quel est le meilleur assortiment pour mon magasin ?" "Qu'est ce qui fait la performance (ou non) de mes produits ?". Ce sont les projets les plus intéressants avec à la fois une réflexion technique et théorique.

