Partager via


Exploration des modèles Sequence Clustering (Didacticiel sur l'exploration de données)

Maintenant que vous avez créé le modèle Sequence Clustering, vous pouvez le parcourir en utilisant la visionneuse de l'algorithme MSC (Microsoft Sequence Clustering) dans l'onglet Visionneuse de modèle d'exploration de données du Concepteur d'exploration de données. La visionneuse de l'algorithme MSC (Microsoft Sequence Clustering) contient cinq onglets : Diagramme de cluster, Profils du cluster, Caractéristiques du cluster, Discriminationde cluster et Transitions d'état. Pour plus d'informations sur la façon d'utiliser cette visionneuse, consultez Affichage d'un modèle d'exploration de données à l'aide de la Visionneuse de l'algorithme MSC (Microsoft Sequence Clustering).

Onglet Diagramme de cluster

L'onglet Diagramme de cluster présente sous forme graphique les clusters que l'algorithme a découverts dans la base de données. La disposition du diagramme représente les relations entre les clusters. Dans cette présentation, les clusters similaires sont groupés ensemble. Par défaut, la nuance de la couleur du nœud représente la densité des cas présents dans le cluster : plus le nœud est foncé et plus le nombre de cas qu'il contient est élevé. Vous pouvez changer la signification de la nuance des nœuds afin qu'elle représente un attribut et un état. Par exemple, sélectionnez Modèle dans la liste Variable d'ombrage et sélectionnez Cycling Cap dans la liste État. Le diagramme de cluster indique que le Cluster 9 contient la plus grande densité de casquettes de cyclisme.

Onglet Profils du cluster

L'onglet Profils du cluster affiche les séquences qui existent dans chaque cluster. Les clusters sont listés dans des colonnes individuelles à droite de la colonne États.

Dans la visionneuse, la ligne Model.samples représente les données de séquence et la ligne Model décrit la distribution des articles dans un cluster. Chaque ligne des séquences de couleur dans chaque cellule de la ligne Model.samples représente le comportement d'un utilisateur sélectionné de façon aléatoire dans le cluster. Chaque couleur dans un histogramme de séquences individuelles représente le modèle d'un produit.

Par exemple, la couleur turquoise dans le Cluster 3 représente le modèle de bicyclette Mountain-200. Sa présence comme première couleur dans la plupart des séquences indique qu'un client a de fortes chances d'ajouter la bicyclette Mountain-200 en premier dans son panier.

Onglet Caractéristiques du cluster

L'onglet Caractéristiques du cluster résume les transitions entre les états dans un cluster. Des barres décrivent l'importance de la valeur d'attribut pour le cluster sélectionné. Par exemple, dans le Cluster 10, l'un des profils les plus importants est celui correspondant aux clients qui tendent à ajouter un pneu ML Mountain en premier dans leur panier.

Onglet Discrimination de cluster

Dans l'onglet Discrimination de cluster, vous pouvez comparer deux clusters afin de déterminer quels modèles correspondent à quels clusters. Cet onglet contient quatre colonnes : Variables, Valeurs, Cluster 1 et Cluster 2. Si un cluster montre une préférence pour un modèle en particulier, une barre bleue apparaît dans la colonne Cluster 1 ou Cluster 2 dans la ligne du modèle correspondant dans la colonne Variables. Plus la barre bleue est longue et plus le modèle a la préférence du cluster.

Par exemple, utilisez l'onglet Discrimination de cluster dans la visionneuse pour comparer la colonne Cluster 2 à la colonne Cluster 5 en sélectionnant Cluster 2 dans Cluster 1 et Cluster 5 dans Cluster 2. Un client qui achète un porte-bouteille pour vélo tout-terrain, comme cela est indiqué par le nœud Mountain Bottle Cage dans la colonne Valeurs a de plus fortes chances de figurer dans le Cluster 5, et un client qui achète un pneu pour vélo tout-terrain, comme indiqué par le nœud Touring Tire dans la colonne Valeurs a de plus fortes chances de figurer dans le Cluster 2.

Onglet Transitions d'état

Dans l'onglet Transitions d'état vous pouvez sélectionner un cluster et parcourir ses transitions d'état. Chaque nœud représente un état du modèle, tel que Mountain-200. Une ligne représente la transition entre les états et chaque nœud est basé sur la probabilité d'une transaction. La couleur d'arrière-plan représente la fréquence d'un nœud dans le cluster.

Par exemple, sélectionnez Cluster 3 dans Cluster, sélectionnez le nœud Touring-3000 et faites glisser le curseur Tous les liens vers le bas de plusieurs espaces. Comme vous pouvez le voir dans la visionneuse, si un client ajoute un pneu pour vélo tout-terrain dans son panier, la probabilité, indiquée par la flèche bleue, que le client ajoute ensuite une chambre à air est égale à 0,63. La probabilité que le client ajoute également un vélo Sport 100 à son panier est égale à 0,26.