Partager via


Test de la précision des modèles d'exploration de données (Didacticiel sur l'exploration de données)

Une fois les modèles d'exploration de données créés, traités et explorés pour les scénarios de publipostage ciblé, vous pouvez tester les modèles afin de déterminer la qualité des prévisions qu'ils permettent d'établir et de déterminer si l'un des modèles permet d'obtenir de meilleurs résultats que les autres.

Sous l'onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données, vous pouvez calculer le degré de précision de chaque modèle et comparer les résultats entre eux. Cette comparaison est similaire à celle obtenue au moyen d'un graphique de courbes d'élévation. L'onglet Graphique d'analyse de précision de l'exploration de données utilise des données d'entrée, c'est-à-dire des données séparées du dataset d'origine, pour comparer les prévisions aux résultats connus. Les résultats des comparaisons sont ensuite triés et représentés sur un graphique. Un modèle idéal, un modèle théorique qui prévoit un résultat tout le temps juste, est également représenté sur le graphique. Vous pouvez comparer les résultats des modèles actuels aux résultats du modèle idéal, pour constater le degré de précision des prévisions établies. Pour plus d'informations sur les graphiques de courbes d'élévation, consultez Graphique de courbes d'élévation.

Le graphique de courbes d'élévation est important car il aide à différencier les modèles dans les structures où ils sont presque identiques et à déterminer quels sont ceux permettant d'obtenir les prévisions les plus précises. De la même façon, le graphique de courbes d'élévation montre quel est le type d'algorithme qui permet d'obtenir les meilleures prévisions pour une situation en particulier. Pour plus d'informations sur l'utilisation de l'onglet Graphique d'analyse de précision de l'exploration de données, consultez Validation des modèles d'exploration de données.

Au cours de cette rubrique, vous allez effectuer les tâches suivantes :

  • Mappage des colonnes d'entrée
  • Filtrage des lignes d'entrée
  • Sélection des modèles, des colonnes prévisibles et des valeurs
  • Affichage du graphique de courbes d'élévation

Mappage des colonnes d'entrée

La première étape dans le test de précision de vos modèles d'exploration de données consiste à mapper les colonnes de la structure d'exploration de données aux colonnes de données d'entrée. Si les noms des colonnes correspondent directement, le Concepteur d'exploration de données crée automatiquement des relations.

Pour mapper des colonnes d'entrée à la structure d'exploration de données

  1. Dans la zone Mappage de colonnes de l'onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données, cliquez sur Table de cas dans la zone Sélectionner une ou plusieurs tables d'entrée.

    La boîte de dialogue Sélectionner une table s'ouvre. Cette boîte de dialogue permet de sélectionner la table qui contient les données d'entrée et les données à utiliser dans les requêtes de prévision pour déterminer la précision des modèles. Dans le cadre de ce didacticiel, vous allez utiliser les mêmes données pour les colonnes d'entrée que celles utilisées pour traiter les modèles. Cependant, il est préférable d'utiliser des données et des lignes distinctes pour les colonnes d'entrée de celles utilisées pour traiter les modèles. Ces données se sélectionnent en tant que colonnes d'entrée dans la boîte de dialogue Sélectionner une table.

  2. Dans la liste Source de données, vérifiez si l'entrepôt de données AdventureWorks est sélectionné.

  3. Dans la liste Nom de la table/vue, sélectionnez vTargetMail, puis cliquez sur OK.

    Les colonnes de la structure d'exploration de données sont mappées automatiquement aux colonnes portant le même nom dans la table d'entrée.

Une requête de prévision est générée pour chaque modèle de la structure en fonction des mappages de colonnes. Pour supprimer un mappage entre deux colonnes, sélectionnez la ligne qui relie la colonne de la table Structure d'exploration de données à la colonne de la table Sélectionner une ou plusieurs tables d'entrée et appuyez sur Suppr. Vous pouvez également créer des mappages manuellement. Pour cela, sélectionnez une colonne dans Sélectionner une ou plusieurs tables d'entrée et faites-la glisser vers la colonne correspondante dans Structure d'exploration de données.

Filtrage des lignes d'entrée

Vous pouvez utiliser la grille située sous Filtrez les données d'entrée utilisées pour produire le graphique de courbes d'élévation pour filtrer les données d'entrée. Vous pouvez faire glisser les colonnes à partir de Sélectionner une ou plusieurs tables d'entrée vers la grille ou sélectionner des valeurs en cliquant sur une colonne de la grille et en utilisant les listes de valeurs qui apparaissent. Par exemple, si vous souhaitez limiter les lignes d'entrée à celles dans lesquelles la colonne Income est supérieure à x, sélectionnez vTargetMail dans la colonne Source, Income dans la colonne Field, puis tapez >x dans la colonne Critères/Argument.

Notez que vous n'aurez pas à filtrer les données au cours de ce didacticiel.

Sélection des modèles, des colonnes prévisibles et des valeurs

L'étape suivante consiste à sélectionner les modèles que vous souhaitez inclure dans le graphique de courbes d'élévation et à sélectionner la colonne prévisible à laquelle comparer les modèles. Par défaut, tous les modèles de la structure d'exploration de données sont sélectionnés. Vous pouvez choisir de ne pas inclure un modèle, mais pour ce didacticiel, conservez tous les modèles sélectionnés.

Vous pouvez créer deux types de graphiques d'analyse de précision. Si vous sélectionnez une valeur prévisible, vous afficherez un graphique qui montre l'efficacité du modèle. Si vous n'incluez pas de valeur prévisible, le graphique montre le degré de précision du modèle.

Pour afficher l'efficacité des modèles

  1. Sous Sélectionnez les colonnes prévisibles du modèle d'exploration de données à afficher dans le graphique de courbes d'élévation, vérifiez que Bike Buyer est sélectionné dans la liste Nom de la colonne prévisible pour chaque modèle.

  2. Dans la colonnePrédire la valeur, sélectionnez 1 pour chaque modèle.

Pour afficher la précision des modèles

  • Sous Sélectionnez les colonnes prévisibles du modèle d'exploration de données à afficher dans le graphique de courbes d'élévation, vérifiez que Bike Buyer est sélectionné dans la liste Nom de la colonne prévisible pour chaque modèle.

    Laissez la colonne Prédire la valeur vide.

Si la case à cocher Synchroniser les colonnes de prévision et les valeurs est activée, la colonne prévisible est synchronisée pour chaque modèle d'exploration de données dans la structure d'exploration de données.

ms170238.note(fr-fr,SQL.90).gifRemarque :
Les colonnes du modèle d'exploration de données qui sont énumérées dans la liste Nom de la colonne prévisible sont limitées à celles dont le type d'utilisation est Predict ou Predict Only. Ces colonnes dépendent également des colonnes de la structure d'exploration de données dont le type de contenu est Discrete ou Discretized.

Dans certains scénarios avancés, vous pouvez souhaiter générer un graphique de courbes d'élévation avec une colonne prévisible dans deux modèles d'exploration de données qui ne sont pas basés sur la même colonne de structure d'exploration de données, mais qui contiennent les mêmes données. Si vous désactivez la case à cocher Synchroniser les colonnes de prévision et les valeurs, vous pouvez sélectionner n'importe quelle colonne et valeur prévisible. Les résultats sont représentés ensemble, qu'ils aient un sens ou non.

Affichage du graphique de courbes d'élévation

Pour afficher le graphique de courbes d'élévation, activez l'onglet Graphique de courbes d'élévation de l'onglet Graphique d'analyse de précision de l'exploration de données. Lorsque vous cliquez sur l'onglet, une requête de prévision s'exécute sur le serveur, dans la base de données pour la structure d'exploration de données et la table d'entrée. Les résultats prévus sont comparés aux valeurs actuelles connues et représentés sur le graphique. Pour plus d'informations sur l'utilisation de ce graphique, consultez Graphique de courbes d'élévation.

Tâche suivante de la leçon

Création de prévisions (Didacticiel sur l'exploration de données)