Nous ne mettons plus à jour le service Amazon Machine Learning et n'acceptons plus de nouveaux utilisateurs pour ce service. Cette documentation est disponible pour les utilisateurs existants, mais nous ne la mettons plus à jour. Pour plus d'informations, veuillez consulter la rubriqueQu'est-ce qu'Amazon Machine Learning.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Étape 2 : Création d'une source de données de formation

Après avoir téléchargé lebanking.csvdans votre emplacement Amazon Simple Storage Service (Amazon S3), vous l'utilisez pour créer une source de données de formation. Une source de données est un objet Amazon Machine Learning (Amazon ML) qui contient l'emplacement de vos données d'entrée et des métadonnées importantes concernant vos données d'entrée. Amazon ML utilise la source de données pour des opérations telles que la formation et l'évaluation d'apprentissage-machine.

Pour créer une source de données, fournissez les éléments suivants :

Emplacement Amazon S3 de vos données et autorisation d'accéder aux données
Le schéma, qui comprend les noms des attributs dans les données et le type de chaque attribut (numérique, texte, catégorie ou binaire)
Le nom de l'attribut qui contient la réponse qu'Amazon ML doit apprendre à prédire (attribut cible)

Note

La source de données ne stocke pas réellement vos données, mais les référence uniquement. Evitez de déplacer ou de modifier les fichiers stockés dans Amazon S3. Si vous les déplacez ou les modifiez, Amazon ML ne pourra pas y accéder pour créer un modèle d'apprentissage-machine, générer des évaluations ou générer des prédictions.

Pour créer la source de données de formation

Ouvrez la console Amazon Machine Learning à l'adressehttps://console.aws.amazon.com/machinelearning/.
Sélectionnez Get started (Démarrer).

Note
Ce didacticiel suppose que vous utilisez Amazon ML pour la première fois. Si vous avez déjà utilisé Amazon ML, vous pouvez utiliser leCréer un nouveau...dans le tableau de bord Amazon ML, afin de créer une nouvelle source de données.
Dans la pageCommencer avec Amazon Machine Learning, choisissezLancement d'.
Dans la page Input Data, pour Where is your data located?, assurez-vous que S3 est sélectionné.
PourEmplacement S3, saisissez l'emplacement complet du champbanking.csvFichier de l'étape 1 : Préparez vos données. Par exemple:votre_compartiment/banking.csv. Amazon ML ajoute s3 ://au nom de votre compartiment pour vous.
Pour Datasource name, tapez Banking Data 1.
Choisissez Vérifier.
Dans la boîte de dialogue S3 permissions, choisissez Oui.
Si Amazon ML peut accéder au fichier de données et le lire dans l'emplacement S3, vous verrez une page similaire à la suivante. Passez en revue les propriétés, puis choisissez Continuer.

Ensuite, vous devez établir un schéma. UNschémacorrespond aux informations dont Amazon ML a besoin pour interpréter les données en entrée pour un modèle d'apprentissage-machine, y compris les noms des attributs et leurs types de données attribués, ainsi que les noms des attributs spéciaux. Il existe deux manières de fournir un schéma à Amazon ML :

Fournissez un fichier de schéma distinct lorsque vous chargez vos données Amazon S3.
Autorisez Amazon ML à déduire les types d'attribut et à créer un schéma pour vous.

Dans ce didacticiel, nous allons demander à Amazon ML de déduire le schéma.

Pour obtenir des informations sur la création d'un fichier de schéma distinct, consultez Création d'un schéma de données pour Amazon ML.

Pour autoriser Amazon ML à déduire le schéma

Dans la pageSchéma, Amazon ML vous montre le schéma qu'il a déduit. Passez en revue les types de données qu'Amazon ML a déduits pour les attributs. Il est important que le type de données correct soit attribué aux attributs, afin qu'Amazon ML absorbe correctement les données et que le traitement d'entités correct soit effectué sur les attributs.
- Les attributs qui ont seulement deux états possibles, tels que oui ou non, doivent être marqués comme Binary (binaire).
- Les attributs correspondant à des chaînes ou des nombres utilisés pour indiquer une catégorie doivent être marqués comme Categorical (catégorie).
- Les attributs correspondant à des quantités numériques dont l'ordre est important doivent être marqués comme Numeric (numérique).
- Les attributs correspondant à des chaînes que vous souhaitez traiter comme des mots délimités par des espaces doivent être marqués comme Text (texte).
Dans ce didacticiel, Amazon ML a correctement identifié les types de données de l'ensemble des attributs, choisissez doncContinuer.

Ensuite, sélectionnez un attribut cible.

Souvenez-vous que la cible est l'attribut que le modèle d'apprentissage-machine doit apprendre à prédire. L'attribut y indique si une personne a déjà souscrit à une campagne dans le passé : 1 (oui) ou 0 (non).

Note

Choisissez un attribut cible seulement si vous avez l'intention d'utiliser la source de données pour la formation et l'évaluation des modèles d'apprentissage-machine.

Pour sélectionner y comme attribut cible

Dans la partie inférieure droite du tableau, choisissez la flèche simple pour passer à la dernière page du tableau, où figure l'attribut nommé y.
Dans la colonne Target, sélectionnez y.

Amazon ML confirme queyest sélectionné comme votre cible.
Choisissez Continuer.
Dans la page Row ID, pour Does your data contain an identifier ? , veillez à ce que la valeur No (valeur par défaut) soit sélectionnée.
Choisissez Vérification, puis Continuer.

Maintenant que vous avez une source de données de formation, vous êtes prêt à créer votre modèle.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Étape 1 : Préparation de vos données

Étape 3 : Création d'un modèle ML