Utiliser le Machine Learning (ML) avec Amazon Athena - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utiliser le Machine Learning (ML) avec Amazon Athena

Le Machine Learning (ML) avec Amazon Athena vous permet d'utiliser Athena pour écrire des SQL instructions qui exécutent l'inférence du Machine Learning (ML) à l'aide d'Amazon. SageMaker Cette fonctionnalité simplifie l'accès aux modèles ML pour l'analyse des données, éliminant ainsi la nécessité d'utiliser des méthodes de programmation complexes pour exécuter l'inférence.

Pour utiliser ML avec Athena, vous définissez une fonction ML avec Athena avec la clause USING EXTERNAL FUNCTION. La fonction pointe vers le point de terminaison du SageMaker modèle que vous souhaitez utiliser et spécifie les noms des variables et les types de données à transmettre au modèle. Les clauses suivantes de la requête font référence à la fonction de transmission des valeurs au modèle. Le modèle exécute l'inférence en fonction des valeurs que la requête transmet, puis renvoie les résultats de l'inférence. Pour plus d'informations sur les SageMaker endpoints SageMaker et leur fonctionnement, consultez le manuel Amazon SageMaker Developer Guide.

Pour un exemple d'utilisation du machine learning avec Athena et de l' SageMaker inférence pour détecter une valeur anormale dans un ensemble de résultats, consultez l'article du blog AWS Big Data sur la détection de valeurs anormales en invoquant la fonction d'inférence d'apprentissage automatique Amazon Athena.

Considérations et restrictions

  • Régions disponibles — La fonctionnalité Athena ML est une fonctionnalité dans laquelle le moteur Régions AWS Athena version 2 ou ultérieure est pris en charge.

  • SageMaker le point de terminaison du modèle doit accepter et renvoyer text/csv — Pour plus d'informations sur les formats de données, consultez la section Formats de données courants pour l'inférence dans le manuel Amazon SageMaker Developer Guide.

  • Athena n'envoie pas d'CSVen-têtes — Si votre SageMaker point de terminaison l'esttext/csv, votre gestionnaire de saisie ne doit pas supposer que la première ligne de l'entrée est un en-tête. CSV Comme Athéna n'envoie pas d'CSVen-têtes, la sortie renvoyée à Athéna contiendra une ligne de moins que ce qu'Athéna attend et provoquera une erreur.

  • SageMaker dimensionnement du point de terminaison : assurez-vous que le point de terminaison du SageMaker modèle référencé est suffisamment étendu pour les appels d'Athena au point de terminaison. Pour plus d'informations, consultez la section Mise à l'échelle automatique SageMaker des modèles dans le manuel Amazon SageMaker Developer Guide et CreateEndpointConfigdans le Amazon SageMaker API Reference.

  • IAMautorisations — Pour exécuter une requête qui spécifie un ML avec la fonction Athena, le IAM principal exécutant la requête doit être autorisé à effectuer l'sagemaker:InvokeEndpointaction pour le point de terminaison du SageMaker modèle référencé. Pour de plus amples informations, veuillez consulter Autoriser l'accès au ML avec Athena.

  • Les fonctions ML avec Athena ne peuvent pas être utilisées directement dans les clauses GROUP BY