Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Amélioration de la précision de la transcription grâce à des vocabulaires personnalisés et des modèles de langue personnalisés
Si votre média contient des termes spécifiques à un domaine ou non standard, tels que des noms de marque, des acronymes, des termes techniques et du jargon, il est possible que ces termes ne Amazon Transcribe soient pas correctement capturés dans votre sortie de transcription.
Pour corriger les inexactitudes de transcription et personnaliser votre sortie en fonction de votre cas d’utilisation spécifique, vous pouvez créer Vocabulaires personnalisés et Modèles de langue personnalisés.
-
Vocabulaires personnalisés sont conçus pour optimiser et améliorer à la fois la reconnaissance et le formatage de mots spécifiques dans tous les contextes. Cela implique de fournir à Amazon Transcribe des mots et, éventuellement, des formulaires de prononciation et d’affichage.
Si des termes spécifiques ne Amazon Transcribe sont pas correctement affichés dans vos transcriptions, vous pouvez créer un fichier de vocabulaire personnalisé qui indique Amazon Transcribe comment vous souhaitez que ces termes soient affichés. Cette approche par mot est la plus appropriée pour corriger des termes tels que les noms de marque et les acronymes.
-
Les Modèles de langue personnalisés sont conçus pour capturer le contexte associé aux termes. Cela implique de Amazon Transcribe fournir un grand volume de données textuelles spécifiques à un domaine.
Si les termes techniques ne Amazon Transcribe sont pas correctement affichés ou si vous utilisez un homophone incorrect dans vos transcriptions, vous pouvez créer un modèle de langage personnalisé qui enseigne le langage spécifique à Amazon Transcribe votre domaine. Par exemple, un modèle de langue personnalisé peut apprendre quand utiliser « floe » (banquise) et « flux » (flux de glace).
Cette approche contextuelle est la plus appropriée pour transcrire de gros volumes de discours spécifiques à un domaine. Les modèles de langue personnalisés peuvent apporter des améliorations de précision significatives par rapport aux seuls vocabulaires personnalisés. Lorsque vous utilisez des transcriptions par lots, vous pouvez inclure à la fois un modèle de langue personnalisé et un vocabulaire personnalisé dans votre demande.
Astuce
Pour obtenir une précision de transcription maximale, utilisez des vocabulaires personnalisés avec vos modèles de langue personnalisés.
Pour une présentation vidéo de la création et de l’utilisation de vocabulaires personnalisés, voir :
Pour une présentation vidéo de la création et de l’utilisation de modèles de langue personnalisés, voir :
Approfondissez vos connaissances avec le blog AWS Machine Learning
Vocabulaires personnalisés :
Modèles de langue personnalisés :