Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
StartStreamTranscription
Lance un HTTP/2 ou un WebSocket flux bidirectionnel où l'audio est diffusé en continu vers Amazon Transcribe et les résultats de la transcription sont diffusés sur votre application.
Les paramètres suivants sont obligatoires :
-
language-code
ouidentify-language
-
media-encoding
-
sample-rate
Pour plus d'informations sur le streaming avec Amazon Transcribe, consultez la section Transcription du streaming audio.
Syntaxe de la demande
POST /stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-identify-language: IdentifyLanguage
x-amzn-transcribe-language-options: LanguageOptions
x-amzn-transcribe-preferred-language: PreferredLanguage
x-amzn-transcribe-vocabulary-names: VocabularyNames
x-amzn-transcribe-vocabulary-filter-names: VocabularyFilterNames
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
}
}
}
Paramètres de demande URI
La demande utilise les paramètres URI suivants.
- ContentIdentificationType
-
Étiquette toutes les données d'identification personnelle (PII) identifiées sur votre relevé de notes.
L'identification du contenu est effectuée au niveau du segment ; les informations d'identification personnelles spécifiées dans
PiiEntityTypes
sont signalées lors de la transcription complète d'un segment audio.Vous ne pouvez pas définir
ContentIdentificationType
etContentRedactionType
dans la même demande. Si vous définissez les deux, votre demande renvoie unBadRequestException
.Pour plus d'informations, voir Suppression ou identification d'informations personnelles identifiables.
Valeurs valides :
PII
- ContentRedactionType
-
Supprime toutes les données d'identification personnelle (PII) identifiées sur votre relevé de notes.
La rédaction du contenu est effectuée au niveau du segment ; les informations personnelles spécifiées dans
PiiEntityTypes
sont supprimées lors de la transcription complète d'un segment audio.Vous ne pouvez pas définir
ContentRedactionType
etContentIdentificationType
dans la même demande. Si vous définissez les deux, votre demande renvoie unBadRequestException
.Pour plus d'informations, voir Suppression ou identification d'informations personnelles identifiables.
Valeurs valides :
PII
- EnableChannelIdentification
-
Permet l'identification des canaux audio multicanaux.
L'identification des canaux transcrit le son sur chaque canal indépendamment, puis ajoute la sortie de chaque canal dans une seule transcription.
Si vous utilisez un son multicanal et que vous n'activez pas l'identification des canaux, votre audio est transcrit de manière continue et votre transcription n'est pas séparée par canal.
Si vous incluez
EnableChannelIdentification
dans votre demande, vous devez également inclureNumberOfChannels
.Pour de plus amples informations, veuillez consulter Transcription de l'audio multicanal.
- EnablePartialResultsStabilization
-
Permet une stabilisation partielle des résultats de votre transcription. La stabilisation partielle des résultats peut réduire la latence de votre sortie, mais peut avoir un impact sur la précision. Pour plus d'informations, voir Stabilisation des résultats partiels.
- IdentifyLanguage
-
Permet l'identification automatique de la langue pour votre transcription.
Si vous incluez
IdentifyLanguage
, vous pouvez éventuellement inclure une liste de codes de langue, en utilisantLanguageOptions
, qui, selon vous, peuvent être présents dans votre flux audio. L'inclusion d'options linguistiques peut améliorer la précision de la transcription.Vous pouvez également inclure une langue de votre choix à l'aide de
PreferredLanguage
. L'ajout d'une langue préférée peut aider Amazon Transcribe à identifier la langue plus rapidement que si vous omettiez ce paramètre.Si vous avez un son multicanal qui contient différentes langues sur chaque canal et que vous avez activé l'identification des canaux, l'identification automatique de la langue identifie la langue dominante sur chaque canal audio.
Notez que vous devez inclure l'un
LanguageCode
ouIdentifyLanguage
l'autre dans votre demande. Si vous incluez les deux paramètres, votre demande échoue.L'identification de la langue de streaming ne peut pas être combinée à des modèles linguistiques personnalisés ou à une rédaction.
- LanguageCode
-
Spécifiez le code de langue qui représente la langue parlée dans votre fichier audio.
Si vous n'êtes pas sûr de la langue parlée dans votre fichier audio, pensez
IdentifyLanguage
à l'utiliser pour activer l'identification automatique de la langue.Pour obtenir la liste des langues prises en charge par Amazon Transcribe en streaming, consultez le tableau des langues prises en charge.
Valeurs valides :
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- LanguageModelName
-
Spécifiez le nom du modèle de langue personnalisé que vous voulez utiliser lors du traitement de votre transcription. Notez que les noms des modèles de langue sont sensibles à la casse.
La langue du modèle linguistique spécifié doit correspondre au code de langue que vous spécifiez dans votre demande de transcription. Si les langues ne correspondent pas, le modèle de langue personnalisé n'est pas appliqué. Aucune erreur ou avertissement n'est associé à une incompatibilité linguistique.
Pour de plus amples informations, veuillez consulter Modèles de langue personnalisés.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
- LanguageOptions
-
Spécifiez au moins deux codes de langue qui représentent les langues qui, selon vous, peuvent être présentes dans vos médias ; il n'est pas recommandé d'en inclure plus de cinq. Si vous ne savez pas quelles langues sont présentes, n'incluez pas ce paramètre.
L'inclusion d'options linguistiques peut améliorer la précision de l'identification de la langue.
Si vous incluez
LanguageOptions
dans votre demande, vous devez également inclureIdentifyLanguage
.Pour obtenir la liste des langues prises en charge par Amazon Transcribe en streaming, consultez le tableau des langues prises en charge.
Important
Vous ne pouvez inclure qu'un dialecte de langue par langue et par flux. Par exemple, vous ne pouvez pas inclure
en-US
eten-AU
dans la même demande.Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[a-zA-Z-,]+
- MediaEncoding
-
Spécifiez l'encodage de votre entrée audio. Formats pris en charge :
-
FLAC
-
Audio codé OPUS dans un conteneur Ogg
-
PCM (uniquement formats audio Little-Endian 16 bits signés, qui n'incluent pas le WAV)
Pour de plus amples informations, veuillez consulter Formats de média.
Valeurs valides :
pcm | ogg-opus | flac
Obligatoire : oui
-
- MediaSampleRateHertz
-
Fréquence d'échantillonnage du signal audio d'entrée (en hertz). Le son de faible qualité, tel que le son du téléphone, se situe généralement autour de 8 000 Hz. Le son de haute qualité varie généralement entre 16 000 Hz et 48 000 Hz. Notez que la fréquence d'échantillonnage que vous spécifiez doit correspondre à celle de votre audio.
Plage valide : Valeur minimum de 8 000. Valeur maximum de 48 000.
Obligatoire : oui
- NumberOfChannels
-
Spécifiez le nombre de canaux de votre flux audio. Cette valeur doit être égale à
2
, car seuls deux canaux sont pris en charge. Si votre audio ne contient pas plusieurs canaux, n'incluez pas ce paramètre dans votre demande.Si vous incluez
NumberOfChannels
dans votre demande, vous devez également inclureEnableChannelIdentification
.Plage valide : Valeur minimum de 2.
- PartialResultsStability
-
Spécifiez le niveau de stabilité à utiliser lorsque vous activez la stabilisation partielle des résultats (
EnablePartialResultsStabilization
).Une faible stabilité fournit la plus grande précision. La haute stabilité permet de transcrire plus rapidement, mais avec une précision légèrement inférieure.
Pour plus d'informations, voir Stabilisation des résultats partiels.
Valeurs valides :
high | medium | low
- PiiEntityTypes
-
Spécifiez les types d'informations personnelles identifiables (PII) que vous souhaitez supprimer dans votre relevé de notes. Vous pouvez inclure autant de types que vous le souhaitez ou sélectionner
ALL
.Pour inclure
PiiEntityTypes
dans votre demande, vous devez également inclure l'unContentIdentificationType
ou l'autreContentRedactionType
.Les valeurs doivent être séparées par des virgules et peuvent inclure :
ADDRESS
BANK_ACCOUNT_NUMBER
BANK_ROUTING
CREDIT_DEBIT_CVV
,CREDIT_DEBIT_EXPIRY
,CREDIT_DEBIT_NUMBER
,EMAIL
,,NAME
,PHONE
,PIN
,SSN
, ouALL
.Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 300.
Modèle :
^[A-Z_, ]+
- PreferredLanguage
-
Spécifiez une langue préférée parmi le sous-ensemble de codes de langues que vous avez indiqué
LanguageOptions
.Vous ne pouvez utiliser ce paramètre que si vous l'avez inclus
IdentifyLanguage
LanguageOptions
dans votre demande.Valeurs valides :
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- SessionId
-
Spécifiez un nom pour votre session de transcription. Si vous n'incluez pas ce paramètre dans votre demande, Amazon Transcribe génère un identifiant et le renvoie dans la réponse.
Contraintes de longueur : longueur de 36.
Modèle :
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Active le partitionnement des haut-parleurs (diarisation) dans votre sortie de transcription. Le partitionnement des haut-parleurs étiquette le discours émis par chaque locuteur dans votre fichier multimédia.
Pour de plus amples informations, veuillez consulter Partitionnement des haut-parleurs (diarisation).
- VocabularyFilterMethod
-
Spécifiez comment vous souhaitez que votre filtre de vocabulaire soit appliqué à votre relevé de notes.
Pour remplacer les mots par
***
, choisissezmask
.Pour supprimer des mots, choisissez
remove
.Pour signaler des mots sans les modifier, choisissez
tag
.Valeurs valides :
remove | mask | tag
- VocabularyFilterName
-
Spécifiez le nom du filtre de vocabulaire personnalisé que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms des filtres de vocabulaire sont sensibles à la casse.
Si la langue du filtre de vocabulaire personnalisé spécifié ne correspond pas à la langue identifiée dans votre média, le filtre de vocabulaire n'est pas appliqué à votre transcription.
Important
Ce paramètre n'est pas destiné à être utilisé avec le
IdentifyLanguage
paramètre. Si vous l'incluezIdentifyLanguage
dans votre demande et que vous souhaitez utiliser un ou plusieurs filtres de vocabulaire avec votre transcription, utilisez plutôt leVocabularyFilterNames
paramètre.Pour plus d'informations, voir Utilisation du filtrage du vocabulaire avec des mots indésirables.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
- VocabularyFilterNames
-
Spécifiez les noms des filtres de vocabulaire personnalisés que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms des filtres de vocabulaire sont sensibles à la casse.
Si aucune des langues des filtres de vocabulaire personnalisés spécifiés ne correspond à la langue identifiée dans votre média, votre tâche échoue.
Important
Ce paramètre est uniquement destiné à être utilisé avec le
IdentifyLanguage
paramètre. Si vous ne l'incluez pasIdentifyLanguage
dans votre demande et que vous souhaitez utiliser un filtre de vocabulaire personnalisé avec votre transcription, utilisez plutôt leVocabularyFilterName
paramètre.Pour plus d'informations, voir Utilisation du filtrage du vocabulaire avec des mots indésirables.
Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.
Modèle :
^[a-zA-Z0-9,-._]+
- VocabularyName
-
Spécifiez le nom du vocabulaire personnalisé que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms de vocabulaire sont sensibles à la casse.
Si la langue du vocabulaire personnalisé spécifié ne correspond pas à la langue identifiée dans votre média, le vocabulaire personnalisé n'est pas appliqué à votre transcription.
Important
Ce paramètre n'est pas destiné à être utilisé avec le
IdentifyLanguage
paramètre. Si vous l'incluezIdentifyLanguage
dans votre demande et que vous souhaitez utiliser un ou plusieurs vocabulaires personnalisés avec votre transcription, utilisez plutôt leVocabularyNames
paramètre.Pour de plus amples informations, veuillez consulter Vocabulaires personnalisés.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
- VocabularyNames
-
Spécifiez les noms des vocabulaires personnalisés que vous souhaitez utiliser lors du traitement de votre transcription. Notez que les noms de vocabulaire sont sensibles à la casse.
Si aucune des langues des vocabulaires personnalisés spécifiés ne correspond à la langue identifiée dans votre média, votre tâche échoue.
Important
Ce paramètre est uniquement destiné à être utilisé avec le
IdentifyLanguage
paramètre. Si vous ne l'incluez pasIdentifyLanguage
dans votre demande et que vous souhaitez utiliser un vocabulaire personnalisé avec votre transcription, utilisez plutôt leVocabularyName
paramètre.Pour de plus amples informations, veuillez consulter Vocabulaires personnalisés.
Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.
Modèle :
^[a-zA-Z0-9,-._]+
Corps de la demande
Cette demande accepte les données suivantes au format JSON.
- AudioStream
-
Un flux codé de blobs audio. Les flux audio sont codés sous forme de HTTP/2 ou de trames de WebSocket données.
Pour de plus amples informations, veuillez consulter Transcription de l'audio en continu.
Type : objet AudioStream
Obligatoire : oui
Syntaxe de la réponse
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-identify-language: IdentifyLanguage
x-amzn-transcribe-language-options: LanguageOptions
x-amzn-transcribe-preferred-language: PreferredLanguage
x-amzn-transcribe-vocabulary-names: VocabularyNames
x-amzn-transcribe-vocabulary-filter-names: VocabularyFilterNames
Content-type: application/json
{
"TranscriptResultStream": {
"BadRequestException": {
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"TranscriptEvent": {
"Transcript": {
"Results": [
{
"Alternatives": [
{
"Entities": [
{
"Category": "string",
"Confidence": number,
"Content": "string",
"EndTime": number,
"StartTime": number,
"Type": "string"
}
],
"Items": [
{
"Confidence": number,
"Content": "string",
"EndTime": number,
"Speaker": "string",
"Stable": boolean,
"StartTime": number,
"Type": "string",
"VocabularyFilterMatch": boolean
}
],
"Transcript": "string"
}
],
"ChannelId": "string",
"EndTime": number,
"IsPartial": boolean,
"LanguageCode": "string",
"LanguageIdentification": [
{
"LanguageCode": "string",
"Score": number
}
],
"ResultId": "string",
"StartTime": number
}
]
}
}
}
}
Eléments de réponse
Si l'action aboutit, le service renvoie une réponse HTTP 200.
La réponse renvoie les en-têtes HTTP suivants.
- ContentIdentificationType
-
Indique si l'identification du contenu a été activée pour votre transcription.
Valeurs valides :
PII
- ContentRedactionType
-
Indique si la rédaction du contenu a été activée pour votre transcription.
Valeurs valides :
PII
- EnableChannelIdentification
-
Indique si l'identification des chaînes a été activée pour votre transcription.
- EnablePartialResultsStabilization
-
Indique si la stabilisation partielle des résultats a été activée pour votre transcription.
- IdentifyLanguage
-
Indique si l'identification automatique de la langue a été activée pour votre transcription.
- LanguageCode
-
Fournit le code de langue que vous avez spécifié dans votre demande.
Valeurs valides :
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- LanguageModelName
-
Fournit le nom du modèle de langue personnalisé que vous avez spécifié dans votre demande.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
- LanguageOptions
-
Fournit les codes de langue que vous avez spécifiés dans votre demande.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[a-zA-Z-,]+
- MediaEncoding
-
Fournit le codage multimédia que vous avez spécifié dans votre demande.
Valeurs valides :
pcm | ogg-opus | flac
- MediaSampleRateHertz
-
Fournit la fréquence d'échantillonnage que vous avez spécifiée dans votre demande.
Plage valide : Valeur minimum de 8 000. Valeur maximum de 48 000.
- NumberOfChannels
-
Fournit le nombre de chaînes que vous avez indiqué dans votre demande.
Plage valide : Valeur minimum de 2.
- PartialResultsStability
-
Indique le niveau de stabilisation utilisé pour votre transcription.
Valeurs valides :
high | medium | low
- PiiEntityTypes
-
Répertorie les types d'entités PII que vous avez spécifiés dans votre demande.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 300.
Modèle :
^[A-Z_, ]+
- PreferredLanguage
-
Fournit la langue préférée que vous avez spécifiée dans votre demande.
Valeurs valides :
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- RequestId
-
Fournit l'identifiant de votre demande de streaming.
- SessionId
-
Fournit l'identifiant de votre session de transcription.
Contraintes de longueur : longueur de 36.
Modèle :
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Indique si le partitionnement des haut-parleurs a été activé pour votre transcription.
- VocabularyFilterMethod
-
Fournit la méthode de filtrage du vocabulaire utilisée dans votre transcription.
Valeurs valides :
remove | mask | tag
- VocabularyFilterName
-
Fournit le nom du filtre de vocabulaire personnalisé que vous avez spécifié dans votre demande.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
- VocabularyFilterNames
-
Fournit les noms des filtres de vocabulaire personnalisés que vous avez spécifiés dans votre demande.
Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.
Modèle :
^[a-zA-Z0-9,-._]+
- VocabularyName
-
Fournit le nom du vocabulaire personnalisé que vous avez spécifié dans votre demande.
Contraintes de longueur : Longueur minimum de 1. Longueur maximum de 200.
Modèle :
^[0-9a-zA-Z._-]+
- VocabularyNames
-
Fournit les noms des vocabulaires personnalisés que vous avez spécifiés dans votre demande.
Contraintes de longueur : Longueur minimum de 1. Longueur de 3 000.
Modèle :
^[a-zA-Z0-9,-._]+
Les données suivantes sont renvoyées au format JSON par le service.
- TranscriptResultStream
-
Fournit des informations détaillées sur votre session de streaming.
Type : objet TranscriptResultStream
Erreurs
Pour plus d'informations sur les erreurs communes à toutes les actions, reportez-vous à la sectionErreurs courantes.
- BadRequestException
-
Un ou plusieurs arguments en faveur de l'
StartCallAnalyticsStreamTranscription
opérationStartStreamTranscription
StartMedicalStreamTranscription
, ou n'étaient pas valides. Par exemple,MediaEncoding
ou vous avezLanguageCode
utilisé des valeurs non prises en charge. Vérifiez les paramètres spécifiés et réessayez votre demande.Code d'état HTTP : 400
- ConflictException
-
Un nouveau flux a commencé avec le même identifiant de session. Le flux actuel a été interrompu.
Code d'état HTTP : 409
- InternalFailureException
-
Un problème est survenu lors du traitement de l'audio. Amazon Transcribe a mis fin au traitement.
Code d'état HTTP : 500
- LimitExceededException
-
Votre client a dépassé l'une des limites d'Amazon Transcribe. Il s'agit généralement de la limite de longueur audio. Divisez votre flux audio en petits morceaux et réessayez votre demande.
Code d'état HTTP : 429
- ServiceUnavailableException
-
Le service n'est pas disponible actuellement. Réessayez votre demande plus tard.
HTTP Status Code: 503
Voir aussi
Pour plus d'informations sur l'utilisation de cette API dans l'un des kits SDK AWS spécifiques au langage, consultez les ressources suivantes :