File di input di dati paralleli per Amazon Translate - Amazon Translate

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

File di input di dati paralleli per Amazon Translate

Prima di poter creare una risorsa di dati parallela in Amazon Translate, devi creare un file di input che contenga gli esempi di traduzione. Il tuo file di input di dati parallelo deve utilizzare le lingue supportate da Amazon Translate. Per un elenco di queste lingue, consultaLingue e codici di lingua supportati.

Esempio di dati paralleli

Il testo nella tabella seguente fornisce esempi di segmenti di traduzione che possono essere formattati in un file di input dati parallelo:

en es zh

Amazon Translate è un servizio di traduzione automatica neurale.

Amazon Translate è un servizio di traduzione automatica basato su reti neuronali.

Amazon Translate:。

La traduzione automatica neurale è una forma di automazione della traduzione linguistica che utilizza modelli di deep learning.

La traduzione automatica neuronale è un modo per automatizzare la traduzione delle lingue utilizzando modelli di apprendimento approfondito.

«

Amazon Translate ti consente di localizzare contenuti per utenti internazionali.

Amazon Translate le consente di localizzare contenuti per utenti internazionali.

Amazon Translate |。

La prima riga della tabella fornisce i codici delle lingue. La prima lingua, l'inglese (en), è la lingua di origine. Lo spagnolo (es) e il cinese (zh) sono le lingue di destinazione. La prima colonna fornisce esempi di testo sorgente. Le altre colonne contengono esempi di traduzioni. Quando questi dati paralleli personalizzano un processo batch, Amazon Translate adatta la traduzione per riflettere gli esempi.

Formati di file di input

Amazon Translate supporta i seguenti formati per i file di input paralleli di dati:

  • Translation Memory eXchange (TMX)

  • Valori separati da virgole (CSV)

  • Valori separati da tabulazioni (TSV)

TMX

Esempio File di input TMX

Il seguente file TMX di esempio definisce dati paralleli in un formato accettato da Amazon Translate. In questo file, l'inglese (en) è la lingua di origine. Lo spagnolo (es) e il cinese (zh) sono le lingue di destinazione. Come file di input per dati paralleli, fornisce diversi esempi che Amazon Translate può utilizzare per personalizzare l'output di un processo batch.

<?xml version="1.0" encoding="UTF-8"?> <tmx version="1.4"> <header srclang="en"/> <body> <tu> <tuv xml:lang="en"> <seg>Amazon Translate is a neural machine translation service.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate es un servicio de traducción automática basado en redes neuronales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 是一项神经机器翻译服务。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Neural machine translation is a form of language translation automation that uses deep learning models.</seg> </tuv> <tuv xml:lang="es"> <seg>La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.</seg> </tuv> <tuv xml:lang="zh"> <seg>神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Amazon Translate allows you to localize content for international users.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate le permite localizar contenido para usuarios internacionales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 允许您为国际用户本地化内容。</seg> </tuv> </tu> </body> </tmx>
Requisiti TMX

Ricorda i seguenti requisiti di Amazon Translate quando definisci i dati paralleli in un file TMX:

  • Amazon Translate supporta TMX 1.4b. Per ulteriori informazioni, consulta la specifica TMX 1.4b sul sito Web della Globalization and Localization Association.

  • L'headerelemento deve includere l'attributo. srclang Il valore di questo attributo determina la lingua di origine dei dati paralleli.

  • L'bodyelemento deve contenere almeno un elemento di unità di traduzione (tu).

  • Ogni tu elemento deve contenere almeno due elementi dell'unità di traduzione variant (tuv). Uno di questi tuv elementi deve avere un xml:lang attributo con lo stesso valore di quello assegnato all'srclangattributo nell'headerelemento.

  • Tutti tuv gli elementi devono avere l'xml:langattributo.

  • Tutti tuv gli elementi devono avere un elemento segment (seg).

  • Durante l'elaborazione del file di input, Amazon Translate salta alcuni tuv elementi tu o se incontra seg elementi vuoti o contenenti solo spazi bianchi:

    • Se l'segelemento corrisponde alla lingua di origine, Amazon Translate ignora l'tuelemento occupato dall'segelemento.

    • Se l'segelemento corrisponde a una lingua di destinazione, Amazon Translate salta solo l'tuvelemento occupato dall'segelemento.

  • Durante l'elaborazione del file di input, Amazon Translate salta alcuni tuv elementi tu o se incontra seg elementi che superano i 1000 byte:

    • Se l'segelemento corrisponde alla lingua di origine, Amazon Translate ignora l'tuelemento occupato dall'segelemento.

    • Se l'segelemento corrisponde a una lingua di destinazione, Amazon Translate salta solo l'tuvelemento occupato dall'segelemento.

  • Se il file di input contiene più tu elementi con lo stesso testo sorgente, Amazon Translate esegue una delle seguenti operazioni:

    • Se gli tu elementi hanno l'changedateattributo, utilizza l'elemento con la data più recente.

    • Altrimenti, utilizza l'elemento che si trova più vicino alla fine del file.

CSV

Il seguente file CSV di esempio definisce dati paralleli in un formato accettato da Amazon Translate. In questo file, l'inglese (en) è la lingua di origine. Lo spagnolo (es) e il cinese (zh) sono le lingue di destinazione. Come file di input per dati paralleli, fornisce diversi esempi che Amazon Translate può utilizzare per personalizzare l'output di un processo batch.

Esempio File di input CSV
en,es,zh Amazon Translate is a neural machine translation service.,Amazon Translate es un servicio de traducción automática basado en redes neuronales.,Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models.,La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.,神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users.,Amazon Translate le permite localizar contenido para usuarios internacionales.,Amazon Translate 允许您为国际用户本地化内容。
Requisiti CSV

Ricorda i seguenti requisiti di Amazon Translate quando definisci i dati paralleli in un file CSV:

  • La prima riga è composta dai codici della lingua. Il primo codice è la lingua di origine e ogni codice successivo è una lingua di destinazione.

  • Ogni campo nella prima colonna contiene il testo sorgente. Ogni campo in una colonna successiva contiene una traduzione di destinazione.

  • Se il testo di un campo contiene una virgola, il testo deve essere racchiuso tra virgolette doppie («).

  • Un campo di testo non può estendersi su più righe.

  • I campi non possono iniziare con i seguenti caratteri: +, -, =, @. Questo requisito si applica indipendentemente dal fatto che il campo sia racchiuso o meno tra virgolette doppie («).

  • Se il testo in un campo contiene virgolette doppie («), deve essere preceduto da virgolette doppie. Ad esempio, testo come:

    34" monitor

    Deve essere scritto come:

    34"" monitor
  • Durante l'elaborazione del file di input, Amazon Translate salterà determinate righe o campi se incontra campi vuoti o contenenti solo spazi bianchi:

    • Se un campo di testo sorgente è vuoto, Amazon Translate salta la riga che occupa.

    • Se un campo di traduzione di destinazione è vuoto, Amazon Translate salta solo quel campo.

  • Durante l'elaborazione del file di input, Amazon Translate salta determinate righe o campi se incontra campi che superano i 1000 byte:

    • Se un campo di testo sorgente supera il limite di byte, Amazon Translate salta la riga che occupa.

    • Se un campo di traduzione di destinazione supera il limite di byte, Amazon Translate salta solo quel campo.

  • Se il file di input contiene più record con lo stesso testo sorgente, Amazon Translate utilizza il record che si trova più vicino alla fine del file.

TSV

Il seguente file TSV di esempio definisce dati paralleli in un formato accettato da Amazon Translate. In questo file, l'inglese (en) è la lingua di origine. Lo spagnolo (es) e il cinese (zh) sono le lingue di destinazione. Come file di input per dati paralleli, fornisce diversi esempi che Amazon Translate può utilizzare per personalizzare l'output di un processo batch.

Esempio File di input TSV
en es zh Amazon Translate is a neural machine translation service. Amazon Translate es un servicio de traducción automática basado en redes neuronales. Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models. La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo. 神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users. Amazon Translate le permite localizar contenido para usuarios internacionales. Amazon Translate 允许您为国际用户本地化内容。
Requisiti TSV

Ricorda i seguenti requisiti di Amazon Translate quando definisci i dati paralleli in un file TSV:

  • La prima riga è composta dai codici della lingua. Il primo codice è la lingua di origine e ogni codice successivo è una lingua di destinazione.

  • Ogni campo nella prima colonna contiene il testo sorgente. Ogni campo in una colonna successiva contiene una traduzione di destinazione.

  • Se il testo di un campo contiene un carattere di tabulazione, il testo deve essere racchiuso tra virgolette doppie («).

  • Un campo di testo non può estendersi su più righe.

  • I campi non possono iniziare con i seguenti caratteri: +, -, =, @. Questo requisito si applica indipendentemente dal fatto che il campo sia racchiuso o meno tra virgolette doppie («).

  • Se il testo in un campo contiene virgolette doppie («), deve essere preceduto da virgolette doppie. Ad esempio, testo come:

    34" monitor

    Deve essere scritto come:

    34"" monitor
  • Durante l'elaborazione del file di input, Amazon Translate salta determinate righe o campi se incontra campi vuoti o contenenti solo spazi bianchi:

    • Se un campo di testo sorgente è vuoto, Amazon Translate salta la riga che occupa.

    • Se un campo di traduzione di destinazione è vuoto, Amazon Translate salta solo quel campo.

  • Durante l'elaborazione del file di input, Amazon Translate salta determinate righe o campi se incontra campi che superano i 1000 byte:

    • Se un campo di testo sorgente supera il limite di byte, Amazon Translate salta la riga che occupa.

    • Se un campo di traduzione di destinazione supera il limite di byte, Amazon Translate salta solo quel campo.

  • Se il file di input contiene più record con lo stesso testo sorgente, Amazon Translate utilizza il record che si trova più vicino alla fine del file.