File input data paralel untuk Amazon Translate - Amazon Translate

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

File input data paralel untuk Amazon Translate

Sebelum Anda dapat membuat sumber daya data parallel di Amazon Translate, Anda harus membuat file input yang berisi contoh terjemahan Anda. File input data parallel Anda harus menggunakan bahasa yang didukung Amazon Translate. Untuk daftar bahasa ini, lihatBahasa dan kode bahasa yang didukung.

Contoh data parallel

Teks dalam tabel berikut memberikan contoh segmen terjemahan yang dapat diformat menjadi file input data parallel:

id es zh

Amazon Translate adalah layanan terjemahan mesin saraf.

Amazon Translate es un servicio de traducción automática basado en redes neuronales.

Amazon Translate

Terjemahan mesin saraf adalah bentuk otomatisasi terjemahan bahasa yang menggunakan model pembelajaran mendalam.

La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.

,一。

Amazon Translate memungkinkan Anda melokalkan konten untuk pengguna internasional.

Amazon Translate le permite localizar contenido para pengguna internasional.

Amazon Translate

Baris pertama dari tabel menyediakan kode bahasa. Bahasa pertama, Bahasa Inggris (en), adalah bahasa sumber. Bahasa Spanyol (es) dan Mandarin (zh) adalah bahasa target. Kolom pertama memberikan contoh teks sumber. Kolom lainnya berisi contoh terjemahan. Ketika data parallel ini mengkustomisasi tugas batch, Amazon Translate menyesuaikan terjemahan untuk mencerminkan contoh.

Format file input

Amazon Translate mendukung format berikut untuk file input data parallel:

  • Terjemahan Memory eXexchange (TMX)

  • Nilai yang dipisahkan koma (CSV)

  • Nilai yang dipisahkan tab (TSV)

TMX

contoh File input

Contoh file TMX berikut mendefinisikan data parallel dalam format yang diterima Amazon Translate. Dalam file ini, Bahasa Inggris (en) adalah bahasa sumber. Bahasa Spanyol (es) dan Mandarin (zh) adalah bahasa target. Sebagai file input untuk data parallel, file ini menyediakan beberapa contoh yang dapat digunakan Amazon Translate untuk menyesuaikan output pekerjaan batch.

<?xml version="1.0" encoding="UTF-8"?> <tmx version="1.4"> <header srclang="en"/> <body> <tu> <tuv xml:lang="en"> <seg>Amazon Translate is a neural machine translation service.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate es un servicio de traducción automática basado en redes neuronales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 是一项神经机器翻译服务。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Neural machine translation is a form of language translation automation that uses deep learning models.</seg> </tuv> <tuv xml:lang="es"> <seg>La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.</seg> </tuv> <tuv xml:lang="zh"> <seg>神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。</seg> </tuv> </tu> <tu> <tuv xml:lang="en"> <seg>Amazon Translate allows you to localize content for international users.</seg> </tuv> <tuv xml:lang="es"> <seg>Amazon Translate le permite localizar contenido para usuarios internacionales.</seg> </tuv> <tuv xml:lang="zh"> <seg>Amazon Translate 允许您为国际用户本地化内容。</seg> </tuv> </tu> </body> </tmx>
Persyaratan TMX

Ingat persyaratan berikut dari Amazon Translate saat Anda menentukan data parallel dalam file TMX:

  • Amazon Translate mendukung TMX 1.4b. Untuk informasi selengkapnya, lihatSpesifikasi TMX 1.4bdi situs Asosiasi Globalisasi dan Lokalisasi.

  • Klasterheaderelemen harus mencakupsrclangatribut Nilai atribut ini menentukan bahasa sumber dari data parallel.

  • KlasterbodyElemen harus berisi setidaknya satu unit terjemahan (tuElemen)

  • MASING-MASINGtuelemen harus berisi setidaknya dua varian unit terjemahan (tuvElemen) Salah satutuv elements must have an xml:langatribut yang memiliki nilai yang sama dengan yang ditugaskan kesrclangatributheaderElemen

  • Semuatuv elements must have the xml:langatribut

  • Semuatuvelemen harus memiliki segmen (segElemen)

  • Saat memproses file input Anda, Amazon Translate melewatkantuatautuvelemen jika bertemusegelemen yang kosong atau hanya berisi ruang putih:

    • Jikasegelemen sesuai dengan bahasa sumber, Amazon Translate melompattu element that the segElemen menempati

    • Jikasegelemen sesuai dengan bahasa target, Amazon Translate melompat hanyatuv element that the segElemen menempati

  • Saat memproses file input Anda, Amazon Translate melewatkantuatautuvelemen jika bertemusegelemen yang melebihi 1000 byte:

    • Jikasegelemen sesuai dengan bahasa sumber, Amazon Translate melompattu element that the segElemen menempati

    • Jikasegelemen sesuai dengan bahasa target, Amazon Translate melompat hanyatuv element that the segElemen menempati

  • Jika file inputtuElemen sumber daya yang sama, Amazon Translate melakukan salah satu hal berikut:

    • Jikatu elements have the changedateatribut, menggunakan elemen dengan tanggal terbaru.

    • Jika tidak, ia menggunakan elemen yang terjadi paling dekat dengan akhir file.

CSV

Contoh file CSV berikut mendefinisikan data parallel dalam format yang diterima Amazon Translate. Dalam file ini, Bahasa Inggris (en) adalah bahasa sumber. Bahasa Spanyol (es) dan Mandarin (zh) adalah bahasa target. Sebagai file input untuk data parallel, file ini menyediakan beberapa contoh yang dapat digunakan Amazon Translate untuk menyesuaikan output pekerjaan batch.

contoh File input CSV
en,es,zh Amazon Translate is a neural machine translation service.,Amazon Translate es un servicio de traducción automática basado en redes neuronales.,Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models.,La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo.,神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users.,Amazon Translate le permite localizar contenido para usuarios internacionales.,Amazon Translate 允许您为国际用户本地化内容。
Persyaratan CSV

Ingat persyaratan berikut dari Amazon Translate saat Anda menentukan data parallel dalam file CSV:

  • Baris pertama terdiri dari kode bahasa. Kode pertama adalah bahasa sumber, dan setiap kode berikutnya adalah bahasa target.

  • Setiap bidang di kolom pertama berisi teks sumber. Setiap bidang di kolom berikutnya berisi terjemahan target.

  • Jika teks dalam bidang apapun berisi koma, teks harus tertutup dalam kutipan ganda (“) karakter.

  • Bidang teks tidak dapat menjangkau beberapa baris.

  • Bidang tidak dapat dimulai dengan karakter berikut: +, -, =, @. Persyaratan ini berlaku apakah bidang tertutup dalam tanda kutip ganda (“).

  • Jika teks dalam bidang berisi kutipan ganda (“), itu harus lolos dengan kutipan ganda. Misalnya, teks seperti:

    34" monitor

    Harus ditulis sebagai:

    34"" monitor
  • Saat memproses file input Anda, Amazon Translate akan melewati baris atau bidang tertentu jika menemukan bidang yang kosong atau hanya berisi spasi putih:

    • Jika bidang teks sumber kosong, Amazon Translate melewatkan baris yang ditempati.

    • Jika bidang terjemahan target kosong, Amazon Translate hanya melompati bidang itu.

  • Saat memproses file input Anda, Amazon Translate melewatkan baris atau bidang tertentu jika menemukan bidang yang melebihi 1000 byte:

    • Jika bidang teks sumber melebihi batas byte, Amazon Translate melewatkan baris yang ditempati.

    • Jika bidang terjemahan target melebihi batas byte, Amazon Translate hanya melompati bidang itu.

  • Jika file input berisi beberapa rekaman dengan teks sumber yang sama, Amazon Translate menggunakan rekaman yang terjadi paling dekat dengan akhir file.

TSV

Contoh file TSV berikut mendefinisikan data parallel dalam format yang diterima Amazon Translate. Dalam file ini, Bahasa Inggris (en) adalah bahasa sumber. Bahasa Spanyol (es) dan Mandarin (zh) adalah bahasa target. Sebagai file input untuk data parallel, file ini menyediakan beberapa contoh yang dapat digunakan Amazon Translate untuk menyesuaikan output pekerjaan batch.

contoh File input TSV
en es zh Amazon Translate is a neural machine translation service. Amazon Translate es un servicio de traducción automática basado en redes neuronales. Amazon Translate 是一项神经机器翻译服务。 Neural machine translation is a form of language translation automation that uses deep learning models. La traducción automática neuronal es una forma de automatizar la traducción de lenguajes utilizando modelos de aprendizaje profundo. 神经机器翻译使用深度学习模型,是一种语言翻译自动化的形式。 Amazon Translate allows you to localize content for international users. Amazon Translate le permite localizar contenido para usuarios internacionales. Amazon Translate 允许您为国际用户本地化内容。
Persyaratan TSV

Ingat persyaratan berikut dari Amazon Translate saat Anda menentukan data parallel dalam file TSV:

  • Baris pertama terdiri dari kode bahasa. Kode pertama adalah bahasa sumber, dan setiap kode berikutnya adalah bahasa target.

  • Setiap bidang di kolom pertama berisi teks sumber. Setiap bidang di kolom berikutnya berisi terjemahan target.

  • Jika teks dalam bidang apapun berisi karakter tab, teks harus tertutup dalam kutipan ganda (“) karakter.

  • Bidang teks tidak dapat menjangkau beberapa baris.

  • Bidang tidak dapat dimulai dengan karakter berikut: +, -, =, @. Persyaratan ini berlaku apakah bidang tertutup dalam tanda kutip ganda (“).

  • Jika teks dalam bidang berisi kutipan ganda (“), itu harus lolos dengan kutipan ganda. Misalnya, teks seperti:

    34" monitor

    Harus ditulis sebagai:

    34"" monitor
  • Saat memproses file input Anda, Amazon Translate melewatkan baris atau bidang tertentu jika menemukan bidang yang kosong atau hanya berisi spasi putih:

    • Jika bidang teks sumber kosong, Amazon Translate melewatkan baris yang ditempati.

    • Jika bidang terjemahan target kosong, Amazon Translate hanya melompati bidang itu.

  • Saat memproses file input Anda, Amazon Translate melewatkan baris atau bidang tertentu jika menemukan bidang yang melebihi 1000 byte:

    • Jika bidang teks sumber melebihi batas byte, Amazon Translate melewatkan baris yang ditempati.

    • Jika bidang terjemahan target melebihi batas byte, Amazon Translate hanya melompati bidang itu.

  • Jika file input berisi beberapa rekaman dengan teks sumber yang sama, Amazon Translate menggunakan rekaman yang terjadi paling dekat dengan akhir file.