

AWS Data Pipeline tidak lagi tersedia untuk pelanggan baru. Pelanggan yang sudah ada AWS Data Pipeline dapat terus menggunakan layanan seperti biasa. [Pelajari selengkapnya](https://aws.amazon.com/blogs/big-data/migrate-workloads-from-aws-data-pipeline/)

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# CopyActivity
<a name="dp-object-copyactivity"></a>

Menyalin data dari satu lokasi ke lokasi lain. `CopyActivity`mendukung [S3 DataNode](dp-object-s3datanode.md) dan [SqlDataNode](dp-object-sqldatanode.md) sebagai input dan output dan operasi penyalinan biasanya dilakukan record-by-record. Namun, `CopyActivity` menyediakan performa tinggi Amazon S3 untuk salinan Amazon S3 ketika semua syarat berikut terpenuhi:
+ Input dan outputnya adalah S3 DataNodes
+ Bidang `dataFormat` adalah sama untuk input dan output

Jika Anda menyediakan file data terkompresi sebagai input dan tidak menunjukkan ini menggunakan bidang `compression` pada simpul data S3, `CopyActivity` mungkin gagal. Dalam kasus ini, `CopyActivity` tidak mendeteksi dengan benar akhir karakter catatan dan operasi gagal. Selanjutnya, `CopyActivity` mendukung penyalinan dari direktori ke direktori lain dan menyalin file ke direktori, tetapi record-by-record salinan terjadi ketika menyalin direktori ke file. Akhirnya, `CopyActivity` tidak men-support penyalinan file Amazon S3 multibagian. 

`CopyActivity` memiliki keterbatasan khusus untuk support CSV nya. Saat Anda menggunakan S3 DataNode sebagai masukan`CopyActivity`, Anda hanya dapat menggunakan Unix/Linux varian format file data CSV untuk bidang input dan output Amazon S3. Unix/Linux Varian membutuhkan yang berikut: 
+ Pemisah harus karakter "," (koma).
+ Catatan tidak dikutip.
+ Karakter escape default adalah nilai ASCII 92 (backslash).
+ Akhir dari pengidentifikasi catatan adalah nilai ASCII 10 (atau "\$1n").

Sistem berbasis Windows biasanya menggunakan urutan end-of-record karakter yang berbeda: carriage return dan line feed bersama-sama (nilai ASCII 13 dan nilai ASCII 10). Anda harus mengakomodasi perbedaan ini menggunakan mekanisme tambahan, seperti skrip pra-copy untuk memodifikasi input data, untuk memastikan bahwa `CopyActivity` dapat mendeteksi akhir dari sebuah catatan dengan benar; jika tidak, `CopyActivity` akan gagal berulang kali.

Saat menggunakan `CopyActivity` untuk mengekspor dari objek PostgreSQL RDS ke format data TSV, karakter NULL default adalah \$1n.

## Contoh
<a name="copyactivity-example"></a>

Berikut adalah contoh dari jenis objek ini. Objek ini mereferensikan tiga objek lain yang akan Anda tetapkan dalam file definisi alur yang sama. `CopyPeriod` adalah objek `Schedule` dan `InputData` dan `OutputData` adalah objek simpul data.

```
{
  "id" : "S3ToS3Copy",
  "type" : "CopyActivity",
  "schedule" : { "ref" : "CopyPeriod" },
  "input" : { "ref" : "InputData" },
  "output" : { "ref" : "OutputData" },
  "runsOn" : { "ref" : "MyEc2Resource" }
}
```

## Sintaksis
<a name="copyactivity-syntax"></a>


****  

| Bidang Invokasi Objek | Deskripsi | Jenis Slot | 
| --- | --- | --- | 
| jadwal | Objek ini dipanggil dalam pelaksanaan interval jadwal. Pengguna harus menentukan referensi jadwal ke objek lain untuk mengatur urutan eksekusi ketergantungan untuk objek ini. Pengguna dapat memenuhi persyaratan ini dengan secara eksplisit mengatur jadwal pada objek, misalnya, dengan menentukan “jadwal”: \$1"ref”: "“\$1. DefaultSchedule Dalam kebanyakan kasus, lebih baik untuk menempatkan referensi jadwal pada objek alur default sehingga semua objek mewarisi jadwal itu. Atau, jika alur memiliki pohon jadwal (jadwal dalam jadwal utama), pengguna dapat membuat objek induk yang memiliki referensi jadwal. Untuk informasi selengkapnya tentang konfigurasi jadwal opsional contoh, lihat [https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-schedule.html](https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-schedule.html) | Objek Referensi, misalnya “schedule”: \$1"ref”:” myScheduleId “\$1 | 


****  

| Grup yang diperlukan (Salah satu dari berikut ini diperlukan) | Deskripsi | Jenis Slot | 
| --- | --- | --- | 
| runsOn | Sumber daya komputasi untuk menjalankan aktivitas atau perintah. Misalnya, instans Amazon EC2 atau klaster Amazon EMR. | Objek Referensi, misalnya “RunsOn”: \$1"ref”:” “\$1 myResourceId | 
| workerGroup | Kelompok pekerja. Ini digunakan untuk tugas perutean. Jika Anda memberikan nilai runsOn dan workerGroup ada, workerGroup diabaikan. | String | 

 


****  

| Bidang Opsional | Deskripsi | Jenis Slot | 
| --- | --- | --- | 
| attemptStatus | Baru-baru ini melaporkan status dari aktivitas jarak jauh. | String | 
| attemptTimeout | Timeout untuk penyelesaian pekerjaan jarak jauh. Jika disetel maka aktivitas jarak jauh yang tidak selesai dalam waktu mulai yang ditetapkan dapat dicoba lagi. | Periode | 
| dependsOn | Tentukan dependensi pada objek yang bisa dijalankan lainnya. | Objek Referensi, misalnya “DependsOn”: \$1"ref”:” “\$1 myActivityId | 
| failureAndRerunModus | Menjelaskan perilaku simpul konsumen ketika dependensi gagal atau menjalankan kembali | Pencacahan | 
| input | Sumber data input. | Objek Referensi, misalnya “input”: \$1"ref”:” myDataNode Id "\$1 | 
| lateAfterTimeout | Waktu berlalu setelah alur mulai di mana objek harus menyelesaikan. Hal ini dipicu hanya ketika jenis jadwal tidak disetel ke ondemand. | Periode | 
| maxActiveInstances | Jumlah maksimum instans aktif bersamaan dari suatu komponen. Re-runs tidak dihitung terhadap jumlah instans aktif. | Bilangan Bulat | 
| maximumRetries | Jumlah maksimum percobaan ulang pada pelanggaran | Bilangan Bulat | 
| onFail | Tindakan untuk dijalankan ketika objek saat ini gagal. | Objek Referensi, misalnya “onFail”: \$1"ref”:” “\$1 myActionId | 
| onLateAction | Tindakan yang harus dipicu jika objek belum dijadwalkan atau masih belum selesai. | Objek Referensi, misalnya "onLateAction“: \$1" ref”:” myActionId “\$1 | 
| onSuccess | Tindakan untuk dijalankan ketika objek saat ini berhasil. | Objek Referensi, misalnya “onSuccess”: \$1"ref”:” “\$1 myActionId | 
| output | Sumber data output. | Objek Referensi, misalnya “output”: \$1"ref”:” myDataNode Id "\$1 | 
| induk | Induk dari objek saat ini dari mana slot akan diwariskan. | Objek Referensi, misalnya “induk”: \$1"ref”:” myBaseObject Id "\$1 | 
| pipelineLogUri | URI S3 (seperti 's3://BucketName/Key/ ') untuk mengunggah log untuk pipeline. | String | 
| prasyarat | Mendefinisikan prasyarat secara opsional. Sebuah simpul data tidak ditandai "READY" sampai semua prasyarat telah terpenuhi. | Objek Referensi, misalnya “prasyarat”: \$1"ref”:” “myPreconditionId\$1 | 
| reportProgressTimeout | Timeout untuk panggilan kerja jarak jauh berturut-turut ke reportProgress. Jika disetel, maka kegiatan jarak jauh yang tidak melaporkan kemajuan untuk jangka waktu tertentu dapat dianggap terhenti dan jadi dicoba lagi. | Periode | 
| retryDelay | Durasi timeout antara dua upaya coba lagi. | Periode | 
| scheduleType | Jenis jadwal mengizinkan Anda untuk menentukan apakah objek dalam definisi alur Anda harus dijadwalkan pada awal interval atau akhir interval. Penjadwalan Gaya Deret Waktu berarti instans dijadwalkan pada akhir setiap interval dan Penjadwalan Gaya Cron berarti intans dijadwalkan pada awal setiap interval. Jadwal sesuai permintaan mengizinkan Anda untuk menjalankan alur satu kali per aktivasi. Ini berarti Anda tidak perlu meng-klon atau membuat ulang alur untuk menjalankannya lagi. Jika Anda menggunakan jadwal sesuai permintaan itu harus ditentukan dalam objek default dan harus menjadi satu-satunya scheduleType yang ditentukan untuk objek dalam alur. Untuk menggunakan saluran pipa sesuai permintaan, Anda cukup memanggil ActivatePipeline operasi untuk setiap proses berikutnya. Nilai adalah: cron, ondemand, dan timeseries. | Pencacahan | 

 


****  

| Bidang Runtime | Deskripsi | Jenis Slot | 
| --- | --- | --- | 
| @activeInstances | Daftar objek instans aktif terjadwal saat ini. | Objek Referensi, misalnya “ActiveInstances”: \$1"ref”:” Id "\$1 myRunnableObject | 
| @actualEndTime | Waktu ketika eksekusi objek ini selesai. | DateTime | 
| @actualStartTime | Waktu ketika eksekusi objek ini dimulai. | DateTime | 
| cancellationReason | cancellationReason jika objek ini dibatalkan. | String | 
| @cascadeFailedOn | Deskripsi rantai ketergantungan tempat objek gagal. | Objek Referensi, misalnya "cascadeFailedOn“: \$1" ref”:” myRunnableObject Id "\$1 | 
| emrStepLog | Log langkah EMR hanya tersedia pada upaya aktivitas EMR | String | 
| errorId | errorId jika objek ini gagal. | String | 
| errorMessage | errorMessage jika objek ini gagal. | String | 
| errorStackTrace | Jejak tumpukan kesalahan jika objek ini gagal. | String | 
| @finishedTime | Waktu saat objek ini menyelesaikan eksekusinya. | DateTime | 
| hadoopJobLog | log tugas Hadoop tersedia pada upaya untuk kegiatan berbasis EMR. | String | 
| @healthStatus | Status kondisi objek yang mencerminkan keberhasilan atau kegagalan instans objek terakhir yang mencapai keadaan dihentikan. | String | 
| @healthStatusFromInstanceId | Id dari objek instans terakhir yang mencapai keadaan dihentikan. | String | 
| @ healthStatusUpdated Waktu | Waktu di mana status kondisi diperbarui terakhir kali. | DateTime | 
| hostname | Nama host klien yang mengambil upaya tugas. | String | 
| @lastDeactivatedTime | Waktu di mana objek ini terakhir dinonaktifkan. | DateTime | 
| @ latestCompletedRun Waktu | Waktu proses terakhir yang eksekusinya selesai. | DateTime | 
| @latestRunTime | Waktu proses terakhir untuk eksekusi yang dijadwalkan. | DateTime | 
| @nextRunTime | Waktu run yang akan dijadwalkan berikutnya. | DateTime | 
| reportProgressTime | Waktu terbaru bahwa aktivitas jarak jauh melaporkan kemajuan. | DateTime | 
| @scheduledEndTime | Jadwalkan waktu akhir untuk objek | DateTime | 
| @scheduledStartTime | Jadwalkan waktu mulai untuk objek | DateTime | 
| @status | Status objek ini. | String | 
| @version | Versi alur objek dibuat dengan. | String | 
| @waitingOn | Deskripsi daftar dependensi objek ini sedang menunggu. | Objek Referensi, misalnya “WaitingOn”: \$1"ref”:” Id "\$1 myRunnableObject | 

 


****  

| Bidang Sistem | Deskripsi | Jenis Slot | 
| --- | --- | --- | 
| @error | Galat mendeskripsikan obyek yang tidak terbentuk | String | 
| @pipelineId | Id dari alur tempat objek ini berada | String | 
| @sphere | Lingkup dari sebuah objek menunjukkan tempatnya dalam siklus hidup: Component Objects memunculkan Instance Objects yang mengeksekusi Attempt Objects | String | 

## Lihat Juga
<a name="copyactivity-seealso"></a>
+ [ShellCommandActivity](dp-object-shellcommandactivity.md)
+ [EmrActivity](dp-object-emractivity.md)
+ [Ekspor Data MySQL ke Amazon S3 Menggunakan AWS Data Pipeline](dp-copydata-mysql.md)