

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Algoritma Analisis Komponen Utama (PCA)
<a name="pca"></a>

PCA adalah algoritma pembelajaran mesin tanpa pengawasan yang mencoba mengurangi dimensi (jumlah fitur) dalam kumpulan data sambil tetap mempertahankan informasi sebanyak mungkin. Ini dilakukan dengan menemukan serangkaian fitur baru yang disebut *komponen*, yang merupakan komposit dari fitur asli yang tidak berkorelasi satu sama lain. Mereka juga dibatasi sehingga komponen pertama menyumbang variabilitas terbesar yang mungkin dalam data, komponen kedua adalah variabilitas terbanyak kedua, dan seterusnya.

Di Amazon SageMaker AI, PCA beroperasi dalam dua mode, tergantung pada skenario: 
+ **reguler**: Untuk kumpulan data dengan data yang jarang dan jumlah pengamatan dan fitur yang moderat.
+ **acak**: Untuk kumpulan data dengan sejumlah besar pengamatan dan fitur. Mode ini menggunakan algoritma aproksimasi. 

PCA menggunakan data tabular. 

Baris mewakili pengamatan yang ingin Anda tanamkan di ruang dimensi yang lebih rendah. Kolom mewakili fitur yang ingin Anda temukan perkiraan yang dikurangi. Algoritma menghitung matriks kovarians (atau perkiraannya secara terdistribusi), dan kemudian melakukan dekomposisi nilai tunggal pada ringkasan ini untuk menghasilkan komponen utama. 

**Topics**
+ [Antarmuka Input/Output untuk Algoritma PCA](#pca-inputoutput)
+ [Rekomendasi Instans EC2 untuk Algoritma PCA](#pca-instances)
+ [Contoh Notebook PCA](#PCA-sample-notebooks)
+ [Bagaimana PCA Bekerja](how-pca-works.md)
+ [Hiperparameter PCA](PCA-reference.md)
+ [Format Respons PCA](PCA-in-formats.md)

## Antarmuka Input/Output untuk Algoritma PCA
<a name="pca-inputoutput"></a>

Untuk pelatihan, PCA mengharapkan data yang disediakan di saluran kereta api, dan secara opsional mendukung kumpulan data yang diteruskan ke kumpulan data pengujian, yang dinilai oleh algoritme akhir. Keduanya `recordIO-wrapped-protobuf` dan `CSV` format didukung untuk pelatihan. Anda dapat menggunakan mode File atau mode Pipa untuk melatih model pada data yang diformat sebagai `recordIO-wrapped-protobuf` atau sebagai`CSV`.

Untuk inferensi, PCA mendukung`text/csv`,`application/json`, dan. `application/x-recordio-protobuf` Hasil dikembalikan dalam salah satu `application/json` atau `application/x-recordio-protobuf` format dengan vektor “proyeksi.”

Untuk informasi lebih lanjut tentang format file input dan output, lihat [Format Respons PCA](PCA-in-formats.md) untuk inferensi dan file. [Contoh Notebook PCA](#PCA-sample-notebooks)

## Rekomendasi Instans EC2 untuk Algoritma PCA
<a name="pca-instances"></a>

PCA mendukung instance CPU dan GPU untuk pelatihan dan inferensi. Jenis instance mana yang paling berkinerja sangat bergantung pada spesifikasi data input. Untuk instans GPU, PCA mendukung P2, P3, G4dn, dan G5.

## Contoh Notebook PCA
<a name="PCA-sample-notebooks"></a>

Untuk contoh buku catatan yang menunjukkan cara menggunakan algoritme Analisis Komponen Utama SageMaker AI untuk menganalisis gambar digit tulisan tangan dari nol hingga sembilan dalam kumpulan data MNIST, lihat [Pengantar](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/pca_mnist/pca_mnist.html) PCA dengan MNIST. Untuk petunjuk cara membuat dan mengakses instance notebook Jupyter yang dapat Anda gunakan untuk menjalankan contoh di SageMaker AI, lihat. [Instans SageMaker notebook Amazon](nbi.md) Setelah Anda membuat instance notebook dan membukanya, pilih tab **Contoh SageMaker AI** untuk melihat daftar semua sampel SageMaker AI. Contoh buku catatan pemodelan topik menggunakan algoritme NTM terletak di bagian Pengantar Algoritma **Amazon**. Untuk membuka buku catatan, klik tab **Use** dan pilih **Create copy**.