Membuat saluran pipa Amazon OpenSearch Ingestion - OpenSearch Layanan Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat saluran pipa Amazon OpenSearch Ingestion

Pipeline adalah mekanisme yang digunakan Amazon OpenSearch Ingestion untuk memindahkan data dari sumbernya (dari mana data berasal) ke wastafelnya (ke mana data pergi). Dalam OpenSearch Ingestion, wastafel akan selalu menjadi domain OpenSearch Layanan Amazon tunggal, sedangkan sumber data Anda bisa berupa klien seperti Amazon S3, Fluent Bit, atau Collector. OpenTelemetry

Untuk informasi selengkapnya, lihat Pipelines dalam OpenSearch dokumentasi.

Prasyarat dan peran yang diperlukan IAM

Untuk membuat pipeline OpenSearch Ingestion, Anda harus memiliki sumber daya berikut:

  • IAMPeran yang akan diasumsikan oleh OpenSearch Ingestion untuk menulis ke wastafel. Anda akan menyertakan peran ini ARN dalam konfigurasi pipeline Anda.

  • Domain OpenSearch Layanan atau koleksi OpenSearch Tanpa Server untuk bertindak sebagai wastafel. Jika Anda menulis ke domain, itu harus menjalankan OpenSearch 1.0 atau yang lebih baru, atau Elasticsearch 7.4 atau yang lebih baru. Wastafel harus memiliki kebijakan akses yang memberikan izin yang sesuai untuk peran IAM pipeline Anda.

Untuk petunjuk untuk membuat sumber daya ini, lihat topik berikut:

catatan

Jika Anda menulis ke domain yang menggunakan kontrol akses berbutir halus, ada langkah-langkah tambahan yang perlu Anda selesaikan. Lihat Langkah 3: Petakan peran pipeline (hanya untuk domain yang menggunakan kontrol akses berbutir halus).

Diperlukan izin IAM

OpenSearch Ingestion menggunakan IAM izin berikut untuk membuat pipeline:

  • osis:CreatePipeline— Buat pipa.

  • osis:ValidatePipeline— Periksa apakah konfigurasi pipeline valid.

  • iam:PassRole— Lewati peran pipeline ke OpenSearch Ingestion sehingga dapat menulis data ke domain. Izin ini harus ada pada sumber daya peran pipeline (ARNyang Anda tentukan untuk sts_role_arn opsi dalam konfigurasi pipeline), atau hanya * jika Anda berencana untuk menggunakan peran yang berbeda di setiap pipeline.

Misalnya, kebijakan berikut memberikan izin untuk membuat pipeline:

{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Resource":"*", "Action":[ "osis:CreatePipeline", "osis:ListPipelineBlueprints", "osis:ValidatePipeline" ] }, { "Resource":[ "arn:aws:iam::your-account-id:role/pipeline-role" ], "Effect":"Allow", "Action":[ "iam:PassRole" ] } ] }

OpenSearch Ingestion juga mencakup izin yang dipanggilosis:Ingest, yang diperlukan untuk mengirim permintaan yang ditandatangani ke pipeline menggunakan Signature Version 4. Untuk informasi selengkapnya, lihat Membuat peran konsumsi.

catatan

Selain itu, pengguna pertama yang membuat pipeline di akun harus memiliki izin untuk iam:CreateServiceLinkedRole tindakan tersebut. Untuk informasi selengkapnya, lihat sumber daya peran pipeline.

Untuk informasi selengkapnya tentang setiap izin, lihat Tindakan, sumber daya, dan kunci kondisi untuk OpenSearch Tertelan di Referensi Otorisasi Layanan.

Menentukan versi pipeline

Saat Anda mengonfigurasi pipeline, Anda harus menentukan versi utama Data Prepper yang akan dijalankan pipeline. Untuk menentukan versi, sertakan version opsi dalam konfigurasi pipeline Anda:

version: "2" log-pipeline: source: ...

Saat Anda memilih Buat, OpenSearch Ingestion menentukan versi minor terbaru yang tersedia dari versi utama yang Anda tentukan, dan menyediakan pipeline dengan versi tersebut. Misalnya, jika Anda menentukanversion: "2", dan versi terbaru yang didukung dari Data Prepper adalah 2.1.1, OpenSearch Ingestion menyediakan pipeline Anda dengan versi 2.1.1. Kami tidak menampilkan versi minor yang sedang dijalankan pipeline Anda secara publik.

Untuk meningkatkan pipeline Anda saat versi utama baru dari Data Prepper tersedia, edit konfigurasi pipeline dan tentukan versi baru. Anda tidak dapat menurunkan versi pipeline ke versi sebelumnya.

catatan

OpenSearch Ingestion tidak segera mendukung versi baru dari Data Prepper segera setelah dirilis. Akan ada beberapa jeda antara saat versi baru tersedia untuk umum dan saat didukung di OpenSearch Ingestion. Selain itu, OpenSearch Ingestion mungkin secara eksplisit tidak mendukung versi mayor atau minor tertentu sama sekali. Untuk daftar lengkap, lihatVersi Data Prepper yang Didukung.

Setiap kali Anda membuat perubahan pada pipeline yang memulai penerapan biru/hijau, OpenSearch Ingestion dapat memutakhirkannya ke versi minor terbaru dari versi utama yang saat ini dikonfigurasi dalam file pipeline. YAML Untuk informasi lebih lanjut, lihatPenerapan biru/hijau untuk pembaruan saluran pipa. OpenSearch Ingestion tidak dapat mengubah versi utama pipeline Anda kecuali Anda secara eksplisit memperbarui version opsi dalam konfigurasi pipeline.

Menentukan jalur konsumsi

Untuk sumber berbasis tarik seperti OTeljejak dan OTelmetrik, OpenSearch Ingestion memerlukan path opsi tambahan dalam konfigurasi sumber Anda. Path adalah string seperti/log/ingest, yang mewakili URI jalur untuk konsumsi. Jalur ini mendefinisikan URI yang Anda gunakan untuk mengirim data ke pipeline.

Misalnya, Anda menentukan sub-pipeline entri berikut untuk pipeline konsumsi bernama: logs

entry-pipeline: source: http: path: "/my/test_path"

Saat Anda memasukkan data ke dalam pipeline, Anda harus menentukan titik akhir berikut dalam konfigurasi klien Anda:. https://logs-abcdefgh.us-west-2.osis.amazonaws.com/my/test_path

Jalur harus dimulai dengan garis miring (/) dan dapat berisi karakter khusus '-', '_', ' . ', dan'/', serta ${pipelineName} placeholder. Jika Anda menggunakan ${pipelineName} (sepertipath: "/${pipelineName}/test_path"), variabel diganti dengan nama sub-pipeline terkait. Dalam contoh ini, itu akan terjadihttps://logs.us-west-2.osis.amazonaws.com/entry-pipeline/test_path.

Membuat jaringan pipa

Bagian ini menjelaskan cara membuat pipeline OpenSearch Ingestion menggunakan konsol OpenSearch Layanan dan. AWS CLI

Untuk membuat pipa
  1. Masuk ke konsol OpenSearch Layanan Amazon di https://console.aws.amazon.com/aos/rumah.

  2. Pilih Pipelines di panel navigasi kiri dan pilih Create pipeline.

  3. Pilih pipeline kosong, atau pilih cetak biru konfigurasi. Cetak biru mencakup file konfigurasi YAML dan konfigurasi yang telah JSON dikonfigurasi untuk berbagai kasus penggunaan umum. Untuk informasi selengkapnya, lihat Menggunakan cetak biru untuk membuat pipeline.

    Pilih Pilih cetak biru.

  4. Masukkan nama untuk alur.

  5. (Opsional) Pilih Aktifkan buffer persisten. Buffer persisten menyimpan data Anda dalam buffer berbasis disk di beberapa. AZs Untuk informasi lebih lanjut, lihat Buffering persisten. Jika Anda mengaktifkan buffer persisten, pilih AWS Key Management Service kunci untuk mengenkripsi data buffer.

  6. Konfigurasikan kapasitas pipa minimum dan maksimum di Unit OpenSearch Komputasi Tertelan (). OCUs Untuk informasi selengkapnya, lihat Penskalaan pipa.

  7. Di bawah konfigurasi Pipeline, berikan konfigurasi pipeline Anda dalam YAML format. Jika Anda menggunakan cetak biru, konfigurasi sudah diisi sebelumnya, tetapi Anda harus membuat beberapa modifikasi.

    File konfigurasi pipeline tunggal dapat berisi 1-10 sub-pipeline. Setiap sub-pipa adalah kombinasi dari satu sumber, nol atau lebih prosesor, dan satu wastafel. Untuk OpenSearch Ingestion, wastafel harus selalu menjadi domain OpenSearch Layanan. Untuk daftar opsi yang didukung, lihatPlugin dan opsi yang didukung untuk saluran Amazon OpenSearch Ingestion.

    catatan

    Anda harus menyertakan sts_role_arn opsi di setiap sub-pipeline. Pipeline mengasumsikan peran yang ditentukan sts_role_arn untuk menandatangani permintaan ke domain. Untuk informasi selengkapnya, lihat Memberikan akses saluran pipa Amazon OpenSearch Ingestion ke domain.

    Contoh file konfigurasi berikut menggunakan plugin HTTP sumber dan Grok untuk memproses data log yang tidak terstruktur dan mengirimkannya ke domain Layanan. OpenSearch Sub-pipeline diberi namalog-pipeline.

    version: "2" log-pipeline: source: http: path: "/log/ingest" processor: - grok: match: log: [ '%{COMMONAPACHELOG}' ] - date: from_time_received: true destination: "@timestamp" sink: - opensearch: hosts: [ "https://search-my-domain.us-east-1.es.amazonaws.com" ] index: "apache_logs" aws: sts_role_arn: "arn:aws:iam::123456789012:role/{pipeline-role}" region: "us-east-1"

    Anda dapat membuat konfigurasi pipeline sendiri, atau memilih Unggah file dan mengimpor konfigurasi yang ada untuk pipeline Persiapan Data yang dikelola sendiri. Atau, Anda dapat menggunakan cetak biru konfigurasi.

  8. Setelah mengonfigurasi pipeline, pilih Validasi pipeline untuk mengonfirmasi bahwa konfigurasi sudah benar. Jika validasi gagal, perbaiki kesalahan dan jalankan kembali validasi.

  9. Di bawah Konfigurasi jaringan, pilih VPCakses atau akses Publik. Jika Anda memilih Akses publik, lewati ke langkah berikutnya. Jika Anda memilih VPCakses, konfigurasikan pengaturan berikut:

    Pengaturan Deskripsi
    Manajemen titik akhir

    Pilih apakah Anda ingin membuat VPC titik akhir Anda sendiri, atau minta OpenSearch Ingestion membuatnya untuk Anda. Manajemen endpoint default ke endpoint yang dikelola oleh Ingestion. OpenSearch

    VPC

    Pilih ID virtual private cloud (VPC) yang ingin Anda gunakan. Pipa VPC dan pipa harus sama Wilayah AWS.

    Subnet

    Pilih satu atau lebih subnet. OpenSearch Layanan akan menempatkan VPC titik akhir dan antarmuka jaringan elastis di subnet.

    Grup keamanan

    Pilih satu atau beberapa grup VPC keamanan yang memungkinkan aplikasi yang Anda butuhkan mencapai pipeline OpenSearch Ingestion pada port (80 atau 443) dan protokol (atau) yang diekspos oleh pipeline. HTTP HTTPs

    VPCopsi lampiran

    Jika sumber Anda adalah titik akhir yang dikelola sendiri, lampirkan pipeline Anda ke file. VPC Pilih salah satu CIDR opsi default yang disediakan, atau gunakan kustomCIDR.

    Untuk informasi selengkapnya, lihat Mengkonfigurasi akses VPC untuk saluran pipa Amazon Ingestion OpenSearch .

  10. (Opsional) Di bawah Tag, tambahkan satu atau beberapa tag (pasangan nilai kunci) ke pipeline Anda. Untuk informasi selengkapnya, lihat Menandai jaringan pipa Amazon OpenSearch Ingestion.

  11. (Opsional) Di bawah opsi penerbitan Log, aktifkan penerbitan log pipeline ke Amazon CloudWatch Logs. Kami menyarankan Anda mengaktifkan penerbitan log sehingga Anda dapat lebih mudah memecahkan masalah pipeline. Untuk informasi selengkapnya, lihat Memantau log.

  12. Pilih Berikutnya.

  13. Tinjau konfigurasi pipeline Anda dan pilih Buat.

OpenSearch Ingestion menjalankan proses asinkron untuk membangun pipeline. Setelah status pipelineActive, Anda dapat mulai menelan data.

Perintah create-pipeline menerima konfigurasi pipeline sebagai string atau dalam file.yaml. Jika Anda memberikan konfigurasi sebagai string, setiap baris baru harus diloloskan. \n Sebagai contoh, "log-pipeline:\n source:\n http:\n processor:\n - grok:\n ....

Perintah contoh berikut membuat pipeline dengan konfigurasi berikut:

  • Minimal 4 TertelanOCUs, maksimal 10 Tertelan OCUs

  • Disediakan dalam cloud pribadi virtual () VPC

  • Penerbitan log diaktifkan

aws osis create-pipeline \ --pipeline-name my-pipeline \ --min-units 4 \ --max-units 10 \ --log-publishing-options IsLoggingEnabled=true,CloudWatchLogDestination={LogGroup="MyLogGroup"} \ --vpc-options SecurityGroupIds={sg-12345678,sg-9012345},SubnetIds=subnet-1212234567834asdf \ --pipeline-configuration-body "file://pipeline-config.yaml"

OpenSearch Ingestion menjalankan proses asinkron untuk membangun pipeline. Setelah status pipelineActive, Anda dapat mulai menelan data. Untuk memeriksa status pipa, gunakan GetPipelineperintah.

Untuk membuat pipa OpenSearch Ingestion menggunakan OpenSearch IngestionAPI, hubungi operasi. CreatePipeline

Setelah pipeline berhasil dibuat, Anda dapat mengonfigurasi klien dan mulai memasukkan data ke dalam domain OpenSearch Layanan. Untuk informasi selengkapnya, lihat Mengintegrasikan saluran Amazon OpenSearch Ingestion dengan layanan dan aplikasi lain.

Melacak status pembuatan pipa

Anda dapat melacak status pipa saat OpenSearch Ingestion menyediakannya dan menyiapkannya untuk menyerap data.

Setelah Anda awalnya membuat pipeline, ia melewati beberapa tahap saat OpenSearch Ingestion mempersiapkannya untuk menelan data. Untuk melihat berbagai tahapan pembuatan pipeline, pilih nama pipeline untuk melihat halaman pengaturan Pipeline. Di bawah Status, pilih Lihat detail.

Pipeline melewati tahapan berikut sebelum tersedia untuk menelan data:

  • Validasi - Memvalidasi konfigurasi pipeline. Ketika tahap ini selesai, semua validasi telah berhasil.

  • Ciptakan lingkungan — Mempersiapkan dan menyediakan sumber daya. Ketika tahap ini selesai, lingkungan pipa baru telah dibuat.

  • Menyebarkan pipa - Menyebarkan pipa. Ketika tahap ini selesai, pipa telah berhasil dikerahkan.

  • Periksa kesehatan pipa — Memeriksa kesehatan pipa. Ketika tahap ini selesai, semua pemeriksaan kesehatan telah berlalu.

  • Aktifkan lalu lintas - Mengaktifkan pipeline untuk menyerap data. Ketika tahap ini selesai, Anda dapat mulai menelan data ke dalam pipa.

Gunakan get-pipeline-change-progressperintah untuk memeriksa status pipa. AWS CLI Permintaan berikut memeriksa status pipeline bernamamy-pipeline:

aws osis get-pipeline-change-progress \ --pipeline-name my-pipeline

Tanggapan:

{ "ChangeProgressStatuses": { "ChangeProgressStages": [ { "Description": "Validating pipeline configuration", "LastUpdated": 1.671055851E9, "Name": "VALIDATION", "Status": "PENDING" } ], "StartTime": 1.671055851E9, "Status": "PROCESSING", "TotalNumberOfStages": 5 } }

Untuk melacak status pembuatan pipa menggunakan OpenSearch IngestionAPI, hubungi operasi. GetPipelineChangeProgress