Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan analisis sintaksis untuk mengurai kata-kata dari dokumen dan mengembalikan bagian ucapan, atau fungsi sintaksis, untuk setiap kata dalam dokumen. Anda dapat mengidentifikasi kata benda, kata kerja, kata sifat dan sebagainya dalam dokumen Anda. Gunakan informasi ini untuk mendapatkan pemahaman yang lebih kaya tentang isi dokumen Anda, dan untuk memahami hubungan kata-kata dalam dokumen.
Misalnya, Anda dapat mencari kata benda dalam dokumen dan kemudian mencari kata kerja yang terkait dengan kata benda tersebut. Dalam kalimat seperti “Nenek saya memindahkan sofa” Anda dapat melihat kata benda, “nenek” dan “sofa,” dan kata kerja, “pindah.” Anda dapat menggunakan informasi ini untuk membangun aplikasi untuk menganalisis teks untuk kombinasi kata yang Anda minati.
Untuk memulai analisis, Amazon Comprehend mem-parsing teks sumber untuk menemukan kata-kata individual dalam teks. Setelah teks diuraikan, setiap kata diberi bagian pidato yang dibutuhkan dalam teks sumber.
Amazon Comprehend dapat mengidentifikasi bagian-bagian pidato berikut.
Token | Bagian dari pidato |
---|---|
ADJ | Adjektiva Kata-kata yang biasanya memodifikasi kata benda. |
ADP | Adposisi Kepala frase preposisional atau postposisional. |
ADV | Kata keterangan Kata-kata yang biasanya memodifikasi kata kerja. Mereka juga dapat memodifikasi kata sifat dan kata keterangan lainnya. |
AUX | Bantu Kata-kata fungsi yang menyertai kata kerja frase kata kerja. |
CCONJ | Koordinasi konjungsi Konjungsi koordinasi menghubungkan kata, frasa, atau klausa dalam sebuah kalimat tanpa menundukkan satu sama lain. |
CONJ | Konjungsi Konjungsi menghubungkan kata, frasa, atau klausa dalam sebuah kalimat. |
DET | Penentu Artikel dan kata lain yang menentukan frasa kata benda tertentu. |
INTJ | Kata seru Kata-kata yang digunakan sebagai seruan atau bagian dari seruan. |
KATA BENDA |
Kata benda Kata-kata yang menentukan seseorang, tempat, benda, binatang, atau ide. |
JUMLAH | Angka Kata-kata, biasanya penentu, kata sifat, atau kata ganti, yang mengekspresikan angka. |
O | Lainnya Kata-kata yang tidak dapat ditetapkan sebagai bagian dari kategori pidato. |
SEBAGIAN | Partikel Fungsi kata yang terkait dengan kata atau frasa lain untuk memberi makna. |
PRON | Kata ganti Kata-kata yang menggantikan kata benda atau frasa kata benda. |
PROPN | Kata benda yang tepat Kata benda yang merupakan nama individu, tempat, atau objek tertentu. |
MENUSUK | Tanda baca Karakter non-abjad yang membatasi teks. |
SCONJ | Konjungsi subordinasi Konjungsi yang menggabungkan klausa dependen ke sebuah kalimat. Contoh konjungsi subordinasi adalah “karena”. |
SYM | Simbol Entitas seperti kata seperti tanda dolar ($) atau simbol matematika. |
KATA KERJA | Kata Kerja Kata-kata yang menandakan peristiwa dan tindakan. |
Untuk informasi selengkapnya tentang bagian-bagian pidato, lihat Tag Universal POS di situs
Operasi mengembalikan token yang mengidentifikasi kata dan bagian ucapan yang diwakili kata dalam teks. Setiap token mewakili kata dalam teks sumber. Ini memberikan lokasi kata dalam sumbernya, bagian ucapan yang diambil kata dalam teks, keyakinan bahwa Amazon Comprehend memiliki bahwa bagian pidato diidentifikasi dengan benar, dan kata yang diuraikan dari teks sumber.
Berikut ini adalah struktur daftar token sintaks. Satu token sintaks dihasilkan untuk setiap kata dalam dokumen.
{
"SyntaxTokens": [
{
"BeginOffset": number,
"EndOffset": number,
"PartOfSpeech": {
"Score": number,
"Tag": "string"
},
"Text": "string",
"TokenId": number
}
]
}
Setiap token memberikan informasi berikut:
-
BeginOffset
danEndOffset
—Menyediakan lokasi kata dalam teks input. -
PartOfSpeech
—Menyediakan dua informasi,Tag
yang mengidentifikasi bagian pidato dan yang mewakili keyakinanScore
yang dimiliki Amazon Comprehend Syntax bahwa bagian pidato diidentifikasi dengan benar. -
Text
—Menyediakan kata yang diidentifikasi. -
TokenId
—Menyediakan pengenal untuk token. Identifier adalah posisi token dalam daftar token.