語法分析 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

語法分析

使用語法分析從文件中剖析字詞,並傳回文件中每個字詞的語音或語法函數部分。您可以在文件中識別名詞、動詞、形容詞等。使用此資訊可更深入了解文件的內容,並了解文件中字詞的關係。

例如,您可以在文件中尋找名詞,然後尋找與這些名詞相關的動詞。在像是「我的祖母移動她的匪子」的句子中,您可以看到名詞、「祖母」和「匪子」,以及動詞「已移動」。您可以使用此資訊來建置應用程式,以分析您感興趣的文字組合文字。

若要開始分析,Amazon Comprehend 會剖析來源文字以尋找文字中的個別字詞。剖析文字後,每個字詞都會被指派為在來源文字中採取的語音部分。

Amazon Comprehend 可以識別語音的下列部分。

權杖 語音的一部分
ADJ

形容詞

通常修改名詞的單字。

ADP

宣告

前置或後置片語的開頭。

ADV

Adverb

通常修改動詞的單字。他們也可能修改形容詞和其他形容詞。

AUX

輔助

隨動詞片語的動詞隨附的函數單字。

CCONJ

協調 結合

協調結合會將句子中的單字、片語或子句連接起來,而不會將單字、片語或子句子子次級化到另一個。

CONJ

連接詞

結合會連接句子中的單字、片語或子句。

DET

判斷器

指定特定名詞片語的文章和其他字詞。

INTJ

插入

用作驚嘆號或驚嘆號一部分的字詞。

NOUN

名詞

指定人物、位置、物件、動物或想法的字詞。

NUM

數值

表達數字的單字,通常是決定者、形容詞或代名詞。

O

其他

無法指派給語音類別一部分的字詞。

PART

助詞

與另一個單字或片語相關聯的函數單字,以傳遞意義。

PRON

代名詞

取代名詞或名詞片語的字詞。

PROPN

適當的名詞

此名詞是特定個人、位置或物件的名稱。

PUNCT

標點符號

分隔文字的非字母字元。

SCONJ

協調 結合

將相依子句聯結至句子的 結合。子排序結合的範例是「原因」。

SYM

符號

類似文字的實體,例如美元符號 ($) 或數學符號。

VERB

動詞

訊號事件和動作的字詞。

如需語音部分的詳細資訊,請參閱 Universal Dependencies 網站上的 Universal POS 標籤

操作會傳回識別字詞的字符,以及該字詞在文字中代表的語音部分。每個字符代表來源文字中的一個字詞。它提供來源中單字的位置、單字在文字中採用的語音部分、Amazon Comprehend 對正確識別語音部分的信心,以及從來源文字剖析的單字。

以下是語法字符清單的結構。文件中的每個字詞都會產生一個語法字符。

{ "SyntaxTokens": [ { "BeginOffset": number, "EndOffset": number, "PartOfSpeech": { "Score": number, "Tag": "string" }, "Text": "string", "TokenId": number } ] }

每個字符都提供以下資訊:

  • BeginOffsetEndOffset- 在輸入文字中提供字詞的位置。

  • PartOfSpeech—提供兩種資訊,Tag即識別語音部分的 Score,以及表示 Amazon Comprehend Syntax 對正確識別語音部分的可信度的 。

  • Text- 提供已識別的字詞。

  • TokenId- 提供權杖的識別符。識別符是字符清單中字符的位置。