本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
語法分析
使用語法分析從文件中剖析字詞,並傳回文件中每個字詞的語音或語法函數部分。您可以在文件中識別名詞、動詞、形容詞等。使用此資訊可更深入了解文件的內容,並了解文件中字詞的關係。
例如,您可以在文件中尋找名詞,然後尋找與這些名詞相關的動詞。在像是「我的祖母移動她的匪子」的句子中,您可以看到名詞、「祖母」和「匪子」,以及動詞「已移動」。您可以使用此資訊來建置應用程式,以分析您感興趣的文字組合文字。
若要開始分析,Amazon Comprehend 會剖析來源文字以尋找文字中的個別字詞。剖析文字後,每個字詞都會被指派為在來源文字中採取的語音部分。
Amazon Comprehend 可以識別語音的下列部分。
權杖 | 語音的一部分 |
---|---|
ADJ | 形容詞 通常修改名詞的單字。 |
ADP | 宣告 前置或後置片語的開頭。 |
ADV | Adverb 通常修改動詞的單字。他們也可能修改形容詞和其他形容詞。 |
AUX | 輔助 隨動詞片語的動詞隨附的函數單字。 |
CCONJ | 協調 結合 協調結合會將句子中的單字、片語或子句連接起來,而不會將單字、片語或子句子子次級化到另一個。 |
CONJ | 連接詞 結合會連接句子中的單字、片語或子句。 |
DET | 判斷器 指定特定名詞片語的文章和其他字詞。 |
INTJ | 插入 用作驚嘆號或驚嘆號一部分的字詞。 |
NOUN |
名詞 指定人物、位置、物件、動物或想法的字詞。 |
NUM | 數值 表達數字的單字,通常是決定者、形容詞或代名詞。 |
O | 其他 無法指派給語音類別一部分的字詞。 |
PART | 助詞 與另一個單字或片語相關聯的函數單字,以傳遞意義。 |
PRON | 代名詞 取代名詞或名詞片語的字詞。 |
PROPN | 適當的名詞 此名詞是特定個人、位置或物件的名稱。 |
PUNCT | 標點符號 分隔文字的非字母字元。 |
SCONJ | 協調 結合 將相依子句聯結至句子的 結合。子排序結合的範例是「原因」。 |
SYM | 符號 類似文字的實體,例如美元符號 ($) 或數學符號。 |
VERB | 動詞 訊號事件和動作的字詞。 |
如需語音部分的詳細資訊,請參閱 Universal Dependencies 網站上的 Universal POS 標籤
操作會傳回識別字詞的字符,以及該字詞在文字中代表的語音部分。每個字符代表來源文字中的一個字詞。它提供來源中單字的位置、單字在文字中採用的語音部分、Amazon Comprehend 對正確識別語音部分的信心,以及從來源文字剖析的單字。
以下是語法字符清單的結構。文件中的每個字詞都會產生一個語法字符。
{ "SyntaxTokens": [ { "BeginOffset": number, "EndOffset": number, "PartOfSpeech": { "Score": number, "Tag": "string" }, "Text": "string", "TokenId": number } ] }
每個字符都提供以下資訊:
-
BeginOffset
和EndOffset
- 在輸入文字中提供字詞的位置。 -
PartOfSpeech
—提供兩種資訊,Tag
即識別語音部分的Score
,以及表示 Amazon Comprehend Syntax 對正確識別語音部分的可信度的 。 -
Text
- 提供已識別的字詞。 -
TokenId
- 提供權杖的識別符。識別符是字符清單中字符的位置。