Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie die Syntaxanalyse, um die Wörter aus dem Dokument zu analysieren und den Wortteil oder die syntaktische Funktion für jedes Wort im Dokument zurückzugeben. Sie können die Substantive, Verben, Adjektive usw. in Ihrem Dokument identifizieren. Verwenden Sie diese Informationen, um den Inhalt Ihrer Dokumente besser zu verstehen und die Beziehung der Wörter im Dokument zu verstehen.
Sie können beispielsweise in einem Dokument nach den Substantiven suchen und dann nach den Verben suchen, die sich auf diese Substantive beziehen. In einem Satz wie „Meine Großmutter hat ihre Couch umgezogen“ können Sie die Substantive „Großmutter“ und „Couch“ sowie das Verb „umgezogen“ sehen. Sie können diese Informationen verwenden, um Anwendungen zur Analyse von Text auf Wortkombinationen zu erstellen, an denen Sie interessiert sind.
Um die Analyse zu starten, analysiert Amazon Comprehend den Quelltext, um die einzelnen Wörter im Text zu finden. Nachdem der Text analysiert wurde, wird jedem Wort der Wortteil zugewiesen, den es im Quelltext verwendet.
Amazon Comprehend kann die folgenden Wortarten identifizieren.
Token | Teil der Rede |
---|---|
ADJ | Adjektiv Wörter, die normalerweise Substantive modifizieren. |
ADP | Ablagerung Der Kopf einer Präpositional- oder Postpositionalphrase. |
ADV | Adverb Wörter, die normalerweise Verben modifizieren. Sie können auch Adjektive und andere Adverbien modifizieren. |
AUX | Hilfsmittel Funktionswörter, die das Verb einer Verbphrase begleiten. |
CCONJ | Koordinierende Konjunktion Eine koordinierende Konjunktion verbindet Wörter, Ausdrücke oder Klauseln in einem Satz, ohne sie einander unterzuordnen. |
CONJ | Konjunktion Eine Konjunktion verbindet Wörter, Phrasen oder Klauseln in einem Satz. |
DET | Determinator Artikel und andere Wörter, die eine bestimmte Nominalphrase spezifizieren. |
INTJ | Zwischenruf Wörter, die als Ausruf oder Teil eines Ausrufs verwendet werden. |
SUBSTANTIV |
Substantiv Wörter, die eine Person, einen Ort, eine Sache, ein Tier oder eine Idee beschreiben. |
ZAHL | Ziffer Wörter, in der Regel Determinanten, Adjektive oder Pronomen, die eine Zahl ausdrücken. |
O | Sonstige Wörter, denen kein Teil der Sprachkategorie zugewiesen werden kann. |
PART | Partikel Funktionswörter, die mit einem anderen Wort oder einer Phrase verknüpft sind, um eine Bedeutung zu vermitteln. |
PRON | Pronomen Wörter, die Substantive oder Nominalphrasen ersetzen. |
PROPAN | Eigenname Ein Substantiv, das der Name einer bestimmten Person, eines bestimmten Ortes oder Objekts ist. |
PUNKT | Interpunktion Nicht alphabetische Zeichen, die Text abgrenzen. |
SCONJ | Untergeordnete Konjunktion Eine Konjunktion, die eine abhängige Klausel mit einem Satz verbindet. Ein Beispiel für eine untergeordnete Konjunktion ist „weil“. |
SYM | Symbol Wortähnliche Entitäten wie das Dollarzeichen ($) oder mathematische Symbole. |
VERB | Verb Worte, die Ereignisse und Handlungen signalisieren. |
Weitere Informationen zu den verschiedenen Wortarten finden Sie unter Universal POS-Tags auf
Die Operationen geben Tokens zurück, die das Wort und den Wortteil identifizieren, für den das Wort im Text steht. Jedes Token steht für ein Wort im Quelltext. Es gibt die Position des Wortes in der Quelle, den Wortteil, den das Wort im Text annimmt, die Gewissheit von Amazon Comprehend, dass der Wortteil korrekt identifiziert wurde, und das Wort, das aus dem Quelltext analysiert wurde, an.
Im Folgenden finden Sie die Struktur der Liste der Syntax-Tokens. Für jedes Wort im Dokument wird ein Syntaxtoken generiert.
{
"SyntaxTokens": [
{
"BeginOffset": number,
"EndOffset": number,
"PartOfSpeech": {
"Score": number,
"Tag": "string"
},
"Text": "string",
"TokenId": number
}
]
}
Jedes Token enthält die folgenden Informationen:
-
BeginOffset
undEndOffset
— Gibt die Position des Wortes im Eingabetext an. -
PartOfSpeech
— Stellt zwei Informationen bereit: die,Tag
die den Wortteil identifiziert, und dieScore
, die die Sicherheit von Amazon Comprehend Syntax darstellt, dass der Wortteil korrekt identifiziert wurde. -
Text
— Liefert das Wort, das identifiziert wurde. -
TokenId
— Stellt einen Bezeichner für das Token bereit. Der Bezeichner gibt die Position des Tokens in der Tokenliste an.