Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Utiliza el análisis sintáctico para analizar las palabras del documento y devolver la parte del discurso, o función sintáctica, de cada palabra del documento. Puede identificar los sustantivos, los verbos, los adjetivos, etc. del documento. Utilice esta información para comprender mejor el contenido de sus documentos y comprender la relación de las palabras en el documento.
Por ejemplo, puede buscar los sustantivos en un documento y, a continuación, buscar los verbos relacionados con esos sustantivos. En una oración como «Mi abuela movió el sofá», puede ver los sustantivos «abuela» y «sofá», y el verbo «movió». Puede usar esta información para crear aplicaciones que analicen el texto en busca de combinaciones de palabras que le interesen.
Para iniciar el análisis, Amazon Comprehend analiza el texto fuente para encontrar las palabras individuales en el texto. Después de analizar el texto, a cada palabra se le asigna la parte del discurso que ocupa en el texto fuente.
Amazon Comprehend puede identificar las siguientes partes del discurso.
Token | Parte del discurso |
---|---|
ADJ | Adjetivo Palabras que suelen modificar a los sustantivos. |
ADP | Adposición El encabezado de una frase preposicional o posposicional. |
ADV | Adverbio Palabras que suelen modificar a los verbos. También pueden modificar adjetivos y otros adverbios. |
AUX | Auxiliar Palabras funcionales que acompañan al verbo de una frase verbal. |
CCONJ | Conjunción coordinadora Una conjunción coordinante conecta palabras, frases o cláusulas de una oración sin subordinar una a la otra. |
CONJ | Conjunción Una conjunción conecta palabras, frases o cláusulas de una oración. |
DET | Determinador Artículos y otras palabras que especifican un sintagma nominal en particular. |
INT | Interjección Palabras utilizadas como exclamación o parte de una exclamación. |
SUSTANTIVO |
Nombre Palabras que especifican una persona, un lugar, una cosa, un animal o una idea. |
NÚM. | Numeral Palabras, normalmente determinantes, adjetivos o pronombres, que expresan un número. |
O | Otro Palabras a las que no pueden asignarse una parte de la categoría del discurso. |
PART | Partícula Las palabras funcionales se asocian a otra palabra o frase para darles significado. |
PRON | Pronombre Palabras que sustituyen a sustantivos o frases nominales. |
SUSTP | Sustantivo propio Un sustantivo que es el nombre de un individuo, lugar u objeto específico. |
PUNT | Puntuación Caracteres no alfabéticos que delimitan el texto. |
CONJS | Conjunción subordinada Conjunción que une una cláusula dependiente a una oración. Un ejemplo de conjunción subordinante es «porque». |
SÍM | Símbolo Entidades parecidas a palabras, como el signo de dólar ($) o los símbolos matemáticos. |
VERB | Verbo Palabras que indican eventos y acciones. |
Para obtener más información sobre las partes del discurso, consulte las etiquetas POS universales
Las operaciones devuelven símbolos que identifican la palabra y la parte del discurso que la palabra representa en el texto. Cada token representa una palabra en el texto fuente. Proporciona la ubicación de la palabra en la fuente, la parte del discurso que ocupa la palabra en el texto, la confianza que Amazon Comprehend tiene de que la parte del discurso se identificó correctamente y la palabra que se analizó del texto fuente.
La siguiente es la estructura de la lista de tokens de sintaxis. Se genera un token de sintaxis para cada palabra del documento.
{
"SyntaxTokens": [
{
"BeginOffset": number,
"EndOffset": number,
"PartOfSpeech": {
"Score": number,
"Tag": "string"
},
"Text": "string",
"TokenId": number
}
]
}
Cada token proporciona la siguiente información:
-
BeginOffset
yEndOffset
: proporciona la ubicación de la palabra en el texto de entrada. -
PartOfSpeech
—Proporciona dos datos: elTag
que identifica la parte del discurso y elScore
que representa la confianza que Amazon Comprehend Syntax tiene de que la parte del discurso se ha identificado correctamente. -
Text
—Proporciona la palabra que se identificó. -
TokenId
—Proporciona un identificador para el token. El identificador es la posición del token en la lista de tokens.