Análisis de sintaxis

Utiliza el análisis sintáctico para analizar las palabras del documento y devolver la parte del discurso, o función sintáctica, de cada palabra del documento. Puede identificar los sustantivos, los verbos, los adjetivos, etc. del documento. Utilice esta información para comprender mejor el contenido de sus documentos y comprender la relación de las palabras en el documento.

Por ejemplo, puede buscar los sustantivos en un documento y, a continuación, buscar los verbos relacionados con esos sustantivos. En una oración como “Mi abuela movió el sofá”, puede ver los sustantivos “abuela” y “sofá” y el verbo “movió”. Puede usar esta información para crear aplicaciones que analicen el texto en busca de combinaciones de palabras que le interesen.

Para iniciar el análisis, Amazon Comprehend analiza el texto fuente para encontrar las palabras individuales en el texto. Después de analizar el texto, a cada palabra se le asigna la parte del discurso que ocupa en el texto fuente.

Amazon Comprehend puede identificar las siguientes partes del discurso.

Token	Parte del discurso
ADJ	Adjetivo Palabras que suelen modificar a los sustantivos.
ADP	Adposición El encabezado de una frase preposicional o posposicional.
ADV	Adverbio Palabras que suelen modificar a los verbos. También pueden modificar adjetivos y otros adverbios.
AUX	Auxiliar Palabras funcionales que acompañan al verbo de una frase verbal.
CCONJ	Conjunción coordinadora Una conjunción coordinante conecta palabras, frases o cláusulas de una oración sin subordinar una a la otra.
CONJ	Conjunción Una conjunción conecta palabras, frases o cláusulas de una oración.
DET	Determinador Artículos y otras palabras que especifican un sintagma nominal en particular.
INT	Interjección Palabras utilizadas como exclamación o parte de una exclamación.
SUSTANTIVO	Nombre Palabras que especifican una persona, un lugar, una cosa, un animal o una idea.
NÚM.	Numeral Palabras, normalmente determinantes, adjetivos o pronombres, que expresan un número.
O	Otro Palabras a las que no pueden asignarse una parte de la categoría del discurso.
PART	Partícula Las palabras funcionales se asocian a otra palabra o frase para darles significado.
PRON	Pronombre Palabras que sustituyen a sustantivos o frases nominales.
SUSTP	Sustantivo propio Un sustantivo que es el nombre de un individuo, lugar u objeto específico.
PUNT	Puntuación Non-alphabetical caracteres que delimitan el texto.
CONJS	Conjunción subordinada Conjunción que une una cláusula dependiente a una oración. Un ejemplo de conjunción subordinante es “porque”.
SÍM	Símbolo Word-like entidades como el signo de dólar ($) o símbolos matemáticos.
VERB	Verbo Palabras que indican eventos y acciones.

Para obtener más información sobre las partes del discurso, consulte las etiquetas POS universales en el sitio web de Universal Dependencies.

Las operaciones devuelven símbolos que identifican la palabra y la parte del discurso que la palabra representa en el texto. Cada token representa una palabra en el texto fuente. Proporciona la ubicación de la palabra en la fuente, la parte del discurso que ocupa la palabra en el texto, la confianza que Amazon Comprehend tiene de que la parte del discurso se identificó correctamente y la palabra que se analizó del texto fuente.

La siguiente es la estructura de la lista de tokens de sintaxis. Se genera un token de sintaxis para cada palabra del documento.


{
   "SyntaxTokens": [ 
      { 
         "BeginOffset": number,
         "EndOffset": number,
         "PartOfSpeech": { 
            "Score": number,
            "Tag": "string"
         },
         "Text": "string",
         "TokenId": number
      }
   ]
}

Cada token proporciona la siguiente información:

BeginOffset y EndOffset: proporciona la ubicación de la palabra en el texto de entrada.
PartOfSpeech—Proporciona dos datos: el Tag que identifica la parte del discurso y el Score que representa la confianza que Amazon Comprehend Syntax tiene de que la parte del discurso se ha identificado correctamente.
Text—Proporciona la palabra que se identificó.
TokenId—Proporciona un identificador para el token. El identificador es la posición del token en la lista de tokens.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Opiniones específicas

Amazon Comprehend Custom