Modelos básicos de IA generativa en Canvas SageMaker

Modo de enfoque

Modelos básicos de IA generativa en Canvas SageMaker - Amazon SageMaker AI

Amazon SageMaker Canvas proporciona modelos básicos de IA generativa que puede utilizar para iniciar conversaciones conversacionales. Estos modelos de generación de contenido se entrenan con grandes cantidades de datos de texto para aprender los patrones estadísticos y las relaciones entre las palabras, y pueden producir un texto coherente que sea estadísticamente similar al texto en el que se entrenaron. Puede utilizar esta capacidad para aumentar la productividad de la siguiente manera:

Generar contenido, como esquemas de documentos, informes y blogs
Resumir el texto a partir de grandes corpus de texto, como transcripciones de presentaciones de beneficios, informes anuales o capítulos de manuales de usuario
Extraer información y conclusiones clave de amplios pasajes de texto, como notas o transcripciones de reuniones
Mejorar el texto y captar errores gramaticales o tipográficos

Los modelos básicos son una combinación de los grandes modelos de lenguaje de Amazon SageMaker JumpStart y Amazon Bedrock (LLMs). Canvas ofrece los siguientes modelos:

Modelo	Tipo	Descripción
Amazon Titan	Modelo de Amazon Bedrock	Amazon Titan es un modelo de lenguaje potente y de uso general que puede utilizar para tareas como el resumen, la generación de texto (como la creación de una entrada de blog), la clasificación, las preguntas y respuestas abiertas y la extracción de información. Está entrenado previamente con conjuntos de datos de gran tamaño, lo que hace que resulte adecuado para tareas y razonamientos complejos. Para seguir respaldando las prácticas recomendadas en el uso responsable de la IA, los modelos fundacionales de Amazon Titan están diseñados para detectar y eliminar el contenido dañino de los datos, rechazar el contenido inapropiado en las entradas de los usuarios y filtrar los resultados de los modelos que contengan contenido inapropiado (como la incitación al odio, las palabras malsonantes y la violencia).
Anthropic Claude Instant	Modelo de Amazon Bedrock	El Anthropic Claude Instant es un modelo más rápido y rentable, pero aún así tiene una alta capacidad. Este modelo puede realizar una variedad de tareas, como el diálogo informal, el análisis de texto, el resumen y la respuesta a preguntas sobre documentos. Al igual que el Claude-2, el Claude Instant puede admitir hasta 100 000 tokens en cada solicitud, lo que equivale a unas 200 páginas de información.
Anthropic Claude-2	Modelo de Amazon Bedrock	El Claude-2 es el modelo más potente de Anthropic, y resulta excepcional en una amplia gama de tareas, desde diálogos sofisticados y generación de contenido creativo hasta el seguimiento detallado de instrucciones. El Claude-2 puede admitir hasta 100 000 tokens en cada solicitud, lo que equivale a unas 200 páginas de información. Puede generar respuestas más largas en comparación con su versión anterior. Admite casos de uso como la respuesta a preguntas, la extracción de información, la eliminación de información de identificación personal, la generación de contenido, la clasificación de opción múltiple, los juegos de roles, la comparación de texto, la síntesis y las preguntas y respuestas de documentos con citas.
Falcon-7B-Instruct	JumpStart modelo	El Falcon-7B-Instruct tiene 7000 millones de parámetros y se ha ajustado a partir de una combinación de conjuntos de datos de chat e instrucción. Es adecuado como asistente virtual y funciona mejor cuando se siguen instrucciones o se entabla una conversación. Dado que el modelo se entrenó con grandes cantidades de datos web en inglés, contiene los estereotipos y sesgos que se encuentran comúnmente en Internet y no es adecuado para otros idiomas que no sean el inglés. En comparación con el Falcon-40B-Instruct, el Falcon-7B-Instruct es un modelo un poco más pequeño y compacto.
Falcon-40B-Instruct	JumpStart modelo	El Falcon-40B-Instruct tiene 40 000 millones de parámetros y se ha ajustado a partir de una combinación de conjuntos de datos de chat e instrucción. Es adecuado como asistente virtual y funciona mejor cuando se siguen instrucciones o se entabla una conversación. Dado que el modelo se entrenó con grandes cantidades de datos web en inglés, contiene los estereotipos y sesgos que se encuentran comúnmente en Internet y no es adecuado para otros idiomas que no sean el inglés. En comparación con el Falcon-7B-Instruct, el Falcon-40B-Instruct es un modelo un poco más grande y potente.
Jurassic-2 Mid	Modelo de Amazon Bedrock	Jurassic-2 Mid es un modelo de generación de texto de alto rendimiento entrenado en un corpus de texto masivo (actualizado hasta mediados de 2022). Es muy versátil, de uso general y capaz de componer textos similares a los humanos y de resolver tareas complejas, como responder preguntas, clasificar textos y muchas otras. Este modelo ofrece capacidades de instrucción de cero intentos, lo que permite que se dirija únicamente con lenguaje natural y sin el uso de ejemplos. Funciona hasta un 30 % más rápido que su predecesor, el modelo Jurassic-1. El Jurassic-2 Mid es AI21 el modelo de tamaño medio, diseñado cuidadosamente para lograr el equilibrio adecuado entre una calidad excepcional y un precio asequible.
Jurassic-2 Ultra	Modelo de Amazon Bedrock	Jurassic-2 Ultra es un modelo de generación de texto de alto rendimiento entrenado en un corpus de texto masivo (actualizado hasta mediados de 2022). Es muy versátil, de uso general y capaz de componer textos similares a los humanos y de resolver tareas complejas, como responder preguntas, clasificar textos y muchas otras. Este modelo ofrece capacidades de instrucción de cero intentos, lo que permite que se dirija únicamente con lenguaje natural y sin el uso de ejemplos. Funciona hasta un 30 % más rápido que su predecesor, el modelo Jurassic-1. En comparación con el Jurassic-2 Mid, el Jurassic-2 Ultra es un modelo un poco más grande y potente.
Llama-2-7b-Chat	JumpStart modelo	Llama-2-7b-chat es un modelo fundacional de Meta que resulta adecuado para entablar conversaciones significativas y coherentes, generar contenido nuevo y extraer respuestas de las notas existentes. Dado que el modelo se ha entrenado con grandes cantidades de datos de Internet en inglés, contiene los sesgos y las limitaciones que suelen encontrarse en Internet y resulta más adecuado para tareas en inglés.
Llama-2-13B-Chat	Modelo de Amazon Bedrock	Llama-2-13B-Chat de Meta se ha afinado con datos conversacionales después de un entrenamiento inicial con datos de Internet. Está optimizado para un diálogo natural y una atractiva capacidad de chat, lo que hace que resulte idóneo como agente conversacional. En comparación con Llama-2-7b-Chat, más pequeño, Llama-2-13B-Chat tiene casi el doble de parámetros, lo que le permite recordar más contexto y producir respuestas conversacionales más matizadas. Al igual que Llama-2-7b-Chat, Llama-2-13B-Chat se ha entrenado con datos en inglés y es idóneo para tareas en inglés.
Llama-2-70B-Chat	Modelo de Amazon Bedrock	Al igual que Llama-2-7b-Chat y Llama-2-13B-Chat, el modelo Llama-2-70B-Chat de Meta está optimizado para entablar un diálogo natural y significativo. Con 70 000 millones de parámetros, este gran modelo conversacional puede recordar un contexto más extenso y producir respuestas muy coherentes en comparación con las versiones de modelos más compactos. Sin embargo, esto se produce a costa de respuestas más lentas y mayores necesidades de recursos. Llama-2-70B-Chat se ha entrenado con grandes cantidades datos de Internet en inglés y es idóneo para tareas en inglés.
Mistral-7B	JumpStart modelo	Mistral-7B de Mistral.AI es un excelente modelo de lenguaje de uso general adecuado para una amplia gama de tareas de lenguaje natural (NLP), como generación de texto, síntesis y respuesta a preguntas. Utiliza la atención de consulta agrupada (GQA), que permite velocidades de inferencia más rápidas, con un rendimiento comparable al de los modelos con el doble o el triple de parámetros. Se ha entrenado con una combinación de datos de texto, incluidos libros, sitios web y artículos científicos en inglés, por lo que es idóneo para tareas en inglés.
Mistral-7B-Chat	JumpStart modelo	Mistral-7B-Chat es un modelo conversacional de Mistral.AI basado en Mistral-7B. Si bien el Mistral-7B resulta idóneo para tareas generales de NLP, Mistral-7B-Chat se ha afinado aún más sobre datos conversacionales para optimizar sus capacidades de chat natural y atractivo. Por ello, Mistral-7B-Chat genera respuestas más parecidas a las humanas y recuerda el contexto de respuestas anteriores. Al igual que el Mistral-7B, este modelo es más adecuado para tareas en inglés.
MPT-7B-Instruct	JumpStart modelo	El MPT-7B-Instruct es un modelo para la instrucción de formato largo con posterioridad a las tareas y puede ayudarle con tareas de redacción, como el resumen de textos y la respuesta a preguntas, para ahorrarle tiempo y esfuerzo. Este modelo se entrenó con grandes cantidades de datos ajustados y puede hacer frente a entradas más grandes, como documentos complejos. Utilice este modelo cuando desee procesar cuerpos de texto grandes o si desea que el modelo genere respuestas largas.

Por el momento, los modelos fundacionales de Amazon Bedrock solo están disponibles en las regiones Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón). Además, cuando utilice modelos fundacionales de Amazon Bedrock, se le cobrará en función del volumen de los tokens de entrada y salida, según lo especifique cada proveedor de modelos. Para obtener más información, consulte la página de Precios de Amazon Bedrock. Los JumpStart modelos básicos se implementan en las instancias de SageMaker AI Hosting y se le cobrará por la duración del uso en función del tipo de instancia utilizado. Para obtener más información sobre el costo de los distintos tipos de instancias, consulte la sección Amazon SageMaker AI Hosting: Inferencia en tiempo real en la página de precios de SageMaker IA.

La consulta de documentos es una característica adicional que puede utilizar para consultar y obtener información de los documentos almacenados en índices mediante Amazon Kendra. Con esta funcionalidad, puede generar contenido a partir del contexto de esos documentos y recibir respuestas específicas para su caso de uso empresarial, en lugar de respuestas genéricas según las grandes cantidades de datos en las que se basaron los modelos fundacionales. Para obtener más información acerca de los índices en Amazon Kendra, consulte la Guía para desarrolladores de Amazon Kendra.

Si desea obtener respuestas de alguno de los modelos fundacionales personalizados con sus datos y su caso de uso, puede afinar dichos modelos. Para obtener más información, consulte Afinamiento de modelos fundacionales.

Si quieres obtener predicciones de un modelo SageMaker JumpStart básico de Amazon a través de una aplicación o un sitio web, puedes implementar el modelo en un punto final de SageMaker IA. SageMaker Los puntos finales de IA alojan su modelo y usted puede enviar solicitudes al punto final a través del código de su aplicación para recibir predicciones del modelo. Para obtener más información, consulte Implementación de sus modelos en un punto de conexión.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Automatice la preparación de datos en SageMaker Canvas

Completar los requisitos previos

Seleccione sus preferencias de cookies

Personalizar preferencias de cookies

Esenciales

De rendimiento

Funcionales

De publicidad

No se pueden guardar las preferencias de cookies

Modelos básicos de IA generativa en Canvas SageMaker

Related resources

¿Le ha servido de ayuda esta página?

Related resources

Tema siguiente:

Tema anterior:

¿Necesita ayuda?