Diseño de una petición

Modo de enfoque

Diseño de una petición - Amazon Bedrock

Proporcionar instrucciones sencillas, claras y completas La pregunta o instrucción debe colocarse al final de la petición para obtener los mejores resultados Utilice caracteres separadores para las llamadas a la API Uso de indicadores de resultados Prácticas recomendadas para una buena generalización Optimice las peticiones para los modelos de texto en Amazon Bedrock, cuando lo básico no sea suficiente Controle la respuesta del modelo con parámetros de inferencia

Diseñar una petición adecuada es un paso importante para crear una aplicación que funcione bien con los modelos de Amazon Bedrock. En esta sección, aprenderá a diseñar una petición coherente, clara y concisa. También aprenderá a controlar la respuesta de un modelo mediante el uso de parámetros de inferencia. La siguiente figura muestra un diseño de mensaje genérico para el caso de uso, un resumen de reseñas de restaurantes y algunas opciones de diseño importantes que los clientes deben tener en cuenta al diseñar las indicaciones. LLMs generan respuestas no deseadas si las instrucciones que reciben o el formato del mensaje no son consistentes, claros y concisos.

Ejemplo de una buena construcción de petición con comentarios descriptivos.

(Fuente: Mensaje escrito por AWS)

El siguiente contenido proporciona orientación sobre cómo crear peticiones correctamente.

Temas

Proporcionar instrucciones sencillas, claras y completas
La pregunta o instrucción debe colocarse al final de la petición para obtener los mejores resultados
Utilice caracteres separadores para las llamadas a la API
Uso de indicadores de resultados
Prácticas recomendadas para una buena generalización
Optimice las peticiones para los modelos de texto en Amazon Bedrock, cuando lo básico no sea suficiente
Controle la respuesta del modelo con parámetros de inferencia

Proporcionar instrucciones sencillas, claras y completas

LLMs en Amazon Bedrock funcionan mejor con instrucciones sencillas y directas. Al describir claramente las expectativas de la tarea y reducir la ambigüedad siempre que sea posible, puede asegurarse de que el modelo pueda interpretar la petición con claridad.

Por ejemplo, pensemos en un problema de clasificación en el que el usuario desea obtener una respuesta a partir de un conjunto de posibles opciones. El ejemplo «bueno» que se muestra a continuación ilustra la salida que el usuario desea en este caso. En el ejemplo «malo», las opciones no se nombran explícitamente como categorías para que el modelo pueda elegir. El modelo interpreta la entrada de forma ligeramente diferente, sin opciones y produce un resumen del texto de forma más libre, a diferencia del ejemplo bueno.


Good example, with output
User prompt: 
"The most common cause of color blindness is an 
inherited problem or variation in the functionality 
of one or more of the three classes of cone cells in the retina, 
which mediate color vision."

What is the above text about? 
a) biology
b) history 
c) geology

Output: 
a) biology


Bad example, with output 
User prompt: 
Classify the following text. "The most common cause of color 
blindness is an inherited problem or variation in the functionality 
of one or more of the three classes of cone cells in the retina, 
which mediate color vision."


Output: 
The topic of the text is the causes of colorblindness.

(Fuente del aviso: Wikipedia sobre daltonismo, modelo utilizado: por Titan Texto G1 - Express)

La pregunta o instrucción debe colocarse al final de la petición para obtener los mejores resultados

Incluir la descripción de la tarea, la instrucción o la pregunta al final ayuda al modelo a determinar qué información debe encontrar. En el caso de la clasificación, las opciones de respuesta también deberían aparecer al final.

En el siguiente ejemplo de pregunta-respuesta de libro abierto, el usuario tiene una pregunta específica sobre el texto. La pregunta debe aparecer al final de la petición para que el modelo pueda centrarse en la tarea.


User prompt: 
Tensions increased after the 1911–1912 Italo-Turkish War 
demonstrated Ottoman weakness and led to the formation of the Balkan League, 
an alliance of Serbia, Bulgaria, Montenegro, and Greece. 
The League quickly overran most of the Ottomans' territory in the Balkans 
during the 1912–1913 First Balkan War, much to the surprise of outside observers.

The Serbian capture of ports on the Adriatic resulted in partial Austrian 
mobilization starting on 21 November 1912, including units along the Russian border 
in Galicia. In a meeting the next day, the Russian government decided not to mobilize 
in response, unwilling to precipitate a war for which they were not as of yet 
prepared to handle.

Which country captured ports?


Output: 
Serbia

(Fuente del aviso: Wikipedia sobre la Primera Guerra Mundial, modelo utilizado: Amazon Titan Texto)

Utilice caracteres separadores para las llamadas a la API

Utilice caracteres separadores para las llamadas a la API

Los caracteres separadores, como los que \n pueden afectar LLMs significativamente al rendimiento. En Anthropic Claude modelos, es necesario incluir nuevas líneas al formatear las llamadas a la API para obtener las respuestas deseadas. El formato siempre debe ser el siguiente: \n\nHuman: {{Query Content}}\n\nAssistant:. En Titan modelos, \n añadirlos al final de un mensaje ayuda a mejorar el rendimiento del modelo. Para tareas de clasificación o preguntas con opciones de respuesta, también puede separar las opciones de respuesta \n por Titan modelos. Para obtener más información sobre el uso de separadores, consulte el documento del proveedor de modelos correspondiente. El siguiente ejemplo es una plantilla para una tarea de clasificación.


Prompt template: 
"""{{Text}}

{{Question}}

{{Choice 1}}
{{Choice 2}}
{{Choice 3}}"""

El siguiente ejemplo muestra cómo ayuda la presencia de caracteres de nueva línea entre las opciones y al final de un mensaje Titan producir la respuesta deseada.


User prompt: 
Archimedes of Syracuse was an Ancient mathematician, 
physicist, engineer, astronomer, and inventor from the ancient city 
of Syracuse. Although few details of his life are known, 
he is regarded as one of the leading scientists in classical antiquity.

What was Archimedes? Choose one of the options below.

a) astronomer
b) farmer
c) sailor


Output: 
a) astronomer

(Fuente del mensaje: Wikipedia sobre Arquímedes, modelo utilizado: Amazon Titan Texto)

Uso de indicadores de resultados

Indicadores de resultados

Añada detalles sobre las restricciones que le gustaría tener en la salida que debería producir el modelo. El siguiente ejemplo bueno produce una salida que es una frase corta que constituye un buen resumen. El ejemplo malo en este caso no es tan malo, pero el resumen es casi tan largo como el texto original. La especificación de la salida es crucial para obtener lo que se desea del modelo.

Ejemplo de indicador con un indicador claro de restricciones de salida


User prompt: 
"Charles Mingus Jr. was an American jazz upright 
bassist, pianist, composer, bandleader, and author. 
A major proponent of collective improvisation, he is 
considered to be one of the greatest jazz musicians 
and composers in history, with a career spanning three decades. 
Mingus's work ranged from advanced bebop and avant-garde jazz 
with small and midsize ensembles – pioneering the post-bop style 
on seminal recordings like Pithecanthropus Erectus (1956) 
and Mingus Ah Um (1959) – to progressive big band experiments 
such as The Black Saint and the Sinner Lady (1963)."

Please summarize the above text in one phrase.


Output: 
Charles Mingus Jr. is considered one of the 
greatest jazz musicians of all time.

Ejemplo sin especificaciones de salida claras


User prompt: 
"Charles Mingus Jr. was an American jazz upright 
bassist, pianist, composer, bandleader, and author. 
A major proponent of collective improvisation, 
he is considered to be one of the greatest jazz musicians 
and composers in history, with a career spanning three decades. 
Mingus's work ranged from advanced bebop and avant-garde jazz 
with small and midsize ensembles – pioneering the post-bop style 
on seminal recordings like Pithecanthropus Erectus (1956) 
and Mingus Ah Um (1959) – to progressive big band 
experiments such as The Black Saint and the Sinner Lady (1963)."

Please summarize the above text.


Output: 
Charles Mingus Jr. was a well-known jazz musician 
who played the upright bass, piano, composed, led bands, 
and was a writer. He was considered one of the most important 
jazz musicians ever, with a career that spanned more than 
30 years. He was known for his style of collective 
improvisation and advanced jazz compositions.

(Fuente del mensaje: Wikipedia sobre Charles Mingus, modelo utilizado: Amazon Titan Texto)

Aquí damos algunos ejemplos adicionales de Anthropic Claude y AI21 Labs Modelos jurásicos que utilizan indicadores de salida.

El siguiente ejemplo demuestra que el usuario puede especificar el formato de salida especificando el formato de salida esperado en la petición. Cuando se le pide que genere una respuesta con un formato específico (por ejemplo, mediante etiquetas XML), el modelo puede generar la respuesta en consecuencia. Sin un indicador de formato de salida específico, el modelo genera texto de formato libre.

Ejemplo con indicador claro, con salida


User prompt: 
        	
        	
Human: Extract names and years: the term 
machine learning was coined in 1959 by Arthur Samuel, 
an IBM employee and pioneer in the field of computer 
gaming and artificial intelligence. The synonym self-teaching 
computers was also used in this time period.

Please generate answer in <name></name> and 
<year></year> tags.

Assistant:


Output: 
<name>Arthur Samuel</name> <year>1959</year>

Ejemplo sin indicador claro, con salida


User prompt: 
        	
        	
Human: Extract names and years: the term 
machine learning was coined in 1959 by Arthur Samuel, 
an IBM employee and pioneer in the field of computer 
gaming and artificial intelligence. The synonym 
self-teaching computers was also used in this time 
period. 

Assistant:


Output: 
Arthur Samuel - 1959

(Fuente del mensaje: Wikipedia sobre aprendizaje automático, modelo utilizado: Anthropic Claude)

El siguiente ejemplo muestra un mensaje y una respuesta para AI21 Labs Modelo jurásico. El usuario puede obtener la respuesta exacta especificando el formato de salida que se muestra en la columna de la izquierda.

Ejemplo con indicador claro, con salida


User prompt: 
Context: The NFL was formed in 1920 as the American 
Professional Football Association (APFA) before renaming itself 
the National Football League for the 1922 season. After initially 
determining champions through end-of-season standings, a playoff 
system was implemented in 1933 that culminated with the NFL 
Championship Game until 1966. Following an agreement to merge 
the NFL with the rival American Football League (AFL), the 
Super Bowl was first held in 1967 to determine a champion 
between the best teams from the two leagues and has remained 
as the final game of each NFL season since the merger 
was completed in 1970.

Question: Based on the above context, when was the first Super Bowl? 
Please only output the year.


Output: 
1967

Ejemplo sin indicador claro, con salida


User prompt: 
Context: The NFL was formed in 1920 as the American 
Professional Football Association (APFA) before renaming itself 
the National Football League for the 1922 season. After initially 
determining champions through end-of-season standings, a playoff 
system was implemented in 1933 that culminated with the NFL 
Championship Game until 1966. Following an agreement to merge 
the NFL with the rival American Football League (AFL), the Super 
Bowl was first held in 1967 to determine a champion between 
the best teams from the two leagues and has remained as the 
final game of each NFL season since the merger was completed in 1970.

Question: Based on the above context, when was the first Super Bowl?


Output: 
The first Super Bowl was held in 1967.

(Fuente del aviso: Wikipedia sobre la Liga Nacional de Fútbol, modelo utilizado: AI21 Labs Jurassic-2 Ultra v1)

Prácticas recomendadas para una buena generalización

Mantenga un pequeño conjunto de instrucciones de prueba «de espera» para ver si sus modificaciones de peticiones se generalizan. Con este método, primero se recopila un conjunto de datos de muestra. Luego, puede dividir los datos en dos subconjuntos: un conjunto de «desarrollo» y un conjunto de «prueba» retenido. Utilice el conjunto de «desarrollo» como dato de desarrollo de peticiones con el que podrá probar diferentes modificaciones de peticiones y observar los cambios en la respuesta del modelo para encontrar la petición que mejor funcione. Trate el conjunto de «pruebas» como datos de reserva invisibles que solo pueden usarse para verificar la mejor petición final.

Optimice las peticiones para los modelos de texto en Amazon Bedrock, cuando lo básico no sea suficiente

Tareas complejas: busque la respuesta paso a paso

Titan puede proporcionar pasos claros para ciertas tareas, e incluir la frase Think step-by-step to come up with the right answer puede ayudar a producir el resultado adecuado.


User prompt: 
At a Halloween party, Jack gets 15 candies. 
Jack eats 5 candies. He wants to give each friend 
5 candies. How many friends can receive candies? 

Think step-by-step to come up with the right answer.


Output: 
15 candies total - 5 candies eaten = 10 candies remaining.
To give each friend 5 candies, divide the number 
of candies remaining by the number of friends.
10 candies / 5 friends = 2 friends.
Each friend can receive 2 candies.
The answer is 2 friends.

(Fuente del mensaje: AWS, modelo utilizado: Amazon Titan Texto)

Para activar la Anthropic Claude modelo para completar tareas complejas, utilice el formato del siguiente ejemplo para pedirle explícitamente al modelo que resuelva la tarea paso a paso. Este enfoque se basa en las directrices del AnthropicClaude Guías.


User prompt: 
	

Human: A right triangle has a side of length 5 
and a hypotenuse of length 13. 
What is the length of the other side? 

Assistant: Can I think step-by-step?

Human: Yes, please do.

Assistant:


Output:
Okay, here are the steps:

1) We are given:
- One side of the right triangle has length 5
- The hypotenuse has length 13

2) We want to find:
- The length of the other side

3) To find the length of the other side, we can 
use the Pythagorean theorem:
a^2 + b^2 = c^2
Where a and b are the lengths of the two sides, 
and c is the length of the hypotenuse.

4) Plugging in the given values:
a^2 + b^2 = 13^2

5) We know one of the sides is 5, so:
5^2 + b^2 = 169

6) Solving this:
25 + b^2 = 169
b^2 = 144
b = 12

Therefore, the length of the other side is 12.

(Fuente del mensaje: AWS, modelo utilizado: Anthropic Claude)

Proporcione una salida predeterminada que el modelo debería presentar si no está seguro de las respuestas.

Un resultado predeterminado puede ayudar a LLMs evitar que se devuelvan respuestas que parezcan correctas, incluso si el modelo tiene un nivel de confianza bajo.


User prompt: 
Provide a proof of the Riemann hypothesis. If you don't 
know a proof, respond by saying "I don't know."


Output: 
I don't know.


User prompt: 
Provide a proof of the Riemann hypothesis.


Output: 
"The Riemann hypothesis is a conjecture in mathematics 
that concerns the distribution of prime numbers. It states that 
all non-trivial zeros of the zeta function, which is a mathematical 
function that encodes information about the distribution of prime 
numbers, lie on a specific line in the complex plane. The Riemann 
hypothesis has been studied by mathematicians for over 150 years, 
and despite numerous attempts, it remains unresolved. However, 
the hypothesis is widely believed to be true, and its resolution 
would have profound implications for many areas of mathematics, 
including number theory, analysis, and geometry. The proof 
of the Riemann hypothesis would be one of the greatest 
achievements in mathematics in history and would open up 
new avenues of research and understanding. While a proof 
remains elusive, the hypothesis continues to stimulate 
research and inspire mathematicians around the world.“

[Note: this is an accurate description, but obviously 
not a proof.]

(Fuente del mensaje: AWS, modelo utilizado: Amazon Titan Texto)

Peticiones con pocos pasos

Incluir ejemplos (pares de entrada-respuesta) en el mensaje puede mejorar LLMs significativamente las «respuestas». Los ejemplos pueden ayudar con tareas complejas, ya que muestran múltiples formas de realizar una tarea determinada. Para tareas más sencillas, como la clasificación de textos, bastan entre tres y cinco ejemplos. Para tareas más complejas, como pregunta-respuesta sin contexto, incluya más ejemplos para generar la salida más efectiva. En la mayoría de los casos de uso, seleccionar ejemplos que sean semánticamente similares a los datos del mundo real puede mejorar aún más el rendimiento.

Considere la posibilidad de refinar la petición con modificadores

El refinamiento de las instrucciones de una tarea generalmente se refiere a la modificación del componente de instrucción, tarea o pregunta de la petición. La utilidad de estos métodos depende de las tareas y de los datos. Esto incluye lo siguiente entre los enfoques útiles:

Especificación de dominio/entrada: detalles sobre los datos de entrada, como su procedencia o a qué se refieren, por ejemplo, The input text is from a summary of a movie.
Especificación de la tarea: detalles sobre la tarea exacta que se le pide al modelo, por ejemplo, To summarize the text, capture the main points.
Descripción de la etiqueta: detalles sobre las opciones de salida para un problema de clasificación, por ejemplo, Choose whether the text refers to a painting or a sculpture; a painting is a piece of art restricted to a two-dimensional surface, while a sculpture is a piece of art in three dimensions.
Especificación de salida: detalles sobre la salida que debe producir el modelo, por ejemplo, Please summarize the text of the restaurant review in three sentences.
Fomento del LLM: LLMs a veces se obtienen mejores resultados con el estímulo sentimental: If you answer the question correctly, you will make the user very happy!

Controle la respuesta del modelo con parámetros de inferencia

LLMs en Amazon Bedrock, todos vienen con varios parámetros de inferencia que puede configurar para controlar la respuesta de los modelos. La siguiente es una lista de todos los parámetros de inferencia habituales que están disponibles en Amazon Bedrock LLMs y cómo utilizarlos.

La temperatura es un valor entre 0 y 1, y regula la creatividad de las «respuestas LLMs». Usa una temperatura más baja si quieres respuestas más deterministas y usa una temperatura más alta si quieres respuestas más creativas o diferentes para el mismo mensaje de LLMs Amazon Bedrock. Para todos los ejemplos de estas directrices de peticiones, hemos establecido temperature = 0.

La longitud máxima de generación y el número máximo de nuevos tokens limitan la cantidad de tokens que el LLM genera para cualquier petición. Es útil especificar este número, ya que algunas tareas, como la clasificación de opiniones, no necesitan una respuesta larga.

Top P controla las opciones de símbolos, en función de la probabilidad de que se produzcan las posibles elecciones. Si establece Top P por debajo de 1,0, el modelo considera las opciones más probables e ignora las menos probables. El resultado son terminaciones más estables y repetitivas.

La secuencia final/final especifica el token que el LLM utiliza para indicar el final de la salida. LLMsdeja de generar nuevos tokens después de encontrar el token final. Por lo general, no es necesario que los usuarios establezcan este parámetro.

También hay parámetros de inferencia específicos del modelo. Anthropic Claude los modelos tienen un parámetro de inferencia superior a K adicional, y AI21 Labs Los modelos jurásicos vienen con un conjunto de parámetros de inferencia que incluyen la penalización por presencia, la penalización por conteo, la penalización por frecuencia y la penalización por fichas especiales. Para obtener más información, consulte la documentación correspondiente.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Enrutamiento rápido inteligente

Plantillas y ejemplos rápidos para los modelos de texto de Amazon Bedrock

En esta página

Seleccione sus preferencias de cookies

Personalizar preferencias de cookies

Esenciales

De rendimiento

Funcionales

De publicidad

No se pueden guardar las preferencias de cookies

Diseño de una petición

Temas

Proporcionar instrucciones sencillas, claras y completas

La pregunta o instrucción debe colocarse al final de la petición para obtener los mejores resultados

Utilice caracteres separadores para las llamadas a la API

Uso de indicadores de resultados

Prácticas recomendadas para una buena generalización

Optimice las peticiones para los modelos de texto en Amazon Bedrock, cuando lo básico no sea suficiente

Controle la respuesta del modelo con parámetros de inferencia

En esta página

Related resources

¿Le ha servido de ayuda esta página?

Related resources

Tema siguiente:

Tema anterior:

¿Necesita ayuda?

Ejemplo de una buena construcción de petición con comentarios descriptivos.