Puntos de conexión y cuotas de Amazon Bedrock - AWS Referencia general

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Puntos de conexión y cuotas de Amazon Bedrock

En las páginas siguientes se describen los puntos de conexión y las Service Quotas para este servicio. Para conectarse mediante programación a un AWS servicio, se utiliza un punto final. Además de los puntos de conexión estándar AWS , algunos AWS servicios ofrecen puntos de conexión en FIPS determinadas regiones. Para obtener más información, consulte AWS puntos finales de servicio. Las cuotas de servicio, también denominadas límites, son la cantidad máxima de recursos u operaciones de servicio para su AWS cuenta. Para obtener más información, consulte AWS cuotas de servicio.

Puntos de conexión de servicio

Avión de control Amazon Bedrock APIs

La siguiente tabla proporciona una lista de puntos de enlace específicos de la región que Amazon Bedrock admite para la administración, el entrenamiento y la implementación de modelos. Utilice estos puntos de enlace para las operaciones de Amazon Bedrock API.

Nombre de la región Región Punto de conexión Protocolo
Este de EE. UU. (Ohio) us-east-2

bedrock.us-east-2.amazonaws.com

bedrock-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

Este de EE. UU. (Norte de Virginia) us-east-1

bedrock.us-east-1.amazonaws.com

bedrock-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

Oeste de EE. UU. (Oregón) us-west-2

bedrock.us-west-2.amazonaws.com

bedrock-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

Asia-Pacífico (Bombay) ap-south-1 bedrock.ap-south-1.amazonaws.com HTTPS
Asia-Pacífico (Seúl) ap-northeast-2 bedrock.ap-northeast-2.amazonaws.com HTTPS
Asia-Pacífico (Singapur) ap-southeast-1 bedrock.ap-southeast-1.amazonaws.com HTTPS
Asia-Pacífico (Sídney) ap-southeast-2 bedrock.ap-southeast-2.amazonaws.com HTTPS
Asia-Pacífico (Tokio) ap-northeast-1 bedrock.ap-northeast-1.amazonaws.com HTTPS
Canadá (centro) ca-central-1

bedrock.ca-central-1.amazonaws.com

bedrock-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

Europa (Fráncfort) eu-central-1 bedrock.eu-central-1.amazonaws.com HTTPS
Europa (Irlanda) eu-west-1 bedrock.eu-west-1.amazonaws.com HTTPS
Europa (Londres) eu-west-2 bedrock.eu-west-2.amazonaws.com HTTPS
Europa (París) eu-west-3 bedrock.eu-west-3.amazonaws.com HTTPS
Europa (Zúrich) eu-central-2 bedrock.eu-central-2.amazonaws.com HTTPS
América del Sur (São Paulo) sa-east-1 bedrock.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (Este de EE. UU.) us-gov-east-1

bedrock.us-gov-east-1.amazonaws.com

bedrock-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (Estados Unidos-Oeste) us-gov-west-1

bedrock.us-gov-west-1.amazonaws.com

bedrock-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Tiempo de ejecución de Amazon Bedrock APIs

La siguiente tabla proporciona una lista de puntos de enlace específicos de la región que Amazon Bedrock admite para realizar solicitudes de inferencia para modelos alojados en Amazon Bedrock. Utilice estos puntos de enlace para las operaciones de Amazon Bedrock Runtime API.

Nombre de la región Región Punto de conexión Protocolo
Este de EE. UU. (Ohio) us-east-2

bedrock-runtime.us-east-2.amazonaws.com

bedrock-runtime-fips.us-east-2.amazonaws.com

HTTPS

HTTPS

Este de EE. UU. (Norte de Virginia) us-east-1

bedrock-runtime.us-east-1.amazonaws.com

bedrock-runtime-fips.us-east-1.amazonaws.com

HTTPS

HTTPS

Oeste de EE. UU. (Oregón) us-west-2

bedrock-runtime.us-west-2.amazonaws.com

bedrock-runtime-fips.us-west-2.amazonaws.com

HTTPS

HTTPS

Asia-Pacífico (Bombay) ap-south-1 bedrock-runtime.ap-south-1.amazonaws.com HTTPS
Asia-Pacífico (Seúl) ap-northeast-2 bedrock-runtime.ap-northeast-2.amazonaws.com HTTPS
Asia-Pacífico (Singapur) ap-southeast-1 bedrock-runtime.ap-southeast-1.amazonaws.com HTTPS
Asia-Pacífico (Sídney) ap-southeast-2 bedrock-runtime.ap-southeast-2.amazonaws.com HTTPS
Asia-Pacífico (Tokio) ap-northeast-1 bedrock-runtime.ap-northeast-1.amazonaws.com HTTPS
Canadá (centro) ca-central-1

bedrock-runtime.ca-central-1.amazonaws.com

bedrock-runtime-fips.ca-central-1.amazonaws.com

HTTPS

HTTPS

Europa (Fráncfort) eu-central-1 bedrock-runtime.eu-central-1.amazonaws.com HTTPS
Europa (Irlanda) eu-west-1 bedrock-runtime.eu-west-1.amazonaws.com HTTPS
Europa (Londres) eu-west-2 bedrock-runtime.eu-west-2.amazonaws.com HTTPS
Europa (París) eu-west-3 bedrock-runtime.eu-west-3.amazonaws.com HTTPS
Europa (Zúrich) eu-central-2 bedrock-runtime.eu-central-2.amazonaws.com HTTPS
América del Sur (São Paulo) sa-east-1 bedrock-runtime.sa-east-1.amazonaws.com HTTPS
AWS GovCloud (Este de EE. UU.) us-gov-east-1

bedrock-runtime.us-gov-east-1.amazonaws.com

bedrock-runtime-fips.us-gov-east-1.amazonaws.com

HTTPS

HTTPS

AWS GovCloud (Estados Unidos-Oeste) us-gov-west-1

bedrock-runtime.us-gov-west-1.amazonaws.com

bedrock-runtime-fips.us-gov-west-1.amazonaws.com

HTTPS

HTTPS

Tiempo de construcción de Agents for Amazon Bedrock APIs

La siguiente tabla proporciona una lista de puntos de enlace específicos de la región que Agents for Amazon Bedrock admite para crear y administrar agentes y bases de conocimiento. Utilice estos puntos de enlace para las operaciones de Agents for Amazon Bedrock API.

Nombre de la región Región Punto de conexión Protocolo
Este de EE. UU. (Norte de Virginia) us-east-1 bedrock-agent.us-east-1.amazonaws.com HTTPS
bedrock-agent-fips.us-east-1.amazonaws.com HTTPS
Oeste de EE. UU. (Oregón) us-west-2 bedrock-agent.us-west-2.amazonaws.com HTTPS
bedrock-agent-fips.us-west-2.amazonaws.com HTTPS
Asia-Pacífico (Singapur) ap-southeast-1 bedrock-agent.ap-southeast-1.amazonaws.com HTTPS
Asia Pacífico (Sídney) ap-southeast-2 bedrock-agent.ap-southeast-2.amazonaws.com HTTPS
Asia-Pacífico (Tokio) ap-northeast-1 bedrock-agent.ap-northeast-1.amazonaws.com HTTPS
Canadá (centro) ca-central-1 bedrock-agent.ca-central-1.amazonaws.com HTTPS
Europa (Fráncfort) eu-central-1 bedrock-agent.eu-central-1.amazonaws.com HTTPS
Europa (Irlanda) eu-west-1 bedrock-agent.eu-west-1.amazonaws.com HTTPS
Europa (Londres) eu-west-2 bedrock-agent.eu-west-2.amazonaws.com HTTPS
Europa (París) eu-west-3 bedrock-agent.eu-west-3.amazonaws.com HTTPS
Asia Pacífico (Bombay) ap-south-1 bedrock-agent.ap-south-1.amazonaws.com HTTPS
América del Sur (São Paulo) sa-east-1 bedrock-agent.sa-east-1.amazonaws.com HTTPS

Tiempo de ejecución de Agents for Amazon Bedrock APIs

La siguiente tabla proporciona una lista de puntos de enlace específicos de la región que Agents for Amazon Bedrock admite para invocar agentes y consultar bases de conocimiento. Utilice estos puntos de enlace para los agentes para las operaciones de Amazon Bedrock Runtime API.

Nombre de la región Región Punto de conexión Protocolo
Este de EE. UU. (Norte de Virginia) us-east-1 bedrock-agent-runtime.us-east-1.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-east-1.amazonaws.com HTTPS
Oeste de EE. UU. (Oregón) us-west-2 bedrock-agent-runtime.us-west-2.amazonaws.com HTTPS
bedrock-agent-runtime-fips.us-west-2.amazonaws.com HTTPS
Asia-Pacífico (Singapur) ap-southeast-1 bedrock-agent-runtime.ap-southeast-1.amazonaws.com HTTPS
Asia Pacífico (Sídney) ap-southeast-2 bedrock-agent-runtime.ap-southeast-2.amazonaws.com HTTPS
Asia-Pacífico (Tokio) ap-northeast-1 bedrock-agent-runtime.ap-northeast-1.amazonaws.com HTTPS
Canadá (centro) ca-central-1 bedrock-agent-runtime.ca-central-1.amazonaws.com HTTPS
Europa (Fráncfort) eu-central-1 bedrock-agent-runtime.eu-central-1.amazonaws.com HTTPS
Europa (París) eu-west-3 bedrock-agent-runtime.eu-west-3.amazonaws.com HTTPS
Europa (Irlanda) eu-west-1 bedrock-agent-runtime.eu-west-1.amazonaws.com HTTPS
Europa (Londres) eu-west-2 bedrock-agent-runtime.eu-west-2.amazonaws.com HTTPS
Asia Pacífico (Bombay) ap-south-1 bedrock-agent-runtime.ap-south-1.amazonaws.com HTTPS
América del Sur (São Paulo) sa-east-1 bedrock-agent-runtime.sa-east-1.amazonaws.com HTTPS

Service Quotas

Para obtener instrucciones sobre cómo solicitar un aumento de cuota, tanto para las cuotas cuyo valor ajustable esté marcado como como para las que estén marcadas como No, consulte Solicitar un aumento de las cuotas de Amazon Bedrock. En la siguiente tabla se muestra una lista de cuotas para Amazon Bedrock:

Nombre Valor predeterminado Ajustable Descripción
APIspor agente Cada región admitida: 11 La cantidad máxima APIs que puede añadir a un agente.
Grupos de acciones por agente Cada región admitida: 20 El número máximo de grupos de acciones que puede añadir a un agente.
Nodos de agente por flujo Cada región admitida: 10 No El número máximo de nodos de agente.
Agentes por cuenta

ca-central-1:200

eu-central-1:200

Cada una de las demás regiones admitidas: 50

El número máximo de agentes en una cuenta.
AssociateAgentKnowledgeBase solicitudes por segundo Cada región admitida: 6 No El número máximo de AssociateAgentKnowledgeBase API solicitudes por segundo.
Alias asociados por agente Cada región admitida: 10 No El número máximo de alias que puede asociar a un agente.
Bases de conocimiento asociadas por agente Cada región admitida: 2 El número máximo de bases de conocimiento que puede asociar a un agente.
Tamaño del archivo de entrada de inferencia por lotes Cada región compatible: 1.073.741.824 El tamaño máximo de un único archivo (en bytes) enviado para la inferencia por lotes.
Tamaño del trabajo de inferencia por lotes Cada región compatible: 5.368.709.120 El tamaño máximo acumulado de todos los archivos de entrada (en bytes) incluidos en el trabajo de inferencia por lotes.
Caracteres en las instrucciones del agente Cada región admitida: 8 000 El número máximo de caracteres de las instrucciones de un agente.
Nodos recopiladores por flujo Cada región admitida: 1 No El número máximo de nodos recopiladores.
Trabajos de ingestión simultáneos por cuenta Cada región admitida: 5 No El número máximo de trabajos de ingestión que se pueden ejecutar al mismo tiempo en una cuenta.
Trabajos de ingestión simultáneos por fuente de datos Cada región admitida: 1 No El número máximo de trabajos de ingesta que se pueden ejecutar al mismo tiempo para una fuente de datos.
Trabajos de ingestión simultáneos por base de conocimientos Cada región admitida: 1 No El número máximo de trabajos de ingestión que se pueden ejecutar al mismo tiempo para una base de conocimientos.
Trabajos de importación de modelos simultáneos Cada región admitida: 1 No El número máximo de trabajos de importación de modelos que están en curso simultáneamente.
Condicione los nodos por flujo Cada región admitida: 5 No El número máximo de nodos de condición.
Condiciones por nodo de condición Cada región admitida: 5 No El número máximo de condiciones por nodo de condición.
Basado en el contexto, la longitud de la consulta en unidades de texto Cada región admitida: 1 No La longitud máxima, en unidades de texto, de la consulta para su fundamentación contextual
Longitud de la respuesta basada en el contexto en unidades de texto Cada región admitida: 5 No La longitud máxima, en unidades de texto, de la respuesta para la fundamentación contextual
Longitud de la fuente de base contextual en unidades de texto

us-east-1: 100

us-west-2: 100

Cada una de las demás regiones compatibles: 50

No La longitud máxima, en unidades de texto, de la fuente de base para la fundamentación contextual
CreateAgent solicitudes por segundo Cada región admitida: 6 No El número máximo de CreateAgent API solicitudes por segundo.
CreateAgentActionGroup solicitudes por segundo Cada región admitida: 12 No El número máximo de CreateAgentActionGroup API solicitudes por segundo.
CreateAgentAlias solicitudes por segundo Cada región admitida: 2 No El número máximo de CreateAgentAlias API solicitudes por segundo.
CreateDataSource solicitudes por segundo Cada región admitida: 2 No El número máximo de CreateDataSource API solicitudes por segundo.
CreateFlow solicitudes por segundo Cada región admitida: 2 No El número máximo de CreateFlow solicitudes por segundo.
CreateFlowAlias solicitudes por segundo Cada región admitida: 2 No El número máximo de CreateFlowAlias solicitudes por segundo.
CreateFlowVersion solicitudes por segundo Cada región admitida: 2 No El número máximo de CreateFlowVersion solicitudes por segundo.
CreateKnowledgeBase solicitudes por segundo Cada región admitida: 2 No El número máximo de CreateKnowledgeBase API solicitudes por segundo.
CreatePrompt solicitudes por segundo Cada región admitida: 2 No El número máximo de CreatePrompt solicitudes por segundo.
CreatePromptVersion solicitudes por segundo Cada región admitida: 2 No El número máximo de CreatePromptVersion solicitudes por segundo.
InvokeModel Solicitudes interregionales por minuto para Anthropic Claude 3.5 Haiku Cada región admitida: 2 000 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModelWithResponseStream fichas InvokeModel y fichas de Anthropic Claude 3.5 Haiku.
InvokeModel Tokens por minuto entre regiones para Anthropic Claude 3.5 Haiku Cada región compatible: 4 000 000 No La cantidad máxima de fichas que puedes proporcionar en un minuto InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Anthropic Claude 3.5 Haiku.
Modelos personalizados por cuenta Cada región admitida: 100 La cantidad máxima de modelos personalizados en una cuenta.
Fuentes de datos por base de conocimiento Cada región admitida: 5 No El número máximo de fuentes de datos por base de conocimiento.
DeleteAgent solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteAgent API solicitudes por segundo.
DeleteAgentActionGroup solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteAgentActionGroup API solicitudes por segundo.
DeleteAgentAlias solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteAgentAlias API solicitudes por segundo.
DeleteAgentVersion solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteAgentVersion API solicitudes por segundo.
DeleteDataSource solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteDataSource API solicitudes por segundo.
DeleteFlow solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteFlow solicitudes por segundo.
DeleteFlowAlias solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteFlowAlias solicitudes por segundo.
DeleteFlowVersion solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteFlowVersion solicitudes por segundo.
DeleteKnowledgeBase solicitudes por segundo Cada región admitida: 2 No El número máximo de DeleteKnowledgeBase API solicitudes por segundo.
DeletePrompt solicitudes por segundo Cada región admitida: 2 No El número máximo de DeletePrompt solicitudes por segundo.
DisassociateAgentKnowledgeBase solicitudes por segundo Cada región admitida: 4 No El número máximo de DisassociateAgentKnowledgeBase API solicitudes por segundo.
Grupos de acciones habilitados por agente Cada región admitida: 11 El número máximo de grupos de acciones que puede habilitar en un agente.
Puntos finales por perfil de inferencia Cada región admitida: 5 No El número máximo de puntos finales de un perfil de inferencia. Un punto final se define mediante un modelo y la región a la que se envían las solicitudes de invocación al modelo.
Frases de ejemplo por tema Cada región admitida: 5 No El número máximo de ejemplos de temas que se pueden incluir por tema
Archivos para añadir o actualizar por trabajo de ingestión Cada región compatible: 5 000 000 No El número máximo de archivos nuevos y actualizados que se pueden ingerir por trabajo de ingestión.
Archivos que se van a eliminar por trabajo de ingestión Cada región compatible: 5 000 000 No El número máximo de archivos que se pueden eliminar por trabajo de ingestión.
Alias de flujo por flujo Cada región admitida: 10 No El número máximo de alias de flujo.
Versiones de flujo por flujo Cada región admitida: 10 No El número máximo de versiones de flujo.
Flujos por cuenta Cada región admitida: 100 El número máximo de flujos por cuenta.
GetAgent solicitudes por segundo Cada región admitida: 15 No El número máximo de GetAgent API solicitudes por segundo.
GetAgentActionGroup solicitudes por segundo Cada región admitida: 20 No El número máximo de GetAgentActionGroup API solicitudes por segundo.
GetAgentAlias solicitudes por segundo Cada región admitida: 10 No El número máximo de GetAgentAlias API solicitudes por segundo.
GetAgentKnowledgeBase solicitudes por segundo Cada región admitida: 15 No El número máximo de GetAgentKnowledgeBase API solicitudes por segundo.
GetAgentVersion solicitudes por segundo Cada región admitida: 10 No El número máximo de GetAgentVersion API solicitudes por segundo.
GetDataSource solicitudes por segundo Cada región admitida: 10 No El número máximo de GetDataSource API solicitudes por segundo.
GetFlow solicitudes por segundo Cada región admitida: 10 No El número máximo de GetFlow solicitudes por segundo.
GetFlowAlias solicitudes por segundo Cada región admitida: 10 No El número máximo de GetFlowAlias solicitudes por segundo.
GetFlowVersion solicitudes por segundo Cada región admitida: 10 No El número máximo de GetFlowVersion solicitudes por segundo.
GetIngestionJob solicitudes por segundo Cada región admitida: 10 No El número máximo de GetIngestionJob API solicitudes por segundo.
GetKnowledgeBase solicitudes por segundo Cada región admitida: 10 No El número máximo de GetKnowledgeBase API solicitudes por segundo.
GetPrompt solicitudes por segundo Cada región admitida: 10 No El número máximo de GetPrompt solicitudes por segundo.
Barandillas por cuenta Cada región admitida: 100 No El número máximo de barandas en una cuenta
Modelos importados por cuenta Cada región admitida: 3 El número máximo de modelos importados en una cuenta.
Perfiles de inferencia por cuenta Cada región admitida: 1000 El número máximo de perfiles de inferencia en una cuenta.
Tamaño del archivo del trabajo de ingestión Cada región admitida: 50 No El tamaño máximo (en MB) de un archivo en un trabajo de ingestión.
Tamaño del trabajo de ingestión Cada región admitida: 100 No El tamaño máximo (en GB) de un trabajo de ingestión.
Nodos de entrada por flujo Cada región admitida: 1 No El número máximo de nodos de entrada de flujo.
Nodos iteradores por flujo Cada región admitida: 1 No El número máximo de nodos iteradores.
Nodos de la base de conocimientos por flujo Cada región admitida: 10 No El número máximo de nodos de la base de conocimientos.
Bases de conocimiento por cuenta Cada región admitida: 100 No El número máximo de bases de conocimiento por cuenta.
Nodos de función Lambda por flujo Cada región admitida: 10 No El número máximo de nodos de la función Lambda.
Nodos Lex por flujo Cada región admitida: 5 No El número máximo de nodos Lex.
ListAgentActionGroups solicitudes por segundo Cada región admitida: 10 No El número máximo de ListAgentActionGroups API solicitudes por segundo.
ListAgentAliases solicitudes por segundo Cada región admitida: 10 No El número máximo de ListAgentAliases API solicitudes por segundo.
ListAgentKnowledgeBases solicitudes por segundo Cada región admitida: 10 No El número máximo de ListAgentKnowledgeBases API solicitudes por segundo.
ListAgentVersions solicitudes por segundo Cada región admitida: 10 No El número máximo de ListAgentVersions API solicitudes por segundo.
ListAgents solicitudes por segundo Cada región admitida: 10 No El número máximo de ListAgents API solicitudes por segundo.
ListDataSources solicitudes por segundo Cada región admitida: 10 No El número máximo de ListDataSources API solicitudes por segundo.
ListFlowAliases solicitudes por segundo Cada región admitida: 10 No El número máximo de ListFlowAliases solicitudes por segundo.
ListFlowVersions solicitudes por segundo Cada región admitida: 10 No El número máximo de ListFlowVersions solicitudes por segundo.
ListFlows solicitudes por segundo Cada región admitida: 10 No El número máximo de ListFlows solicitudes por segundo.
ListIngestionJobs solicitudes por segundo Cada región admitida: 10 No El número máximo de ListIngestionJobs API solicitudes por segundo.
ListKnowledgeBases solicitudes por segundo Cada región admitida: 10 No El número máximo de ListKnowledgeBases API solicitudes por segundo.
ListPrompts solicitudes por segundo Cada región admitida: 10 No El número máximo de ListPrompts solicitudes por segundo.
Unidades del modelo: rendimientos aprovisionados sin compromiso en todos los modelos básicos Cada región admitida: 2 El número máximo de unidades modelo que se pueden distribuir entre los rendimientos aprovisionados sin compromiso para los modelos básicos
Unidades modelo: rendimientos aprovisionados sin compromiso en modelos personalizados Cada región admitida: 2 El número máximo de unidades de modelo que se pueden distribuir entre los rendimientos aprovisionados sin compromiso para los modelos personalizados
Unidades de modelo por modelo aprovisionado para Labs Jurassic-2 Mid AI21 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Labs Jurassic-2 Mid. AI21
Unidades de modelo por modelo aprovisionado para Labs Jurassic-2 Ultra AI21 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Labs Jurassic-2 Ultra. AI21
Unidades de modelo por modelo aprovisionado para Amazon Titan Embeddings G1 - Texto Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Embeddings G1 - Text.
Unidades de modelo por modelo aprovisionado para Amazon Titan Image Generator G1 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Image Generator G1.
Unidades de modelo por modelo aprovisionado para Amazon Titan Image Generator G2 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Image Generator G2.
Unidades de modelo por modelo aprovisionado para Amazon Titan Lite V1 4K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Text Lite V1 4K.
Unidades de modelo por modelo aprovisionado para Amazon Titan Multimodal Embeddings G1 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Multimodal Embeddings G1.
Unidades de modelo por modelo aprovisionado para Amazon Titan Text Embeddings V2 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Text Embeddings V2.
Unidades de modelo por modelo aprovisionado para Amazon Titan Text G1 - Express 8K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Text G1 - Express 8K.
Unidades de modelo por modelo aprovisionado para Amazon Titan Text Premier V1 32K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Amazon Titan Text Premier V1 32K.
Unidades de modelo por modelo aprovisionado para Anthropic Claude 3 Haiku 200K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Anthropic Claude 3 Haiku 200K.
Unidades de modelo por modelo aprovisionado para el Anthropic Claude 3 Haiku 48K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Anthropic Claude 3 Haiku 48K.
Unidades de modelo por modelo aprovisionado para el Anthropic Claude 3 Sonnet 200K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Anthropic Claude 3 Sonnet 200K.
Unidades de modelo por modelo aprovisionado para el Anthropic Claude 3 Sonnet 28K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Anthropic Claude 3 Sonnet 28K.
Unidades de modelo por modelo aprovisionado para Anthropic Claude 3.5 Sonnet 18K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Anthropic Claude 3.5 Sonnet 18K.
Unidades de modelo por modelo aprovisionado para el Anthropic Claude 3.5 Sonnet 200K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Anthropic Claude 3.5 Sonnet 200K.
Unidades de modelo por modelo aprovisionado para el Anthropic Claude 3.5 Sonnet 51K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Anthropic Claude 3.5 Sonnet 51K.
Unidades de modelo por modelo aprovisionado para Anthropic Claude Instant V1 100K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Anthropic Claude Instant V1 100K.
Unidades de modelo por modelo aprovisionado para Anthropic Claude V2 100K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Anthropic Claude V2 100K.
Unidades de modelo por modelo aprovisionado para Anthropic Claude V2 18K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Anthropic Claude V2 18K.
Unidades de modelo por modelo aprovisionado para Anthropic Claude V2.1 18K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Anthropic Claude V2.1 18K.
Unidades de modelo por modelo aprovisionado para Anthropic Claude V2.1 200K Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Anthropic Claude V2.1 200k.
Unidades de modelo por modelo aprovisionado para Cohere Command Cada región admitida: 0 El número máximo de unidades modelo que se pueden asignar a un modelo aprovisionado para Cohere Command.
Unidades de modelo por modelo aprovisionado para Cohere Command Light Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Cohere Command Light.
Unidades de modelo por modelo aprovisionado para Cohere Command R Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Cohere Command R 128k.
Unidades de modelo por modelo aprovisionado para Cohere Command R Plus Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Cohere Command R Plus 128k.
Unidades de modelo por modelo aprovisionado para Cohere Embed English Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Cohere Embed English.
Unidades de modelo por modelo aprovisionado para Cohere Embed Multilingual Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Cohere Embed Multilingual.
Unidades de modelo por modelo aprovisionado para Meta Llama 2 13B Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 2 13B.
Unidades de modelo por modelo aprovisionado para Meta Llama 2 70B Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 2 70B.
Unidades de modelo por modelo aprovisionado para Meta Llama 2 Chat 13B Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 2 Chat 13B.
Unidades de modelo por modelo aprovisionado para Meta Llama 2 Chat 70B Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 2 Chat 70B.
Unidades de modelo por modelo aprovisionado para Meta Llama 3 70B Instruct Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 3 70B Instruct.
Unidades de modelo por modelo aprovisionado para Meta Llama 3 8B Instruct Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 3 8B Instruct.
Unidades de modelo por modelo aprovisionado para Meta Llama 3.1 70B Instruct Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 3.1 70B Instruct.
Unidades de modelo por modelo aprovisionado para Meta Llama 3.1 8B Instruct Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 3.1 8B Instruct.
Unidades de modelo por modelo aprovisionado para Meta Llama 3.2 1B Instruct Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 3.2 1B Instruct.
Unidades de modelo por modelo aprovisionado para Meta Llama 3.2 3B Instruct Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Meta Llama 3.2 3B Instruct.
Unidades de modelo por modelo aprovisionado para Mistral Large 2407 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para el Mistral Large 2407.
Unidades de modelo por modelo aprovisionado para Mistral Small Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Mistral Small.
Unidades de modelo por modelo aprovisionado para Stability.ai Stable Diffusion XL 0.8 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Stability.ai Stable Diffusion XL 0.8
Unidades de modelo por modelo aprovisionado para Stability.ai Stable Diffusion XL 1.0 Cada región admitida: 0 El número máximo de unidades de modelo que se pueden asignar a un modelo aprovisionado para Stability.ai Stable Diffusion XL 1.0.
Número de trabajos de evaluación automática de modelos simultáneos Cada región admitida: 20 No El número máximo de trabajos de evaluación automática de modelos que puede especificar al mismo tiempo en esta cuenta en la región actual.
Número de trabajos de evaluación de modelos simultáneos que utilizan trabajadores humanos Cada región admitida: 10 No El número máximo de trabajos de evaluación de modelos que utilizan trabajadores humanos se puede especificar al mismo tiempo en esta cuenta en la región actual.
Número de métricas personalizadas Cada región admitida: 10 No El número máximo de métricas personalizadas que puede especificar en un trabajo de evaluación de modelos que utiliza trabajadores humanos.
Número de conjuntos de datos rápidos personalizados en un trabajo de evaluación de modelos basado en humanos Cada región admitida: 1 No El número máximo de conjuntos de datos de solicitudes personalizadas que puede especificar en un trabajo de evaluación de modelos basado en humanos en esta cuenta en la región actual.
Número de conjuntos de datos por trabajo Cada región admitida: 5 No El número máximo de conjuntos de datos que puede especificar en un trabajo de evaluación de modelos automatizada. Esto incluye conjuntos de datos de solicitudes personalizados e integrados.
Número de trabajos de evaluación Cada región admitida: 5000 No El número máximo de trabajos de evaluación de modelos que puede crear en esta cuenta en la región actual.
Número de métricas por conjunto de datos Cada región admitida: 3 No El número máximo de métricas que puede especificar por conjunto de datos en un trabajo de evaluación de modelos automatizado. Esto incluye métricas personalizadas e integradas.
Número de modelos en un trabajo de evaluación de modelos que utiliza trabajadores humanos Cada región admitida: 2 No El número máximo de modelos que puede especificar en un trabajo de evaluación de modelos que utiliza trabajadores humanos.
Número de modelos en un trabajo de evaluación de modelos automatizada Cada región admitida: 1 No El número máximo de modelos que puede especificar en un trabajo de evaluación de modelos automatizado.
Número de solicitudes en un conjunto de datos de solicitudes personalizado Cada región admitida: 1000 No El número máximo de solicitudes que puede contener un conjunto de datos de solicitudes personalizado.
Política de filtrado ApplyGuardrail de contenido bajo demanda (unidades de texto por segundo) Cada región admitida: 25 No El número máximo de unidades de texto que se pueden procesar para las políticas de filtrado de contenido por segundo
Unidades de texto por segundo de la política de temas ApplyGuardrail denegados bajo demanda Cada región admitida: 25 No El número máximo de unidades de texto que se pueden procesar para las políticas de temas denegados por segundo
Unidades de texto por segundo de la política de filtrado de información ApplyGuardrail confidencial bajo demanda Cada región admitida: 25 No El número máximo de unidades de texto que se pueden procesar para las políticas de filtrado de información confidencial por segundo
Unidades de texto por segundo de la política de filtrado de ApplyGuardrail textos bajo demanda Cada región admitida: 25 No El número máximo de unidades de texto que se pueden procesar para las políticas de filtrado de Word por segundo.
Unidades de texto por segundo de la política de fundamentación ApplyGuardrail contextual según demanda

us-east-1:106

us-west-2:106

Cada una de las demás regiones compatibles: 53

No El número máximo de unidades de texto que se pueden procesar para las políticas de base contextual por segundo
ApplyGuardrail Solicitudes bajo demanda por segundo Cada región admitida: 25 No El número máximo de ApplyGuardrail API llamadas permitidas por segundo
InvokeModel Solicitudes bajo demanda por minuto para AI21 Labs Jamba 1.5 Large Cada región admitida: 100 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto en el caso de AI21 Labs Jamba 1.5 Large. La cuota considera la suma combinada de las solicitudes de Converse y InvokeModel
InvokeModel Solicitudes a pedido por minuto para AI21 Labs Jamba 1.5 Mini Cada región admitida: 100 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto en el caso de AI21 Labs Jamba 1.5 Mini. La cuota considera la suma combinada de las solicitudes de Converse y InvokeModel
InvokeModel Solicitudes a pedido por minuto para AI21 Labs Jamba Instruct Cada región admitida: 100 No El número máximo de veces que puede llamar a la inferencia de modelos en un minuto para AI21 Labs Jamba Instruct. La cuota considera la suma combinada de las solicitudes de Converse y InvokeModel
InvokeModel Solicitudes bajo demanda por minuto para AI21 Labs Jurassic-2 Mid Cada región admitida: 400 No El número máximo de veces que puede llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de AI21 Labs Jurassic-2 Mid InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes
InvokeModel Solicitudes bajo demanda por minuto para AI21 Labs Jurassic-2 Ultra Cada región admitida: 100 No El número máximo de veces que puede llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de AI21 Labs Jurassic-2 Ultra InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Image Generator G1 Cada región admitida: 60 No El número máximo de veces que puede llamar InvokeModel en un minuto a Amazon Titan Image Generator G1.
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Image Generator G1 V2 Cada región admitida: 60 No El número máximo de veces que puede llamar InvokeModel en un minuto a Amazon Titan Image Generator G V2.
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Multimodal Embeddings G1 Cada región admitida: 2 000 No El número máximo de veces que puede llamar InvokeModel en un minuto a Amazon Titan Multimodal Embeddings G1.
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Text Embeddings Cada región admitida: 2 000 No El número máximo de veces que puedes llamar InvokeModel en un minuto para Amazon Titan Text Embeddings
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Text Embeddings V2 Cada región admitida: 2 000 No El número máximo de veces que puedes llamar InvokeModel en un minuto para Amazon Titan Text Embeddings V2
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Text Express Cada región admitida: 400 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de Amazon Titan Text Express InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Text Lite Cada región admitida: 800 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de Amazon Titan Text Lite InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Amazon Titan Text Premier Cada región admitida: 100 No El número máximo de veces que puede llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de Amazon Titan Text Premier InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude 3 Haiku

us-east-1: 1000

us-west-2: 1000

ap-northeast-1:200

ap-southeast-1:200

Cada una de las demás regiones compatibles: 400

No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModelWithResponseStream fichas InvokeModel y fichas de Anthropic Claude 3 Haiku.
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude 3 Opus Cada región admitida: 50 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Anthropic Claude 3 Opus InvokeModel y InvokeModelWithResponseStream las solicitudes recibidas.
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude 3 Sonnet

us-east-1: 500

us-west-2: 500

Cada una de las demás regiones compatibles: 100

No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Anthropic Claude 3 Sonnet InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude 3.5 Haiku Cada región admitida: 1000 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModelWithResponseStream fichas InvokeModel y fichas de Anthropic Claude 3.5 Haiku.
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude 3.5 Sonnet

us-east-1:50

us-east-2:50

us-west-2:250

ap-northeast-2:50

ap-south-1:50

ap-southeast-2:50

Cada una de las demás regiones admitidas: 20

No El número máximo de veces que se puede realizar una inferencia de modelos en un minuto para Anthropic Claude 3.5 Sonnet. La cuota considera la suma combinada de Converse, y. ConverseStream InvokeModel InvokeModelWithResponseStream
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude 3.5 Sonnet V2

us-west-2:250

Cada una de las demás regiones admitidas: 50

No El número máximo de veces que se puede realizar una inferencia de modelos en un minuto para el Sonnet V2 de Anthropic Claude 3.5. La cuota considera la suma combinada de Converse, y. ConverseStream InvokeModel InvokeModelWithResponseStream
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude Instant

us-east-1: 1000

us-west-2: 1000

Cada una de las demás regiones compatibles: 400

No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de Anthropic Claude InvokeModel Instant y InvokeModelWithResponseStream las solicitudes de Anthropic
InvokeModel Solicitudes bajo demanda por minuto para Anthropic Claude V2

us-east-1: 500

us-west-2: 500

Cada una de las demás regiones compatibles: 100

No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Anthropic Claude InvokeModel V2 y InvokeModelWithResponseStream las solicitudes de Anthropic Claude V2
InvokeModel Solicitudes a pedido por minuto para Cohere Command Cada región admitida: 400 No El número máximo de veces que puede llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Cohere Command InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes.
InvokeModel Solicitudes a pedido por minuto para Cohere Command Light Cada región admitida: 800 No El número máximo de veces que puede llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Cohere Command Light InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Cohere Command R Cada región admitida: 400 No El número máximo de veces que puede llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada InvokeModel y InvokeModelWithResponseStream las solicitudes del Cohere Command R 128k.
InvokeModel Solicitudes bajo demanda por minuto para Cohere Command R Plus Cada región admitida: 400 No El número máximo de veces que puede llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de InvokeModel las InvokeModelWithResponseStream solicitudes de Cohere Command R Plus 128k.
InvokeModel Solicitudes bajo demanda por minuto para Cohere Embed English Cada región admitida: 2 000 No El número máximo de veces que puede llamar InvokeModel en un minuto a Cohere Embed English.
InvokeModel Solicitudes bajo demanda por minuto para Cohere Embed Multilingual Cada región admitida: 2 000 No El número máximo de veces que puede llamar InvokeModel en un minuto a Cohere Embed Multilingual.
InvokeModel Solicitudes bajo demanda por minuto para Meta Llama 2 13B Cada región admitida: 800 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Meta Llama 2 13B InvokeModel y InvokeModelWithResponseStream las solicitudes recibidas.
InvokeModel Solicitudes bajo demanda por minuto para Meta Llama 2 70B Cada región admitida: 400 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Meta Llama 2 70B InvokeModel y InvokeModelWithResponseStream las solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Meta Llama 2 Chat 13B Cada región admitida: 800 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de las InvokeModelWithResponseStream solicitudes InvokeModel y las solicitudes de Meta Llama 2 Chat 13B.
InvokeModel Solicitudes bajo demanda por minuto para Meta Llama 2 Chat 70B Cada región admitida: 400 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de Meta Llama 2 Chat 70B InvokeModel y las InvokeModelWithResponseStream solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Meta Llama 3 70B Instruct Cada región admitida: 400 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de Meta Llama 3 70B Instruct InvokeModel y las InvokeModelWithResponseStream solicitudes correspondientes.
InvokeModel Solicitudes bajo demanda por minuto para Meta Llama 3 8B Instruct Cada región admitida: 800 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de Meta Llama 3 8B Instruct InvokeModel y las InvokeModelWithResponseStream solicitudes correspondientes.
InvokeModel Solicitudes a pedido por minuto para Mistral 7B Instruct Cada región admitida: 800 No El número máximo de veces que puedes llamar InvokeModel en un minuto a Mistral mistral-7 0 b-instruct-v
InvokeModel Solicitudes bajo demanda por minuto para Mistral AI Mistral Small Cada región admitida: 400 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto para Mistral AI Mistral Small
InvokeModel Solicitudes bajo demanda por minuto para Mistral Large Cada región admitida: 400 No El número máximo de veces que puedes llamar InvokeModel y InvokeModelWithResponseStream en un minuto para Mistral mistral-large-2402-v1
Solicitudes bajo demanda por minuto InvokeModel para Mistral Mixtral 8x7b Instruct Cada región admitida: 400 No El número máximo de veces que puedes llamar en un minuto a Mistral mixtral-8x7b-v0 InvokeModel
Solicitudes bajo demanda por minuto para Stability.ai Stable Diffusion 3 Large InvokeModel Cada región admitida: 15 No El número máximo de veces que puede llamar InvokeModel en un minuto a Stability.ai Stable Diffusion 3 Large.
InvokeModel Solicitudes bajo demanda por minuto para Stability.ai Stable Diffusion 3 Medium Cada región admitida: 60 No El número máximo de veces que puede llamar InvokeModel en un minuto a Stability.ai Stable Diffusion 3 Medium
InvokeModel Solicitudes bajo demanda por minuto para Stability.ai Stable Diffusion XL 0.8 Cada región admitida: 60 No El número máximo de veces que puede llamar InvokeModel en un minuto a Stability.ai Stable Diffusion XL 0.8
InvokeModel Solicitudes bajo demanda por minuto para Stability.ai Stable Diffusion XL 1.0 Cada región admitida: 60 No El número máximo de veces que puede llamar InvokeModel en un minuto para Stability.ai Stable Diffusion XL 1.0
InvokeModel Solicitudes bajo demanda por minuto para Stability.ai Stable Image Core Cada región admitida: 90 No El número máximo de veces que puede llamar InvokeModel en un minuto a Stability.ai Stable Image Core.
InvokeModel Solicitudes bajo demanda por minuto para Stability.ai Stable Image Ultra Cada región admitida: 10 No El número máximo de veces que puede llamar InvokeModel en un minuto a Stability.ai Stable Image Ultra.
InvokeModel Tokens bajo demanda por minuto para AI21 Labs Jamba 1.5 Large Cada región admitida: 300 000 No El número máximo de fichas que puede enviar para la inferencia del modelo en un minuto en el caso de AI21 Labs Jamba 1.5 Large. La cuota tiene en cuenta la suma combinada de los tokens de Converse y. InvokeModel
InvokeModel Tokens a pedido por minuto para AI21 Labs Jamba 1.5 Mini Cada región admitida: 300 000 No El número máximo de fichas que puedes enviar para la inferencia del modelo en un minuto en el caso de AI21 Labs Jamba 1.5 Mini. La cuota tiene en cuenta la suma combinada de los tokens de Converse y. InvokeModel
InvokeModel Tokens a pedido por minuto para AI21 Labs Jamba Instruct Cada región admitida: 300 000 No El número máximo de fichas que puede enviar para la inferencia del modelo en un minuto para AI21 Labs Jamba Instruct. La cuota tiene en cuenta la suma combinada de los tokens de Converse y InvokeModel
InvokeModel Tokens a pedido por minuto para AI21 Labs Jurassic-2 Mid Cada región admitida: 300 000 No El número máximo de fichas que puedes entregar InvokeModel en un minuto a AI21 Labs Jurassic-2 Mid.
InvokeModel Fichas por minuto bajo demanda para AI21 Labs Jurassic-2 Ultra Cada región admitida: 300 000 No El número máximo de fichas que puedes entregar InvokeModel en un minuto para AI21 Labs Jurassic-2 Ultra.
InvokeModel Tokens a pedido por minuto para Amazon Titan Image Generator G1 Cada región admitida: 2 000 No El número máximo de fichas que puede proporcionar InvokeModel en un minuto para Amazon Titan Image Generator G1.
InvokeModel Tokens a pedido por minuto para Amazon Titan Image Generator G1 V2 Cada región admitida: 2 000 No El número máximo de fichas que puede proporcionar InvokeModel en un minuto para Amazon Titan Image Generator G1 V2.
InvokeModel Tokens a pedido por minuto para Amazon Titan Multimodal Embeddings G1 Cada región admitida: 300 000 No El número máximo de fichas que puede proporcionar InvokeModel en un minuto para Amazon Titan Multimodal Embeddings G1.
InvokeModel Tokens a pedido por minuto para Amazon Titan Text Embeddings Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar InvokeModel en un minuto para Amazon Titan Text Embeddings.
InvokeModel Tokens a pedido por minuto para Amazon Titan Text Embeddings V2 Cada región admitida: 300 000 No El número máximo de fichas que puede proporcionar InvokeModel en un minuto para Amazon Titan Text Embeddings V2.
InvokeModel Tokens a pedido por minuto para Amazon Titan Text Express Cada región admitida: 300 000 No La cantidad máxima de fichas que puede proporcionar en un minuto InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Amazon Titan Text Express.
InvokeModel Tokens a pedido por minuto para Amazon Titan Text Lite Cada región admitida: 300 000 No La cantidad máxima de fichas que puede proporcionar en un minuto InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Amazon Titan Text Lite.
InvokeModel Tokens a pedido por minuto para Amazon Titan Text Premier Cada región admitida: 300 000 No La cantidad máxima de fichas que puede proporcionar durante un minuto InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Amazon Titan Text Premier.
InvokeModel Tokens por minuto bajo demanda para Anthropic Claude 3 Haiku

us-east-1:2 000 000

us-west-2:2 000 000

ap-northeast-1:200.000

ap-southeast-1:200.000

Cada una de las demás regiones compatibles: 300 000

No El número máximo de fichas que podéis aportar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModelWithResponseStream fichas InvokeModel y fichas de Anthropic Claude 3 Haiku.
InvokeModel Tokens a pedido por minuto para Anthropic Claude 3 Opus Cada región admitida: 400 000 No El número máximo de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Anthropic Claude 3 Opus.
InvokeModel Tokens a pedido por minuto para Anthropic Claude 3 Sonnet

us-east-1:1.000.000

us-west-2:1 000 000

Cada una de las demás regiones compatibles: 200 000

No El número máximo de fichas que podéis aportar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Anthropic Claude 3 Sonnet.
InvokeModel Tokens a pedido por minuto para Anthropic Claude 3.5 Haiku Cada región compatible: 2 000 000 No La cantidad máxima de fichas que puedes proporcionar en un minuto InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Anthropic Claude 3.5 Haiku.
Símbolos InvokeModel a pedido por minuto para Anthropic Claude 3.5 Sonnet

us-east-1:400.000

us-east-2:400.000

us-west-2:2 000 000

ap-northeast-2:400.000

ap-south-1:400.000

ap-southeast-2:400.000

Cada una de las demás regiones apoyadas: 200 000

No El número máximo de fichas que puedes enviar para la inferencia del modelo en un minuto para Anthropic Claude 3.5 Sonnet. La cuota considera la suma combinada de Converse, y. ConverseStream InvokeModel InvokeModelWithResponseStream
InvokeModel Tokens a pedido por minuto para Anthropic Claude 3.5 Sonnet V2

us-west-2:2 000 000

Cada una de las demás regiones compatibles: 400 000

No El número máximo de fichas que puedes enviar para la inferencia del modelo en un minuto para el Anthropic Claude 3.5 Sonnet V2. La cuota considera la suma combinada de Converse, y. ConverseStream InvokeModel InvokeModelWithResponseStream
InvokeModel Tokens a pedido por minuto para Anthropic Claude Instant

us-east-1:1.000.000

us-west-2:1 000 000

Cada una de las demás regiones compatibles: 300 000

No El número máximo de fichas que podéis aportar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Anthropic Claude Instant.
InvokeModel Tokens a pedido por minuto para Anthropic Claude V2

us-east-1: 500 000

us-west-2: 500 000

Cada una de las demás regiones compatibles: 200 000

No El número máximo de fichas que podéis aportar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Anthropic Claude V2.
InvokeModel Tokens a pedido por minuto para Cohere Command Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Cohere Command.
InvokeModel Tokens por minuto bajo demanda para Cohere Command Light Cada región admitida: 300 000 No El número máximo de fichas que puedes entregar InvokeModel en un minuto a Cohere Command Light.
InvokeModel Tokens a pedido por minuto para Cohere Command R Cada región admitida: 300 000 No El número máximo de fichas que puede proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens del Cohere Command R 128k.
InvokeModel Tokens a pedido por minuto para Cohere Command R Plus Cada región admitida: 300 000 No El número máximo de fichas que puede proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota considera la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens del Cohere Command R Plus 128k.
InvokeModel Tokens por minuto bajo demanda para Cohere Embed English Cada región admitida: 300 000 No El número máximo de fichas que puede proporcionar InvokeModel en un minuto para Cohere Embed English.
InvokeModel Tokens a pedido por minuto para Cohere Embed Multilingual Cada región admitida: 300 000 No El número máximo de fichas que puede proporcionar InvokeModel en un minuto a Cohere Embed Multilingual.
InvokeModel Tokens a pedido por minuto para Meta Llama 2 13B Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Meta Llama 2 13B.
InvokeModel Tokens a pedido por minuto para Meta Llama 2 70B Cada región admitida: 300 000 No La cantidad máxima de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Meta Llama 2 70B.
InvokeModel Tokens a pedido por minuto para Meta Llama 2 Chat 13B Cada región admitida: 300 000 No La cantidad máxima de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Meta Llama 2 Chat 13B.
InvokeModel Tokens a pedido por minuto para Meta Llama 2 Chat 70B Cada región admitida: 300 000 No La cantidad máxima de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Meta Llama 2 Chat 70B.
InvokeModel Tokens a pedido por minuto para Meta Llama 3 70B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puedes entregar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel los InvokeModelWithResponseStream tokens de Meta Llama 3 70B Instruct.
InvokeModel Tokens a pedido por minuto para Meta Llama 3 8B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de InvokeModel las InvokeModelWithResponseStream fichas de Meta Llama 3 8B Instruct.
InvokeModel Tokens por minuto bajo demanda para Mistral AI Mistral 7B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar durante y en un minuto. InvokeModel InvokeModelWithResponseStream La cuota tiene en cuenta la suma combinada de los InvokeModel InvokeModelWithResponseStream tokens del Mistral AI Mistral 7B Instruct.
InvokeModel Fichas bajo demanda por minuto para Mistral AI Mistral Large Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de las InvokeModelWithResponseStream fichas InvokeModel de Mistral AI Mistral Large.
InvokeModel Fichas bajo demanda por minuto para Mistral AI Mistral Small Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar durante InvokeModel y InvokeModelWithResponseStream en un minuto. La cuota tiene en cuenta la suma combinada de las InvokeModelWithResponseStream fichas InvokeModel de Mistral AI Mistral Small.
InvokeModel Tokens por minuto bajo demanda para Mistral AI Mixtral 8X7BB Instruct Cada región admitida: 300 000 No El número máximo de fichas que puedes proporcionar durante y en un minuto. InvokeModel InvokeModelWithResponseStream La cuota tiene en cuenta la suma combinada de las InvokeModelWithResponseStream fichas de InvokeModel Mistral b-instruct-v mixtral-8x7 0.
Solicitudes de inferencia de modelos bajo demanda por minuto para Meta Llama 3.1 405B Instruct Cada región admitida: 200 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para Meta Llama 3.1 405B Instruct. La cuota considera la suma combinada de las solicitudes de InvokeModel, InvokeModelWithResponseStream, Converse y. ConverseStream
Solicitudes de inferencia de modelos a pedido por minuto para Meta Llama 3.1 70B Instruct Cada región admitida: 400 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para Meta Llama 3.1 70B Instruct. La cuota considera la suma combinada de las solicitudes de InvokeModel, InvokeModelWithResponseStream, Converse y. ConverseStream
Solicitudes de inferencia de modelos a pedido por minuto para Meta Llama 3.1 8B Instruct Cada región admitida: 800 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para Meta Llama 3.1 8B Instruct. La cuota considera la suma combinada de las solicitudes de InvokeModel, InvokeModelWithResponseStream, Converse y. ConverseStream
Solicitudes de inferencia de modelos a pedido por minuto para Meta Llama 3.2 11B Instruct Cada región admitida: 400 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para Meta Llama 3.2 11B Instruct. La cuota considera la suma combinada de las solicitudes de InvokeModel, InvokeModelWithResponseStream, Converse y. ConverseStream
Solicitudes de inferencia de modelos a pedido por minuto para Meta Llama 3.2 1B Instruct Cada región admitida: 800 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para Meta Llama 3.2 1B Instruct. La cuota considera la suma combinada de las solicitudes de InvokeModel, InvokeModelWithResponseStream, Converse y. ConverseStream
Solicitudes de inferencia de modelos a pedido por minuto para Meta Llama 3.2 3B Instruct Cada región admitida: 800 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para Meta Llama 3.2 3B Instruct. La cuota considera la suma combinada de las solicitudes de InvokeModel, InvokeModelWithResponseStream, Converse y. ConverseStream
Solicitudes de inferencia de modelos a pedido por minuto para Meta Llama 3.2 90B Instruct Cada región admitida: 400 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para Meta Llama 3.2 90B Instruct. La cuota considera la suma combinada de las solicitudes de InvokeModel, InvokeModelWithResponseStream, Converse y. ConverseStream
Solicitudes de inferencia de modelos a pedido por minuto para Mistral Large 2407 Cada región admitida: 400 No El número máximo de veces que puede realizar una llamada a la inferencia de modelos en un minuto para el Mistral Large 2407. La cuota considera la suma combinada de las solicitudes de InvokeModel, Converse y InvokeModelWithResponseStream ConverseStream
Símbolos de inferencia de modelos a pedido por minuto para Meta Llama 3.1 8B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puede enviar para la inferencia de modelos en un minuto para Meta Llama 3.1 8B Instruct. La cuota tiene en cuenta la suma combinada de los tokens de InvokeModel InvokeModelWithResponseStream, Converse y. ConverseStream
Símbolos de inferencia de modelos bajo demanda por minuto para Meta Llama 3.2 11B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puedes enviar para la inferencia de modelos en un minuto para Meta Llama 3.2 11B Instruct. La cuota tiene en cuenta la suma combinada de los tokens de InvokeModel InvokeModelWithResponseStream, Converse y. ConverseStream
Símbolos de inferencia de modelos bajo demanda por minuto para Meta Llama 3.2 1B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puede enviar para la inferencia de modelos en un minuto para Meta Llama 3.2 1B Instruct. La cuota tiene en cuenta la suma combinada de fichas de InvokeModel InvokeModelWithResponseStream, Converse y. ConverseStream
Símbolos de inferencia de modelos bajo demanda por minuto para Meta Llama 3.2 3B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puedes enviar para la inferencia de modelos en un minuto para Meta Llama 3.2 3B Instruct. La cuota tiene en cuenta la suma combinada de fichas de InvokeModel InvokeModelWithResponseStream, Converse y. ConverseStream
Símbolos de inferencia de modelos bajo demanda por minuto para Meta Llama 3.2 90B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puedes enviar para la inferencia de modelos en un minuto para Meta Llama 3.2 90B Instruct. La cuota tiene en cuenta la suma combinada de los tokens de InvokeModel InvokeModelWithResponseStream, Converse y. ConverseStream
Símbolos de inferencia del modelo a pedido por minuto para Mistral Large 2407 Cada región admitida: 300 000 No El número máximo de fichas que puede enviar para la inferencia del modelo en un minuto para el Mistral Large 2407. La cuota tiene en cuenta la suma combinada de los tokens de InvokeModel, Converse y InvokeModelWithResponseStream ConverseStream
Símbolos de inferencia del modelo a pedido por minuto para Meta Llama 3.1 405B Instruct Cada región admitida: 400 000 No El número máximo de fichas que puedes enviar para la inferencia del modelo en un minuto para Meta Llama 3.1 405B Instruct. La cuota tiene en cuenta la suma combinada de fichas de InvokeModel InvokeModelWithResponseStream, Converse y. ConverseStream
Símbolos de inferencia de modelos bajo demanda por minuto para Meta Llama 3.1 70B Instruct Cada región admitida: 300 000 No El número máximo de fichas que puede enviar para la inferencia del modelo en un minuto para Meta Llama 3.1 70B Instruct. La cuota tiene en cuenta la suma combinada de los tokens de InvokeModel InvokeModelWithResponseStream, Converse y. ConverseStream
Nodos de salida por flujo Cada región admitida: 10 No El número máximo de nodos de salida de flujo.
Parámetros por función Cada región admitida: 5 El número máximo de parámetros que puede tener una función de grupo de acciones.
PrepareAgent solicitudes por segundo Cada región admitida: 2 No El número máximo de PrepareAgent API solicitudes por segundo.
PrepareFlow solicitudes por segundo Cada región admitida: 2 No El número máximo de PrepareFlow solicitudes por segundo.
Solicita nodos por flujo Cada región admitida: 10 El número máximo de nodos de solicitud.
Solicitudes por cuenta Cada región admitida: 50 El número máximo de solicitudes.
Registros por trabajo de inferencia por lote Cada región admitida: 50.000 El número máximo de registros en todos los archivos de entrada de un trabajo de inferencia por lotes.
Registros por archivo de entrada por trabajo de inferencia por lotes Cada región admitida: 50.000 El número máximo de registros en un archivo de entrada en un trabajo de inferencia por lotes.
Entidades de expresiones regulares en el filtro de información confidencial Cada región admitida: 10 No El número máximo de expresiones regulares del filtro de barandillas que se pueden incluir en una política de palabras
Longitud de las expresiones regulares en caracteres Cada región admitida: 500 No La longitud máxima, en caracteres, de una expresión regular de un filtro de barandilla
Recupera las solicitudes por segundo Cada región admitida: 5 No El número máximo de API solicitudes de recuperación por segundo.
RetrieveAndGenerate solicitudes por segundo Cada región admitida: 5 No El número máximo de RetrieveAndGenerate API solicitudes por segundo.
Nodos de recuperación de S3 por flujo Cada región admitida: 10 No El número máximo de nodos de recuperación de S3.
Nodos de almacenamiento S3 por flujo Cada región admitida: 10 No La cantidad máxima de nodos de almacenamiento de S3.
Trabajos de personalización programados Cada región admitida: 2 No El número máximo de trabajos de personalización programados.
Tamaño de la solicitud Cada región admitida: 4 No El tamaño máximo (en KB) de una solicitud individual es un conjunto de datos de solicitudes personalizado.
StartIngestionJob solicitudes por segundo Cada región compatible: 0,1 No El número máximo de StartIngestionJob API solicitudes por segundo.
Suma de los trabajos de inferencia de lotes en curso y enviados utilizando un modelo base

eu-south-1:10

Cada una de las demás regiones admitidas: 20

El número máximo de trabajos de inferencia de lotes en curso y enviados utilizando un modelo base.
Suma de los trabajos de inferencia de lotes en curso y enviados utilizando un modelo personalizado Cada región admitida: 3 El número máximo de trabajos de inferencia de lotes en curso y enviados que utilizan un modelo personalizado
Suma de los registros de formación y validación de un trabajo de ajuste preciso del Haiku v1 de Claude 3 Cada región admitida: 10 000 El número máximo combinado de registros de formación y validación permitido para un trabajo de ajuste de precisión del Claude 3 Haiku.
Suma de los registros de formación y validación de un trabajo de ajuste preciso de Meta Llama 2 13B v1 Cada región admitida: 10 000 El número máximo combinado de registros de entrenamiento y validación permitido para un trabajo de ajuste fino de Meta Llama 2 13B.
Suma de los registros de entrenamiento y validación de un trabajo de ajuste preciso de Meta Llama 2 70B v1 Cada región admitida: 10 000 El número máximo combinado de registros de entrenamiento y validación permitido para un trabajo de ajuste fino de Meta Llama 2 70B.
Suma de los registros de entrenamiento y validación de un trabajo de ajuste preciso de Meta Llama 3.1 70B Instruct v1 Cada región admitida: 10 000 El número máximo combinado de registros de entrenamiento y validación permitido para un trabajo de ajuste preciso del Meta Llama 3.1 70B Instruct.
Suma de los registros de entrenamiento y validación de un trabajo de ajuste preciso de Meta Llama 3.1 8B Instruct v1 Cada región admitida: 10 000 El número máximo combinado de registros de entrenamiento y validación permitido para un trabajo de ajuste preciso del Meta Llama 3.1 8B Instruct.
Suma de los registros de entrenamiento y validación de un trabajo de ajuste preciso de Meta Llama 3.2 1B Instruct v1 Cada región admitida: 10 000 El número máximo combinado de registros de entrenamiento y validación permitido para un trabajo de ajuste preciso del Meta Llama 3.2 1B Instruct.
Suma de los registros de entrenamiento y validación de un trabajo de ajuste preciso de Meta Llama 3.2 3B Instruct v1 Cada región admitida: 10 000 El número máximo combinado de registros de entrenamiento y validación permitido para un trabajo de ajuste preciso del Meta Llama 3.2 3B Instruct.
Suma de los registros de formación y validación correspondientes a un trabajo de ajuste preciso del Titan Image Generator G1 V1 Cada región admitida: 10 000 El número máximo combinado de registros de formación y validación permitido para un trabajo de ajuste preciso de Titan Image Generator.
Suma de los registros de formación y validación de un trabajo de ajuste preciso del Titan Image Generator G1 V2 Cada región admitida: 10 000 El número máximo combinado de registros de formación y validación permitido para un trabajo de ajuste preciso de Titan Image Generator V2.
Suma de los registros de formación y validación de un trabajo de ajuste preciso de Titan Multimodal Embeddings G1 v1 Cada región admitida: 50.000 El número máximo combinado de registros de formación y validación permitido para un trabajo de ajuste fino de Titan Multimodal Embeddings.
Suma de los registros de formación y validación de un trabajo de preformación continua en Titan Text G1 - Express v1 Cada región admitida: 100 000 El número máximo combinado de registros de formación y validación permitidos para un trabajo de preformación continua en Titan Text Express.
Suma de los registros de formación y validación de un trabajo de ajuste preciso de Titan Text G1 - Express v1 Cada región admitida: 10 000 El número máximo combinado de registros de formación y validación permitido para un trabajo de ajuste fino de Titan Text Express.
Suma de los registros de formación y validación de un trabajo de preformación continua en Titan Text G1 - Lite v1 Cada región admitida: 100 000 El número máximo combinado de registros de formación y validación permitidos para un trabajo de preformación continua en Titan Text Lite.
Suma de los registros de formación y validación de un trabajo de ajuste preciso de Titan Text G1 - Lite v1 Cada región admitida: 10 000 El número máximo combinado de registros de formación y validación permitido para un trabajo de ajuste fino de Titan Text Lite.
Suma de los registros de formación y validación de un trabajo de ajuste preciso de la Titan Text G1 - Premier v1 Cada región admitida: 20 000 El número máximo combinado de registros de formación y validación permitido para un trabajo de ajuste fino de Titan Text Premier.
Tiempo de trabajo para los trabajadores Cada región admitida: 30 No El tiempo máximo (en días) del que puede disponer un trabajador para completar las tareas.
Temas por barandilla Cada región admitida: 30 No El número máximo de temas que se pueden definir en las políticas temáticas de Guardrail
Número total de nodos por flujo Cada región admitida: 40 No El número máximo de nodos de un flujo.
UpdateAgent solicitudes por segundo Cada región admitida: 4 No El número máximo de UpdateAgent API solicitudes por segundo.
UpdateAgentActionGroup solicitudes por segundo Cada región admitida: 6 No El número máximo de UpdateAgentActionGroup API solicitudes por segundo
UpdateAgentAlias solicitudes por segundo Cada región admitida: 2 No El número máximo de UpdateAgentAlias API solicitudes por segundo.
UpdateAgentKnowledgeBase solicitudes por segundo Cada región admitida: 4 No El número máximo de UpdateAgentKnowledgeBase API solicitudes por segundo.
UpdateDataSource solicitudes por segundo Cada región admitida: 2 No El número máximo de UpdateDataSource API solicitudes por segundo.
UpdateFlow solicitudes por segundo Cada región admitida: 2 No El número máximo de UpdateFlow solicitudes por segundo.
UpdateFlowAlias solicitudes por segundo Cada región admitida: 2 No El número máximo de UpdateFlowAlias solicitudes por segundo.
UpdateKnowledgeBase solicitudes por segundo Cada región admitida: 2 No El número máximo de UpdateKnowledgeBase API solicitudes por segundo.
UpdatePrompt solicitudes por segundo Cada región admitida: 2 No El número máximo de UpdatePrompt solicitudes por segundo.
Tamaño de la consulta del usuario Cada región admitida: 1000 No El tamaño máximo (en caracteres) de una consulta de usuario.
ValidateFlowDefinition solicitudes por segundo Cada región admitida: 2 No El número máximo de ValidateFlowDefinition solicitudes por segundo.
Versiones por barandilla Cada región admitida: 20 No El número máximo de versiones que puede tener una barandilla
Versiones por mensaje Cada región admitida: 10 No El número máximo de versiones por mensaje.
Longitud de la palabra en caracteres Cada región admitida: 100 No Longitud máxima de una palabra, en caracteres, de una lista de palabras bloqueadas
Política de palabras por palabra Cada región admitida: 10 000 No El número máximo de palabras que se pueden incluir en una lista de palabras bloqueadas