Modelos de base disponíveis - Amazon SageMaker

Modelos de base disponíveis

O Amazon SageMaker JumpStart oferece modelos de base de última geração, integrados, disponíveis ao público e proprietários para personalizar e integrar aos seus fluxos de trabalho de IA generativa.

Modelos de fundação disponíveis ao público

O Amazon SageMaker JumpStart integra e mantém modelos de base de código aberto de fontes terceirizadas. Para começar a usar um desses modelos disponíveis ao público, consulte Uso de modelos de base do JumpStart ou explore um dos modelos disponíveis Cadernos de exemplo. Em um determinado exemplo de caderno de um modelo disponível ao público, tente trocar o ID do modelo para experimentar modelos diferentes dentro da mesma família de modelos.

Para obter mais informações sobre IDs de modelo e recursos para a implantação de modelos de base do JumpStart disponíveis ao público com o SageMaker Python SDK, consulte Usar modelos de base com o SageMaker Python SDK.

Por definição, os modelos de base são adaptáveis a muitas tarefas posteriores. Os modelos de base são treinados em grandes quantidades de dados gerais de domínio e o mesmo modelo pode ser implementado ou personalizado para vários casos de uso. Ao escolher seu modelo de base, comece definindo uma tarefa específica, por exemplo, geração de texto ou geração de imagem.

Modelos de previsão de séries temporais disponíveis ao público

Os modelos de predição de séries temporais são projetados para analisar e fazer predições em dados sequenciais ao longo do tempo. Esses modelos podem ser aplicados a vários domínios, como finanças, previsão do tempo ou previsão de demanda de energia. Os modelos Chronos são personalizados para tarefas de predição de séries temporais, possibilitando predições exatas com base em padrões de dados históricos.

Nome do modelo ID do modelo Fonte do modelo Ajuste

Chronos T5 Small

autogluon-forecasting-chronos-t5-small

Amazon

Não

Chronos T5 Base

autogluon-forecasting-chronos-t5-base

Amazon

Não

Chronos T5 Large

autogluon-forecasting-chronos-t5-large

Amazon

Não

Modelos de geração de texto disponíveis ao público

Os modelos de base de geração de texto podem ser usados para uma variedade de tarefas posteriores, incluindo resumo de texto, classificação de texto, resposta a perguntas, geração de conteúdo de formato longo, redação curta, extração de informações e muito mais.

Nome do modelo ID do modelo Fonte do modelo Ajuste

Alexa TM 20B

pytorch-textgeneration1-alexa20b

Amazon

Não

Bloom 1b1

huggingface-textgeneration-bloom-1b1

Hugging Face

Não

Bloom 1b7

huggingface-textgeneration-bloom-1b7

Hugging Face

Não

Bloom 3B

huggingface-textgeneration1-bloom-3b

Hugging Face

Sim

Bloom 560m

huggingface-textgeneration-bloom-560m

Hugging Face

Não

Bloom 7B1

huggingface-textgeneration1-bloom-7b1

Hugging Face

Sim

Bloomz 1b1

huggingface-textgeneration-bloomz-1b1

Hugging Face

Não

Bloomz 1b7

huggingface-textgeneration-bloomz-1b7

Hugging Face

Não

BloomZ 3B FP16

huggingface-textgeneration1-bloom-3b-fp16

Hugging Face

Sim

Bloomz 560m

huggingface-textgeneration-bloomz-560m

Hugging Face

Não

BloomZ 7B1 FP16

huggingface-textgeneration1-bloomz-7b1-fp16

Hugging Face

Sim

Code Llama 13B

meta-textgeneration-llama-codellama-13b

Meta

Sim

Code Llama 13B Instruct

meta-textgeneration-llama-codellama-13b-instruct

Meta

Não

Code Llama 13B Python

meta-textgeneration-llama-codellama-13b-python

Meta

Sim

Code Llama 34B

meta-textgeneration-llama-codellama-34b

Meta

Sim

Code Llama 34B Instruct

meta-textgeneration-llama-codellama-34b-instruct

Meta

Não

Code Llama 34B Python

meta-textgeneration-llama-codellama-34b-python

Meta

Sim

Code Llama 70B

meta-textgeneration-llama-codellama-70b

Meta

Sim

Code Llama 70B Instruct

meta-textgeneration-llama-codellama-70b-instruct

Meta

Não

Code Llama 70B Python

meta-textgeneration-llama-codellama-70b-python

Meta

Sim

Code Llama 7B

meta-textgeneration-llama-codellama-7b

Meta

Sim

Code Llama 7B Instruct

meta-textgeneration-llama-codellama-7b-instruct

Meta

Não

Code Llama 7B Python

meta-textgeneration-llama-codellama-7b-python

Meta

Sim

CyberAgentLM2-7B-Chat (CALM2-7B-Chat)

huggingface-llm-calm2-7b-chat-bf16

Hugging Face

Sim

DistilGPT2

huggingface-textgeneration-distilgpt2

Hugging Face

Não

Dolly V2 12b BF16

huggingface-textgeneration-dolly-v2-12b-bf16

Hugging Face

Não

Dolly V2 3b BF16

huggingface-textgeneration-dolly-v2-3b-bf16

Hugging Face

Não

Dolly V2 7b BF16

huggingface-textgeneration-dolly-v2-7b-bf16

Hugging Face

Não

Dolphin 2.2.1 Mistral 7B

huggingface-llm-dolphin-2-2-1-mistral-7b

Hugging Face

Não

Dolphin 2.5 Mixtral 8 7B

huggingface-llm-dolphin-2-5-mixtral-8x7b

Hugging Face

Não

Dolphin 2.7 Mixtral 8 7B

huggingface-llm-dolphin-2-7-mixtral-8x7b

Hugging Face

Não

EleutherAI GPT Neo 2.7B

huggingface-llm-eleutherai-gpt-neo-1-3b

Hugging Face

Não

EleutherAI GPT Neo 2.7B

huggingface-llm-eleutherai-gpt-neo-2-7b

Hugging Face

Não

Falcon 180B BF16

huggingface-llm-falcon-180b-bf16

Hugging Face

Não

Falcon 180B Chat BF16

huggingface-llm-falcon-180b-chat-bf16

Hugging Face

Não

Falcon 40B BF16

huggingface-llm-falcon-40b-bf16

Hugging Face

Sim

Falcon 40B Instruct BF16

huggingface-llm-falcon-40b-instruct-bf16

Hugging Face

Sim

Falcon 7B BF16

huggingface-llm-falcon-7b-bf16

Hugging Face

Sim

Falcon 7B Instruct BF16

huggingface-llm-falcon-7b-instruct-bf16

Hugging Face

Sim

Falcon Lite

huggingface-llm-amazon-falconlite

Hugging Face

Não

Falcon Lite 2

huggingface-llm-amazon-falconlite2

Hugging Face

Não

Falcon RW 1B

huggingface-llm-tiiuae-falcon-rw-1b

Hugging Face

Não

Flan-T5 Base

huggingface-text2text-flan-t5-base

Hugging Face

Sim

Modelo de base Flan-T5 ajustado no conjunto de dados Samsum

huggingface-text2text-flan-t5-base-samsum

Hugging Face

Não

Flan-T5 Large

huggingface-text2text-flan-t5-large

Hugging Face

Sim

Flan-T5 Small

huggingface-text2text-flan-t5-small

Hugging Face

Sim

Flan-T5 XL

huggingface-text2text-flan-t5-xl

Hugging Face

Sim

Flan-T5 XXL

huggingface-text2text-flan-t5-xxl

Hugging Face

Sim

Flan-UL2 BF16

huggingface-text2text-flan-ul2-bf16

Hugging Face

Não

Gemma 2B

huggingface-llm-gemma-2b

Hugging Face

Sim

Gemma 2B Instruct

huggingface-llm-gemma-2b-instruct

Hugging Face

Sim

Gemma 7B

huggingface-llm-gemma-7b

Hugging Face

Sim

Gemma 7B Instruct

huggingface-llm-gemma-7b-instruct

Hugging Face

Sim

GPT 2

huggingface-textgeneration-gpt2

Hugging Face

Não

GPT NeoX 20B FP16

huggingface-textgeneration2-gpt-neox-20b-fp16

Hugging Face

Não

GPT NeoXT Chat Base 20B FP16

huggingface-textgeneration2-gpt-neoxt-chat-base-20b-fp16

Hugging Face

Não

GPT-2 XL

huggingface-textgeneration1-gpt-2-xl

Hugging Face

Sim

GPT-J 6B

huggingface-textgeneration1-gpt-j-6b

Hugging Face

Sim

GPT-Neo 1.3B

huggingface-textgeneration1-gpt-neo-1-3b

Hugging Face

Sim

GPT-Neo 125M

huggingface-textgeneration1-gpt-neo-125m

Hugging Face

Sim

GPT-NEO 2.7B

huggingface-textgeneration1-gpt-neo-2-7b

Hugging Face

Sim

Japanese StableLM Instruct Alpha 7B v2

model-textgenerationjp-japanese-stablelm-instruct-alpha-7b-v2

Hugging Face

Não

LightGPT Instruct 6B

huggingface-textgeneration1-lightgpt

Hugging Face

Sim

Lite Llama 460M 1T

huggingface-llm-ahxt-litellama-460m-1t

Hugging Face

Não

Llama 2 13B

meta-textgeneration-llama-2-13b

Meta

Sim

Llama 2 13B Chat

meta-textgeneration-llama-2-13b-f

Meta

Sim

Llama 2 13B Chat Neuron

meta-textgenerationneuron-llama-2-13b-f

Meta

Não

Llama 2 13B Neuron

meta-textgenerationneuron-llama-2-13b

Meta

Sim

Llama 2 70B

meta-textgeneration-llama-2-70b

Meta

Sim

Llama 2 70B Chat

meta-textgeneration-llama-2-70b-f

Meta

Sim

Llama 2 70B Chat Neuron

meta-textgenerationneuron-llama-2-70b-f

Meta

Não

Llama 2 70B Neuron

meta-textgenerationneuron-llama-2-70b

Meta

Não

Llama 2 7B

meta-textgeneration-llama-2-7b

Meta

Sim

Llama 2 7B Chat

meta-textgeneration-llama-2-7b-f

Meta

Sim

Llama 2 7B Chat Neuron

meta-textgenerationneuron-llama-2-7b-f

Meta

Não

Llama 2 7B Neuron

meta-textgenerationneuron-llama-2-7b

Meta

Sim

Llama 3 8B

meta-textgeneration-llama-3-8b

Meta

Sim

Llama 3 8B Instruct

meta-textgeneration-llama-3-8b-instruct

Meta

Sim

Llama 3 70B

meta-textgeneration-llama-3-70b

Meta

Sim

Llama 3 70B Instruct

meta-textgeneration-llama-3-70b-instruct

Meta

Sim

Llama Guard 7B

meta-textgeneration-llama-guard-7b

Meta

Não

Mistral 7B

huggingface-llm-mistral-7b

Hugging Face

Sim

Mistral 7B Instruct

huggingface-llm-mistral-7b-instruct

Hugging Face

Não

Mistral 7B OpenOrca AWQ

huggingface-llm-thebloke-mistral-7b-openorca-awq

Hugging Face

Não

Mistral 7B SFT Alpha

huggingface-llm-huggingfaceh4-mistral-7b-sft-alpha

Hugging Face

Não

Mistral 7B SFT Beta

huggingface-llm-huggingfaceh4-mistral-7b-sft-beta

Hugging Face

Não

Mistral Lite

huggingface-llm-amazon-mistrallite

Hugging Face

Não

Mistral Trix V1

huggingface-llm-cultrix-mistraltrix-v1

Hugging Face

Não

Mixtral 8x7B

huggingface-llm-mixtral-8x7b

Hugging Face

Sim

Mixtral 8x7B Instruct

huggingface-llm-mixtral-8x7b-instruct

Hugging Face

Sim

MPT 7B BF16

huggingface-textgeneration1-mpt-7b-bf16

Hugging Face

Não

MPT 7B Instruct BF16

huggingface-textgeneration1-mpt-7b-instruct-bf16

Hugging Face

Não

MPT 7B StoryWriter-65k+ BF16

huggingface-textgeneration1-mpt-7b-storywriter-bf16

Hugging Face

Não

Multilingual GPT

huggingface-llm-ai-forever-mgpt

Hugging Face

Não

Nous Hermes 2 SOLAR 10.7B

huggingface-llm-nousresearch-nous-hermes-2-solar-10-7b

Hugging Face

Não

Nous Hermes Llama 2 13B

huggingface-llm-nousresearch-nous-hermes-llama2-13b

Hugging Face

Não

Nous Hermes Llama 2 7B

huggingface-llm-nousresearch-nous-hermes-llama-2-7b

Hugging Face

Não

Open Hermes 2 Mistral 7B

huggingface-llm-teknium-openhermes-2-mistral-7b

Hugging Face

Não

Open LlaMa

huggingface-textgeneration-open-llama

Hugging Face

Não

Open Llama 7B V2

huggingface-llm-openlm-research-open-llama-7b-v2

Hugging Face

Não

Platypus 2 7B

huggingface-llm-garage-baind-platypus2-7b

Hugging Face

Não

Pythia 160m Deduped

huggingface-llm-eleutherai-pythia-160m-deduped

Hugging Face

Não

Pythia 7m Deduped

huggingface-llm-eleutherai-pythia-70m-deduped

Hugging Face

Não

Quality Controlled Paraphrase Generation

huggingface-text2text-qcpg-sentences

Hugging Face

Não

RedPajama INCITE Base 3B V1

huggingface-textgeneration1-redpajama-incite-base-3B-v1-fp16

Hugging Face

Sim

RedPajama INCITE Base 7B V1

huggingface-textgeneration1-redpajama-incite-base-7B-v1-fp16

Hugging Face

Sim

RedPajama INCITE Chat 3B V1

huggingface-textgeneration1-redpajama-incite-chat-3B-v1-fp16

Hugging Face

Sim

RedPajama INCITE Chat 7B V1

huggingface-textgeneration1-redpajama-incite-chat-7B-v1-fp16

Hugging Face

Sim

RedPajama INCITE Instruct 3B V1

huggingface-textgeneration1-redpajama-incite-instruct-3B-v1-fp16

Hugging Face

Sim

RedPajama INCITE Instruct 7B V1

huggingface-textgeneration1-redpajama-incite-instruct-7B-v1-fp16

Hugging Face

Sim

Rinna Bilingual GPT NeoX 4B Instruction PPO

huggingface-llm-bilingual-rinna-4b-instruction-ppo-bf16

Hugging Face

Não

Rinna Japanese GPT NeoX 3.6B Instruction PPO

huggingface-llm-rinna-3-6b-instruction-ppo-bf16

Hugging Face

Não

Star Chat Alpha

huggingface-llm-huggingfaceh4-starchat-alpha

Hugging Face

Não

Star Chat Beta

huggingface-llm-huggingfaceh4-starchat-beta

Hugging Face

Não

StarCoder

huggingface-llm-starcoder

Hugging Face

Não

StarCoderBase

huggingface-llm-starcoderbase

Hugging Face

Não

T0pp

huggingface-text2text-bigscience-t0pp

Hugging Face

Não

T5 One Line Summary

huggingface-text2text-t5-one-line-summary

Hugging Face

Não

Tiny Llama 1.1B

huggingface-llm-tinyllama-1-1b-intermediate-step-1431k-3

Hugging Face

Não

Tiny Llama 1.1B Chat V0.6

huggingface-llm-tinyllama-tinyllama-1-1b-chat-v0-6

Hugging Face

Não

Tiny Llama 1.1B Chat V1

huggingface-llm-tinyllama-tinyllama-1-1b-chat-v1-0

Hugging Face

Não

Writer Palmyra Small

huggingface-llm-writer-palmyra-small

Hugging Face

Não

YARN Mistral 7B 128k

huggingface-llm-nousresearch-yarn-mistral-7b-128k

Hugging Face

Não

Zephyr 7B Alpha

huggingface-llm-huggingfaceh4-zephyr-7b-alpha

Hugging Face

Não

Zephyr 7B Beta

huggingface-llm-huggingfaceh4-zephyr-7b-beta

Hugging Face

Não

Para explorar os modelos de base do JumpStart de última geração de texto, use o filtro Geração de texto na página de descrição do produto Introdução ao Amazon SageMaker JumpStart. Você também pode explorar modelos de base com base em tarefas diretamente na interface do usuário do Amazon SageMaker Studio ou na interface do usuário do SageMaker Studio Classic. Apenas um subconjunto de modelos de geração de texto disponíveis ao público está disponível para ajuste no JumpStart. Para obter mais informações, consulte Usar modelos de base no Amazon SageMaker Studio Classic.

Modelos de geração de imagem disponíveis ao público

O JumpStart fornece uma ampla variedade de modelos de base de geração de imagens de difusão estável, incluindo modelos de base da Stability AI, bem como modelos pré-treinados para tarefas específicas de conversão de texto em imagem da Hugging Face. Se precisar ajustar seu modelo de base de texto em imagem, você pode usar a base Stable Diffusion 2.1 da Stability AI. Se quiser explorar modelos que já foram treinados em estilos de arte específicos, você pode explorar um dos muitos modelos de terceiros do Hugging Face diretamente na interface do usuário do Amazon SageMaker Studio UI ou na interface do usuário do SageMaker Studio Classic.

Para explorar os modelos de base do JumpStart de última geração, use o filtro Texto em Image na página de descrição do produto Introdução ao Amazon SageMaker JumpStart. Para começar com o modelo de base de texto para imagem escolhido, consulte. Uso de modelos de base do JumpStart

Modelos de fundação proprietários

O Amazon SageMaker JumpStart fornece acesso a modelos de base proprietários de fornecedores terceirizados, como AI21 Labs , Cohere e LightOn.

Para começar a usar um desses modelos proprietários, consulte Uso de modelos de base do JumpStart. Para usar um modelo de base proprietário, você deve primeiro assinar o modelo em AWS Marketplace. Depois de assinar o modelo, localize o modelo de base no Studio ou no SageMaker Studio Classic. Para obter mais informações, consulte Modelos pré-treinados do SageMaker JumpStart.

Para explorar os modelos de base proprietários mais recentes para uma variedade de casos de uso, consulte Introdução ao Amazon SageMaker JumpStart.