Modelos de base disponíveis
O Amazon SageMaker JumpStart oferece modelos de base de última geração, integrados, disponíveis ao público e proprietários para personalizar e integrar aos seus fluxos de trabalho de IA generativa.
Modelos de fundação disponíveis ao público
O Amazon SageMaker JumpStart integra e mantém modelos de base de código aberto de fontes terceirizadas. Para começar a usar um desses modelos disponíveis ao público, consulte Uso de modelos de base do JumpStart ou explore um dos modelos disponíveis Cadernos de exemplo. Em um determinado exemplo de caderno de um modelo disponível ao público, tente trocar o ID do modelo para experimentar modelos diferentes dentro da mesma família de modelos.
Para obter mais informações sobre IDs de modelo e recursos para a implantação de modelos de base do JumpStart disponíveis ao público com o SageMaker Python SDK, consulte Usar modelos de base com o SageMaker Python SDK.
Por definição, os modelos de base são adaptáveis a muitas tarefas posteriores. Os modelos de base são treinados em grandes quantidades de dados gerais de domínio e o mesmo modelo pode ser implementado ou personalizado para vários casos de uso. Ao escolher seu modelo de base, comece definindo uma tarefa específica, por exemplo, geração de texto ou geração de imagem.
Modelos de previsão de séries temporais disponíveis ao público
Os modelos de predição de séries temporais são projetados para analisar e fazer predições em dados sequenciais ao longo do tempo. Esses modelos podem ser aplicados a vários domínios, como finanças, previsão do tempo ou previsão de demanda de energia. Os modelos Chronos são personalizados para tarefas de predição de séries temporais, possibilitando predições exatas com base em padrões de dados históricos.
Nome do modelo | ID do modelo | Fonte do modelo | Ajuste |
---|---|---|---|
Chronos T5 Small |
autogluon-forecasting-chronos-t5-small |
Amazon |
Não |
Chronos T5 Base |
autogluon-forecasting-chronos-t5-base |
Amazon |
Não |
Chronos T5 Large |
autogluon-forecasting-chronos-t5-large |
Amazon |
Não |
Modelos de geração de texto disponíveis ao público
Os modelos de base de geração de texto podem ser usados para uma variedade de tarefas posteriores, incluindo resumo de texto, classificação de texto, resposta a perguntas, geração de conteúdo de formato longo, redação curta, extração de informações e muito mais.
Nome do modelo | ID do modelo | Fonte do modelo | Ajuste |
---|---|---|---|
Alexa TM 20B |
pytorch-textgeneration1-alexa20b |
Amazon |
Não |
Bloom 1b1 |
huggingface-textgeneration-bloom-1b1 |
Hugging Face |
Não |
Bloom 1b7 |
huggingface-textgeneration-bloom-1b7 |
Hugging Face |
Não |
Bloom 3B |
huggingface-textgeneration1-bloom-3b |
Hugging Face |
Sim |
Bloom 560m |
huggingface-textgeneration-bloom-560m |
Hugging Face |
Não |
Bloom 7B1 |
huggingface-textgeneration1-bloom-7b1 |
Hugging Face |
Sim |
Bloomz 1b1 |
huggingface-textgeneration-bloomz-1b1 |
Hugging Face |
Não |
Bloomz 1b7 |
huggingface-textgeneration-bloomz-1b7 |
Hugging Face |
Não |
BloomZ 3B FP16 |
huggingface-textgeneration1-bloom-3b-fp16 |
Hugging Face |
Sim |
Bloomz 560m |
huggingface-textgeneration-bloomz-560m |
Hugging Face |
Não |
BloomZ 7B1 FP16 |
huggingface-textgeneration1-bloomz-7b1-fp16 |
Hugging Face |
Sim |
Code Llama 13B |
meta-textgeneration-llama-codellama-13b |
Meta |
Sim |
Code Llama 13B Instruct |
meta-textgeneration-llama-codellama-13b-instruct |
Meta |
Não |
Code Llama 13B Python |
meta-textgeneration-llama-codellama-13b-python |
Meta |
Sim |
Code Llama 34B |
meta-textgeneration-llama-codellama-34b |
Meta |
Sim |
Code Llama 34B Instruct |
meta-textgeneration-llama-codellama-34b-instruct |
Meta |
Não |
Code Llama 34B Python |
meta-textgeneration-llama-codellama-34b-python |
Meta |
Sim |
Code Llama 70B |
meta-textgeneration-llama-codellama-70b |
Meta |
Sim |
Code Llama 70B Instruct |
meta-textgeneration-llama-codellama-70b-instruct |
Meta |
Não |
Code Llama 70B Python |
meta-textgeneration-llama-codellama-70b-python |
Meta |
Sim |
Code Llama 7B |
meta-textgeneration-llama-codellama-7b |
Meta |
Sim |
Code Llama 7B Instruct |
meta-textgeneration-llama-codellama-7b-instruct |
Meta |
Não |
Code Llama 7B Python |
meta-textgeneration-llama-codellama-7b-python |
Meta |
Sim |
CyberAgentLM2-7B-Chat (CALM2-7B-Chat) |
huggingface-llm-calm2-7b-chat-bf16 |
Hugging Face |
Sim |
DistilGPT2 |
huggingface-textgeneration-distilgpt2 |
Hugging Face |
Não |
Dolly V2 12b BF16 |
huggingface-textgeneration-dolly-v2-12b-bf16 |
Hugging Face |
Não |
Dolly V2 3b BF16 |
huggingface-textgeneration-dolly-v2-3b-bf16 |
Hugging Face |
Não |
Dolly V2 7b BF16 |
huggingface-textgeneration-dolly-v2-7b-bf16 |
Hugging Face |
Não |
Dolphin 2.2.1 Mistral 7B |
huggingface-llm-dolphin-2-2-1-mistral-7b |
Hugging Face |
Não |
Dolphin 2.5 Mixtral 8 7B |
huggingface-llm-dolphin-2-5-mixtral-8x7b |
Hugging Face |
Não |
Dolphin 2.7 Mixtral 8 7B |
huggingface-llm-dolphin-2-7-mixtral-8x7b |
Hugging Face |
Não |
EleutherAI GPT Neo 2.7B |
huggingface-llm-eleutherai-gpt-neo-1-3b |
Hugging Face |
Não |
EleutherAI GPT Neo 2.7B |
huggingface-llm-eleutherai-gpt-neo-2-7b |
Hugging Face |
Não |
Falcon 180B BF16 |
huggingface-llm-falcon-180b-bf16 |
Hugging Face |
Não |
Falcon 180B Chat BF16 |
huggingface-llm-falcon-180b-chat-bf16 |
Hugging Face |
Não |
Falcon 40B BF16 |
huggingface-llm-falcon-40b-bf16 |
Hugging Face |
Sim |
Falcon 40B Instruct BF16 |
huggingface-llm-falcon-40b-instruct-bf16 |
Hugging Face |
Sim |
Falcon 7B BF16 |
huggingface-llm-falcon-7b-bf16 |
Hugging Face |
Sim |
Falcon 7B Instruct BF16 |
huggingface-llm-falcon-7b-instruct-bf16 |
Hugging Face |
Sim |
Falcon Lite |
huggingface-llm-amazon-falconlite |
Hugging Face |
Não |
Falcon Lite 2 |
huggingface-llm-amazon-falconlite2 |
Hugging Face |
Não |
Falcon RW 1B |
huggingface-llm-tiiuae-falcon-rw-1b |
Hugging Face |
Não |
Flan-T5 Base |
huggingface-text2text-flan-t5-base |
Hugging Face |
Sim |
Modelo de base Flan-T5 ajustado no conjunto de dados Samsum |
huggingface-text2text-flan-t5-base-samsum |
Hugging Face |
Não |
Flan-T5 Large |
huggingface-text2text-flan-t5-large |
Hugging Face |
Sim |
Flan-T5 Small |
huggingface-text2text-flan-t5-small |
Hugging Face |
Sim |
Flan-T5 XL |
huggingface-text2text-flan-t5-xl |
Hugging Face |
Sim |
Flan-T5 XXL |
huggingface-text2text-flan-t5-xxl |
Hugging Face |
Sim |
Flan-UL2 BF16 |
huggingface-text2text-flan-ul2-bf16 |
Hugging Face |
Não |
Gemma 2B |
huggingface-llm-gemma-2b |
Hugging Face |
Sim |
Gemma 2B Instruct |
huggingface-llm-gemma-2b-instruct |
Hugging Face |
Sim |
Gemma 7B |
huggingface-llm-gemma-7b |
Hugging Face |
Sim |
Gemma 7B Instruct |
huggingface-llm-gemma-7b-instruct |
Hugging Face |
Sim |
GPT 2 |
huggingface-textgeneration-gpt2 |
Hugging Face |
Não |
GPT NeoX 20B FP16 |
huggingface-textgeneration2-gpt-neox-20b-fp16 |
Hugging Face |
Não |
GPT NeoXT Chat Base 20B FP16 |
huggingface-textgeneration2-gpt-neoxt-chat-base-20b-fp16 |
Hugging Face |
Não |
GPT-2 XL |
huggingface-textgeneration1-gpt-2-xl |
Hugging Face |
Sim |
GPT-J 6B |
huggingface-textgeneration1-gpt-j-6b |
Hugging Face |
Sim |
GPT-Neo 1.3B |
huggingface-textgeneration1-gpt-neo-1-3b |
Hugging Face |
Sim |
GPT-Neo 125M |
huggingface-textgeneration1-gpt-neo-125m |
Hugging Face |
Sim |
GPT-NEO 2.7B |
huggingface-textgeneration1-gpt-neo-2-7b |
Hugging Face |
Sim |
Japanese StableLM Instruct Alpha 7B v2 |
model-textgenerationjp-japanese-stablelm-instruct-alpha-7b-v2 |
Hugging Face |
Não |
LightGPT Instruct 6B |
huggingface-textgeneration1-lightgpt |
Hugging Face |
Sim |
Lite Llama 460M 1T |
huggingface-llm-ahxt-litellama-460m-1t |
Hugging Face |
Não |
Llama 2 13B |
meta-textgeneration-llama-2-13b |
Meta |
Sim |
Llama 2 13B Chat |
meta-textgeneration-llama-2-13b-f |
Meta |
Sim |
Llama 2 13B Chat Neuron |
meta-textgenerationneuron-llama-2-13b-f |
Meta |
Não |
Llama 2 13B Neuron |
meta-textgenerationneuron-llama-2-13b |
Meta |
Sim |
Llama 2 70B |
meta-textgeneration-llama-2-70b |
Meta |
Sim |
Llama 2 70B Chat |
meta-textgeneration-llama-2-70b-f |
Meta |
Sim |
Llama 2 70B Chat Neuron |
meta-textgenerationneuron-llama-2-70b-f |
Meta |
Não |
Llama 2 70B Neuron |
meta-textgenerationneuron-llama-2-70b |
Meta |
Não |
Llama 2 7B |
meta-textgeneration-llama-2-7b |
Meta |
Sim |
Llama 2 7B Chat |
meta-textgeneration-llama-2-7b-f |
Meta |
Sim |
Llama 2 7B Chat Neuron |
meta-textgenerationneuron-llama-2-7b-f |
Meta |
Não |
Llama 2 7B Neuron |
meta-textgenerationneuron-llama-2-7b |
Meta |
Sim |
Llama 3 8B |
meta-textgeneration-llama-3-8b |
Meta |
Sim |
Llama 3 8B Instruct |
meta-textgeneration-llama-3-8b-instruct |
Meta |
Sim |
Llama 3 70B |
meta-textgeneration-llama-3-70b |
Meta |
Sim |
Llama 3 70B Instruct |
meta-textgeneration-llama-3-70b-instruct |
Meta |
Sim |
Llama Guard 7B |
meta-textgeneration-llama-guard-7b |
Meta |
Não |
Mistral 7B |
huggingface-llm-mistral-7b |
Hugging Face |
Sim |
Mistral 7B Instruct |
huggingface-llm-mistral-7b-instruct |
Hugging Face |
Não |
Mistral 7B OpenOrca AWQ |
huggingface-llm-thebloke-mistral-7b-openorca-awq |
Hugging Face |
Não |
Mistral 7B SFT Alpha |
huggingface-llm-huggingfaceh4-mistral-7b-sft-alpha |
Hugging Face |
Não |
Mistral 7B SFT Beta |
huggingface-llm-huggingfaceh4-mistral-7b-sft-beta |
Hugging Face |
Não |
Mistral Lite |
huggingface-llm-amazon-mistrallite |
Hugging Face |
Não |
Mistral Trix V1 |
huggingface-llm-cultrix-mistraltrix-v1 |
Hugging Face |
Não |
Mixtral 8x7B |
huggingface-llm-mixtral-8x7b |
Hugging Face |
Sim |
Mixtral 8x7B Instruct |
huggingface-llm-mixtral-8x7b-instruct |
Hugging Face |
Sim |
MPT 7B BF16 |
huggingface-textgeneration1-mpt-7b-bf16 |
Hugging Face |
Não |
MPT 7B Instruct BF16 |
huggingface-textgeneration1-mpt-7b-instruct-bf16 |
Hugging Face |
Não |
MPT 7B StoryWriter-65k+ BF16 |
huggingface-textgeneration1-mpt-7b-storywriter-bf16 |
Hugging Face |
Não |
Multilingual GPT |
huggingface-llm-ai-forever-mgpt |
Hugging Face |
Não |
Nous Hermes 2 SOLAR 10.7B |
huggingface-llm-nousresearch-nous-hermes-2-solar-10-7b |
Hugging Face |
Não |
Nous Hermes Llama 2 13B |
huggingface-llm-nousresearch-nous-hermes-llama2-13b |
Hugging Face |
Não |
Nous Hermes Llama 2 7B |
huggingface-llm-nousresearch-nous-hermes-llama-2-7b |
Hugging Face |
Não |
Open Hermes 2 Mistral 7B |
huggingface-llm-teknium-openhermes-2-mistral-7b |
Hugging Face |
Não |
Open LlaMa |
huggingface-textgeneration-open-llama |
Hugging Face |
Não |
Open Llama 7B V2 |
huggingface-llm-openlm-research-open-llama-7b-v2 |
Hugging Face |
Não |
Platypus 2 7B |
huggingface-llm-garage-baind-platypus2-7b |
Hugging Face |
Não |
Pythia 160m Deduped |
huggingface-llm-eleutherai-pythia-160m-deduped |
Hugging Face |
Não |
Pythia 7m Deduped |
huggingface-llm-eleutherai-pythia-70m-deduped |
Hugging Face |
Não |
Quality Controlled Paraphrase Generation |
huggingface-text2text-qcpg-sentences |
Hugging Face |
Não |
RedPajama INCITE Base 3B V1 |
huggingface-textgeneration1-redpajama-incite-base-3B-v1-fp16 |
Hugging Face |
Sim |
RedPajama INCITE Base 7B V1 |
huggingface-textgeneration1-redpajama-incite-base-7B-v1-fp16 |
Hugging Face |
Sim |
RedPajama INCITE Chat 3B V1 |
huggingface-textgeneration1-redpajama-incite-chat-3B-v1-fp16 |
Hugging Face |
Sim |
RedPajama INCITE Chat 7B V1 |
huggingface-textgeneration1-redpajama-incite-chat-7B-v1-fp16 |
Hugging Face |
Sim |
RedPajama INCITE Instruct 3B V1 |
huggingface-textgeneration1-redpajama-incite-instruct-3B-v1-fp16 |
Hugging Face |
Sim |
RedPajama INCITE Instruct 7B V1 |
huggingface-textgeneration1-redpajama-incite-instruct-7B-v1-fp16 |
Hugging Face |
Sim |
Rinna Bilingual GPT NeoX 4B Instruction PPO |
huggingface-llm-bilingual-rinna-4b-instruction-ppo-bf16 |
Hugging Face |
Não |
Rinna Japanese GPT NeoX 3.6B Instruction PPO |
huggingface-llm-rinna-3-6b-instruction-ppo-bf16 |
Hugging Face |
Não |
Star Chat Alpha |
huggingface-llm-huggingfaceh4-starchat-alpha |
Hugging Face |
Não |
Star Chat Beta |
huggingface-llm-huggingfaceh4-starchat-beta |
Hugging Face |
Não |
StarCoder |
huggingface-llm-starcoder |
Hugging Face |
Não |
StarCoderBase |
huggingface-llm-starcoderbase |
Hugging Face |
Não |
T0pp |
huggingface-text2text-bigscience-t0pp |
Hugging Face |
Não |
T5 One Line Summary |
huggingface-text2text-t5-one-line-summary |
Hugging Face |
Não |
Tiny Llama 1.1B |
huggingface-llm-tinyllama-1-1b-intermediate-step-1431k-3 |
Hugging Face |
Não |
Tiny Llama 1.1B Chat V0.6 |
huggingface-llm-tinyllama-tinyllama-1-1b-chat-v0-6 |
Hugging Face |
Não |
Tiny Llama 1.1B Chat V1 |
huggingface-llm-tinyllama-tinyllama-1-1b-chat-v1-0 |
Hugging Face |
Não |
Writer Palmyra Small |
huggingface-llm-writer-palmyra-small |
Hugging Face |
Não |
YARN Mistral 7B 128k |
huggingface-llm-nousresearch-yarn-mistral-7b-128k |
Hugging Face |
Não |
Zephyr 7B Alpha |
huggingface-llm-huggingfaceh4-zephyr-7b-alpha |
Hugging Face |
Não |
Zephyr 7B Beta |
huggingface-llm-huggingfaceh4-zephyr-7b-beta |
Hugging Face |
Não |
Para explorar os modelos de base do JumpStart de última geração de texto, use o filtro Geração de texto na página de descrição do produto Introdução ao Amazon SageMaker JumpStart
Modelos de geração de imagem disponíveis ao público
O JumpStart fornece uma ampla variedade de modelos de base de geração de imagens de difusão estável, incluindo modelos de base da Stability AI, bem como modelos pré-treinados para tarefas específicas de conversão de texto em imagem da Hugging Face. Se precisar ajustar seu modelo de base de texto em imagem, você pode usar a base Stable Diffusion 2.1 da Stability AI. Se quiser explorar modelos que já foram treinados em estilos de arte específicos, você pode explorar um dos muitos modelos de terceiros do Hugging Face diretamente na interface do usuário do Amazon SageMaker Studio UI ou na interface do usuário do SageMaker Studio Classic.
Para explorar os modelos de base do JumpStart de última geração, use o filtro Texto em Image na página de descrição do produto Introdução ao Amazon SageMaker JumpStart
Modelos de fundação proprietários
O Amazon SageMaker JumpStart fornece acesso a modelos de base proprietários de fornecedores terceirizados, como AI21 Labs
Para começar a usar um desses modelos proprietários, consulte Uso de modelos de base do JumpStart. Para usar um modelo de base proprietário, você deve primeiro assinar o modelo em AWS Marketplace. Depois de assinar o modelo, localize o modelo de base no Studio ou no SageMaker Studio Classic. Para obter mais informações, consulte Modelos pré-treinados do SageMaker JumpStart.
Para explorar os modelos de base proprietários mais recentes para uma variedade de casos de uso, consulte Introdução ao Amazon SageMaker JumpStart