Instale bibliotecas e kernels externos no Amazon Studio Classic SageMaker - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Instale bibliotecas e kernels externos no Amazon Studio Classic SageMaker

Importante

Em 30 de novembro de 2023, a experiência anterior do Amazon SageMaker Studio agora se chama Amazon SageMaker Studio Classic. A seção a seguir é específica para usar o aplicativo Studio Classic. Para obter informações sobre como usar a experiência atualizada do Studio, consulte SageMaker Estúdio Amazon.

Os notebooks Amazon SageMaker Studio Classic vêm com várias imagens já instaladas. Essas imagens contêm kernels e pacotes Python, incluindo scikit-learn, Pandas,,, e MXNet. NumPy TensorFlow PyTorch Você também pode instalar suas próprias imagens que contenham pacotes e kernels de sua escolha. Para obter mais informações sobre instalação de sua própria imagem, consulte Traga sua própria SageMaker imagem.

Os diferentes kernels do Jupyter nos notebooks SageMaker Amazon Studio Classic são ambientes conda separados. Para obter mais informações sobre ambientes conda, consulte Gerenciar ambientes.

Ferramentas de instalação do pacote

Importante

Atualmente, todos os pacotes nos SageMaker notebooks da Amazon são licenciados para uso com a Amazon SageMaker e não exigem licenças comerciais adicionais. No entanto, isso pode estar sujeito a alterações no futuro, e recomendamos revisar os termos de licenciamento regularmente para verificar se há atualizações.

O método usado para instalar pacotes Python a partir do terminal varia de acordo com a imagem. O Studio Classic oferece suporte às seguintes ferramentas de instalação de pacotes:

  • Cadernos: os seguintes comandos são compatíveis. Se uma das opções a seguir não funcionar na sua imagem, tente a outra.

    • %conda install

    • %pip install

  • O terminal Jupyter: você pode instalar pacotes usando pip e conda diretamente. Você também pode usar apt-get install para instalar pacotes do sistema a partir do terminal.

nota

Não recomendamos o uso de pip install -u oupip install --user, porque esses comandos instalam pacotes no volume Amazon EFS do usuário e podem potencialmente bloquear a reinicialização JupyterServer do aplicativo. Em vez disso, use uma configuração de ciclo de vida para reinstalar os pacotes necessários na reinicialização da aplicação, conforme mostrado em Instale pacotes usando configurações de ciclo de vida.

Recomendamos usar %pip e %conda para instalar pacotes de dentro de um caderno porque eles levam corretamente em conta o ambiente ativo ou o intérprete que está sendo usado. Para obter mais informações, consulte Adicionar funções mágicas %pip e %conda. Você também pode usar a sintaxe de comando do sistema (linhas começando com !) para instalar pacotes. Por exemplo, !pip install e !conda install.

Conda

O Conda é um sistema de gerenciamento de pacotes e sistema de gerenciamento de ambiente de código aberto que pode instalar pacotes e suas dependências. SageMaker suporta o uso de conda com o canal conda-forge. Para obter mais informações, consulte Canais conda. O canal conda-forge é um canal comunitário onde os colaboradores podem fazer upload de pacotes.

nota

A instalação de pacotes do conda-forge pode levar até 10 minutos. O tempo está relacionado à forma como o conda resolve o gráfico de dependências.

Todos os ambientes SageMaker fornecidos são funcionais. Os pacotes instalados pelo usuário podem não funcionar corretamente.

O Conda tem dois métodos para ativar ambientes: conda activate e source activate. Para obter mais informações, consulte Gerenciar ambiente.

Operações conda compatíveis
  • conda install de um pacote em um único ambiente

  • conda install de um pacote em todos os ambientes

  • Instalar um pacote do repositório principal do conda

  • Instalar um pacote do conda-forge

  • Alterar o local de instalação do conda para usar o Amazon EBS

  • Suporte a conda activate e source activate

Pip

Pip é a ferramenta para instalar e gerenciar pacotes Python. O Pip pesquisa pacotes no Python Package Index (PyPI) por padrão. Ao contrário do conda, o pip não tem suporte ambiental integrado. Portanto, o pip não é tão completo quanto o conda quando se trata de pacotes com dependências nativas ou de bibliotecas do sistema. O Pip pode ser usado para instalar pacotes em ambientes conda. Você pode usar repositórios de pacotes alternativos com pip em vez do PyPI.

Operações pip compatíveis
  • Usar pip para instalar um pacote sem um ambiente conda ativo

  • Usar pip para instalar um pacote em um ambiente conda

  • Usar pip para instalar um pacote em todos os ambientes conda

  • Alterar o local de instalação do pip para usar o Amazon EBS

  • Usar um repositório alternativo para instalar pacotes com pip

Sem suporte

SageMaker visa oferecer suporte ao maior número possível de operações de instalação de pacotes. No entanto, se os pacotes foram instalados SageMaker e você usa as seguintes operações nesses pacotes, isso pode tornar seu ambiente instável:

  • Desinstalação

  • Rebaixamento

  • Atualizar

Devido a possíveis problemas com as condições ou configurações da rede, ou a disponibilidade do conda ou PyPi, os pacotes podem não ser instalados em um período de tempo fixo ou determinístico.

nota

A tentativa de instalar um pacote em um ambiente com dependências incompatíveis pode resultar em uma falha. Se ocorrerem problemas, você pode entrar em contato com o mantenedor da biblioteca sobre a atualização das dependências do pacote. Quando você modifica o ambiente, como remover ou atualizar pacotes existentes, isso pode resultar na instabilidade desse ambiente.

Instale pacotes usando configurações de ciclo de vida

Instale imagens e kernels personalizados no volume Amazon EBS da instância do Studio Classic para que eles persistam quando você parar e reiniciar o notebook e para que as bibliotecas externas instaladas não sejam atualizadas. SageMaker Para fazer isso, use uma configuração de ciclo de vida que inclua um script que é executado quando você cria o caderno (on-create) e um script executado sempre que você reinicia o caderno (on-start). Para obter mais informações sobre o uso de configurações de ciclo de vida com o Studio Classic, consulte. Use configurações de ciclo de vida com o Amazon Studio Classic SageMaker Para exemplos de scripts de configuração do ciclo de vida, consulte Amostras de configuração do ciclo de vida do SageMaker Studio Classic.