TensorBoard na Amazon SageMaker - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

TensorBoard na Amazon SageMaker

O Amazon SageMaker with TensorBoard é um recurso da Amazon SageMaker que traz as ferramentas de TensorBoardvisualização SageMaker e as integra ao SageMaker treinamento e ao domínio. Ele fornece opções para administrar sua AWS conta e os usuários pertencentes à conta por meio do SageMaker domínio, para dar aos usuários do domínio acesso aos TensorBoard dados com as permissões apropriadas para o Amazon S3 e ajudar os usuários do domínio a realizar tarefas de depuração de modelos usando os plug-ins de visualização. TensorBoard SageMaker with TensorBoard é estendido com o plug-in SageMaker Data Manager, com o qual os usuários do domínio podem acessar várias tarefas de treinamento em um único local dentro do TensorBoard aplicativo.

nota

Esse recurso serve para depurar o treinamento de modelos de aprendizado profundo usando ou. PyTorch TensorFlow

Para cientistas de dados

O treinamento de modelos grandes pode ter problemas científicos que exigem que os cientistas de dados os depurem e resolvam a fim de melhorar a convergência do modelo e estabilizar os processos de gradiente descendente.

Quando você encontra problemas de treinamento do modelo, como perda não convergente ou desaparecimento ou explosão de pesos e gradientes, você precisa acessar os dados do tensor para aprofundar e analisar os parâmetros do modelo, os escalares e quaisquer métricas personalizadas. Usando SageMaker com TensorBoard, você pode visualizar os tensores de saída do modelo extraídos dos trabalhos de treinamento. Ao experimentar modelos diferentes, várias execuções de treinamento e hiperparâmetros de modelo, você pode selecionar vários trabalhos de treinamento TensorBoard e compará-los em um só lugar.

Para administradores

Por meio da página TensorBoard inicial no SageMaker console ou no SageMaker domínio, você pode gerenciar os usuários do TensorBoard aplicativo se for administrador de uma AWS conta ou SageMaker domínio. Cada usuário do domínio pode acessar seu próprio TensorBoard aplicativo com as permissões concedidas. Como administrador de SageMaker domínio e usuário do domínio, você pode criar e excluir o TensorBoard aplicativo com o nível de permissão que você tem.

nota

Você não pode compartilhar o TensorBoard aplicativo para fins de colaboração porque o SageMaker domínio não permite o compartilhamento de aplicativos entre usuários. Os usuários podem compartilhar os tensores de saída salvos em um bucket do S3, se tiverem acesso ao bucket.

Estruturas suportadas e Regiões da AWS

O TensorBoard aplicativo SageMaker está disponível para as seguintes estruturas de aprendizado de máquina e. Regiões da AWS

Frameworks
  • PyTorch

  • TensorFlow

  • Transformadores Hugging Face

Regiões da AWS
  • Leste dos EUA (Norte da Virgínia) (us-east-1)

  • Leste dos EUA (Ohio) (us-east-2)

  • Oeste dos EUA (Oregon) (us-west-2)

  • Europa (Frankfurt) (eu-central-1)

  • Europa (Irlanda) (eu-west-1)

nota

A Amazon TensorBoard é SageMaker executada em uma ml.r5.large instância e incorre em cobranças após o nível SageMaker gratuito ou o período de teste gratuito do recurso. Para obter mais informações, consulte Amazon SageMaker Pricing.