Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Algoritmos de SageMaker IA integrados para dados de texto

Modo de foco
Algoritmos de SageMaker IA integrados para dados de texto - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker A IA fornece algoritmos personalizados para a análise de documentos textuais usados no processamento de linguagem natural, classificação ou resumo de documentos, modelagem ou classificação de tópicos e transcrição ou tradução de idiomas.

  • BlazingText algoritmo: uma implantação altamente otimizada do Word2vec e dos algoritmos de classificação de texto que podem ser facilmente escalados para grandes conjuntos de dados. É útil para muitas tarefas posteriores de processamento de linguagem natural (PLN).

  • Algoritmo Latent Dirichlet Allocation (LDA)Esse algoritmo é adequado para determinar tópicos em um conjunto de documentos. É um algoritmo não supervisionado, o que significa que ele não usa dados de exemplo com respostas durante o treinamento.

  • Algoritmo de Modelo de tópicos neurais (NTM): outra técnica não supervisionada para determinar tópicos em um conjunto de documentos, usando uma abordagem de rede neural.

  • Algoritmo Object2Vec: um algoritmo de incorporação neural de uso geral que pode ser usado para sistemas de recomendação, classificação de documentos e incorporação de frases.

  • Sequence-to-Sequence algoritmo: esse algoritmo supervisionado é comumente usado para tradução de máquina neural.

  • Classificação de texto - TensorFlow: um algoritmo supervisionado que oferece suporte ao aprendizado por transferência com modelos pré-treinados disponíveis para classificação de texto.

Nome do algoritmo Nome do canal Modo de entrada do treinamento Tipo de arquivo Classe de instância Paralelizável
BlazingText treinamento Arquivo ou Pipe Arquivo de texto (uma frase por linha com tokens separados por espaço) GPU (somente instância única) ou CPU Não
LDA treinamento e (opcionalmente) teste Arquivo ou Pipe recordIO-protobuf ou CSV CPU (somente instância única) Não
Modelo de tópico neural treinamento e (opcionalmente) validação, teste ou ambos Arquivo ou Pipe recordIO-protobuf ou CSV GPU ou CPU Sim
Object2Vec treinamento e (opcionalmente) validação, teste ou ambos Arquivo Linhas JSON GPU ou CPU (somente instância única) Não
Modelagem Seq2Seq treinamento, validação e vocabulário Arquivo recordIO-protobuf GPU (somente instância única) Não
Classificação de texto - TensorFlow treinamento e validação Arquivo CSV CPU ou GPU Sim (somente em vários GPUs em uma única instância)
PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.