Wählen Sie Ihre Cookie-Einstellungen aus

Wir verwenden essentielle Cookies und ähnliche Tools, die für die Bereitstellung unserer Website und Services erforderlich sind. Wir verwenden Performance-Cookies, um anonyme Statistiken zu sammeln, damit wir verstehen können, wie Kunden unsere Website nutzen, und Verbesserungen vornehmen können. Essentielle Cookies können nicht deaktiviert werden, aber Sie können auf „Anpassen“ oder „Ablehnen“ klicken, um Performance-Cookies abzulehnen.

Wenn Sie damit einverstanden sind, verwenden AWS und zugelassene Drittanbieter auch Cookies, um nützliche Features der Website bereitzustellen, Ihre Präferenzen zu speichern und relevante Inhalte, einschließlich relevanter Werbung, anzuzeigen. Um alle nicht notwendigen Cookies zu akzeptieren oder abzulehnen, klicken Sie auf „Akzeptieren“ oder „Ablehnen“. Um detailliertere Entscheidungen zu treffen, klicken Sie auf „Anpassen“.

Integrierte SageMaker KI-Algorithmen für Textdaten

Fokusmodus
Integrierte SageMaker KI-Algorithmen für Textdaten - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker KI bietet Algorithmen, die auf die Analyse von Textdokumenten zugeschnitten sind, die bei der Verarbeitung natürlicher Sprache, der Klassifizierung oder Zusammenfassung von Dokumenten, der Themenmodellierung oder -klassifizierung sowie der Transkription oder Übersetzung von Sprachen verwendet werden.

  • BlazingText Algorithmus – Eine hochoptimierte Implementierung von Word2VEC und Textklassifizierungsalgorithmen, die sich problemlos auf große Datensätze skalieren lässt. Es ist nützlich für viele nachgelagerte Aufgaben der Verarbeitung natürlicher Sprache (NLP).

  • Latent Dirichlet Allocation (LDA)-Algorithmus–dieser Algorithmus eignet sich für die Bestimmung von Themen in einer Reihe von Dokumenten. Er ist ein unüberwachter Algorithmus, was bedeutet, dass während des Trainings keine Beispieldaten mit Antworten verwendet werden.

  • Algorithmus für neuronale Themenmodellierung (NTM)–eine weitere unüberwachte Methode zur Bestimmung von Themen in einer Reihe von Dokumente mithilfe eines neuronalen Netzwerkansatzes.

  • Object2Vec-Algorithmus–ein Allzweck-Algorithmus zur neuronalen Einbettung, der für Empfehlungssysteme, Dokumentenklassifizierung und Satzeinbettung verwendet werden kann.

  • Sequence-to-Sequence Algorithmus–dieser überwachte Algorithmus wird allgemein für neuronale Machine Übersetzung verwendet.

  • Textklassifizierung - TensorFlow–ein überwachter Algorithmus, der Transfer-Learning mit verfügbaren vortrainierten Modellen für die Textklassifizierung unterstützt.

Name des Algorithmus Kanalname Trainingseingabemodus Dateityp Instance-Klasse Parallelisierbar
BlazingText "train" Datei oder Pipe Textdatei (ein Satz pro Zeile mit durch Leerzeichen getrennten Token) GPU (nur einzelne Instance) oder CPU Nein
LDA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU (nur einzelne Instance) Nein
Neural Topic Modeling "train" und (optional) "validation", "test" oder beides Datei oder Pipe recordIO-protobuf oder CSV GPU oder CPU Ja
Object2Vec "train" und (optional) "validation", "test" oder beides Datei JSON-Lines GPU oder CPU (nur einzelne Instance) Nein
Seq2Seq Modeling "train", "validation" und "vocab" Datei recordIO-protobuf GPU (nur einzelne Instance) Nein
Textklassifizierung - TensorFlow Training und Validierung Datei CSV CPU oder GPU Ja (nur für mehrere GPUs auf einer einzigen Instanz)
DatenschutzNutzungsbedingungen für die WebsiteCookie-Einstellungen
© 2025, Amazon Web Services, Inc. oder Tochtergesellschaften. Alle Rechte vorbehalten.