Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erkennen von Text
Amazon Rekognition kann Text in Bildern und Videos erkennen. Sie kann anschließend den erkannten Text in maschinenlesbaren Text umwandeln. Sie können die maschinenlesbare Texterkennung in Bildern verwenden, um Lösungen zu implementieren wie:
-
Visuelle Suche. Beispielsweise können Sie Bilder abrufen und anzeigen, die denselben Text enthalten.
-
Content-Einblicke. Ein Beispiel ist die Bereitstellung von Einblicken in Themen, die in Text vorkommen, der in extrahierten Videobildern erkannt wird. Ihre Anwendung kann erkannten Text nach relevanten Inhalten wie Nachrichten, Sportergebnissen, Athletennummern und Bildunterschriften durchsuchen.
-
Navigation. Sie könnten zum Beispiel eine sprachgesteuerte, mobile App für sehbehinderte Menschen entwickeln, die Namen von Restaurants, Geschäften oder Straßenschildern erkennt.
-
Unterstützung der öffentlichen Sicherheit und des Verkehrs. Zum Beispiel die Erkennung von Kfz-Kennzeichen aus Verkehrskamerabildern.
-
Filtern. Zum Beispiel, Herausfiltern von persönlich identifizierbaren Informationen (PII) aus Bildern.
Für die Texterkennung in Videos können Sie Lösungen implementieren wie:
-
Suchen von Videos nach Clips, in denen bestimmte Textschlüsselwörter, z. B. der Name des Gastes auf einer Grafik in einer Nachrichtensendung, vorkommen
-
Moderation von Inhalten zur Einhaltung organisatorischer Standards durch Erkennung von versehentlichem Text, Schimpfwörtern oder Spam
-
Suchen aller Texteinblendungen auf der Videozeitleiste zur weiteren Verarbeitung, z. B. Ersetzen von Text durch Text in einer anderen Sprache für die Internationalisierung von Inhalten
-
Finden von Textstellen, damit andere Grafiken entsprechend angepasst werden können
Verwenden Sie den DetectTextVorgang, um Text in Bildern im JPEG- oder PNG-Format zu erkennen. Verwenden Sie die GetTextDetectionOperationen StartTextDetectionund, um Text in Videos asynchron zu erkennen. Sowohl Bild- als auch Videotexterkennungs-Operationen unterstützen die meisten Schriftarten, dazu zählen auch hochstilisierte Schriftarten. Wenn Text erkannt wird, erzeugt Amazon Rekognition eine Darstellung der erkannten Wörter und Textzeilen, zeigt die Beziehung zwischen ihnen an und zeigt Ihnen an, wo sich der Text auf einem Bild oder einem Video-Frame befindet.
Die DetectText
- und GetTextDetection
-Operationen erkennen Wörter und Zeilen. Ein Wort besteht aus einem oder mehreren Skriptzeichen, die nicht durch Leerzeichen getrennt sind. DetectText
kann bis zu 100 Wörter in einem Bild erkennen. GetTextDetection
kann auch bis zu 100 Wörter pro Video-Frame erkennen.
Ein Wort besteht aus einem oder mehreren Textzeichen, die nicht durch Leerzeichen getrennt sind. Amazon Rekognition wurde entwickelt, um Text in den Sprachen Englisch, Arabisch, Russisch, Deutsch, Französisch, Italienisch, Portugiesisch und Spanisch zu erkennen.
Eine Zeile besteht aus einer Folge von Wörtern mit gleichem Abstand. Eine Zeile ist nicht unbedingt ein vollständiger Satz (Punkte bedeuten nicht das Ende einer Zeile). Amazon Rekognition erkennt zum Beispiel die Nummer eines Führerscheins als Zeile. Eine Zeile endet, wenn hinter ihr kein ausgerichteter Text steht oder wenn zwischen den Wörtern ein großer Abstand besteht, der im Verhältnis zur Länge der Wörter besteht. Je nach Abstand zwischen den Wörtern erkennt Amazon Rekognition möglicherweise mehrere Textzeilen, die in dieselbe Richtung ausgerichtet sind. Wenn ein Satz über mehrere Zeilen geht, gibt die Operation mehrere Zeilen zurück.
Betrachten Sie das folgende Bild:
Die blauen Felder enthalten Informationen über den erkannten Text und die Position des Textes, der durch die DetectText
-Operation zurückgegeben wird. In diesem Beispiel erkennt Amazon Rekognition „IT's“, „MONDAY“, „but“, „keep“, und „Smiling“ als Wörter. Amazon Rekognition erkennt „IT'S“, „MONDAY“, „but keep“ und „Smiling“ als Zeilen. Um erkannt zu werden, muss sich der Text innerhalb von +/- 90 Grad in der horizontalen Achse befinden.
Ein Beispiel finden Sie unter Erkennen von Text in einem Bild.