Allgemeines

F: Was ist Amazon Rekognition?

Amazon Rekognition ist ein Service, mit dem Sie einfach Bildanalysen zu Ihren Anwendungen hinzufügen können. Rekognition Image ermöglicht die einfache Erstellung leistungsfähiger Anwendungen zum Suchen, Überprüfen und Organisieren von Millionen von Bildern. Rekognition Video ermöglicht die Extraktion von bewegungsbasiertem Kontext aus gespeicherten oder live gestreamten Videos und hilft Ihnen bei der Analyse.

Rekognition Image ist ein Bilderkennungsservice, der Objekte, Szenen, Gesichter, Text, bekannte Persönlichkeiten und unangemessene Bildinhalte erkennt. Außerdem können Sie damit Gesichter suchen und vergleichen. Hinter Rekognition Image arbeitet die bewährte, hochgradig skalierbare Deep Learning-Technologie, die von Amazon-Wissenschaftlern entwickelt wurde, damit mittels maschinellen Sehfunktionen (Computer Vision) für Prime Photos täglich Milliarden Bilder analysiert werden können.

Tiefgreifende Modelle neuronaler Netze erkennen und benennen in Rekognition Image Tausende Objekte und Szenen in Ihren Bildern. Wir fügen ständig neue Benennungen und Gesichtserkennungsfunktionen hinzu. Mit Rekognition Image zahlen Sie nur für die Bilder, die Sie analysieren, und die Gesichts-Metadaten, die Sie speichern.

Rekognition Video ist ein Videoerkennungsservice, Aktivitäten, Objekte, bekannte Persönlichkeiten und unangemessene Inhalte in Videos erkennt und die Bewegungen von Menschen in Bildern identifizieren kann, die in Amazon S3 gespeichert sind oder auf Acuity live gestreamt werden. Rekognition Video erkennt Personen und verfolgt sie durch das Video, auch wenn ihre Gesichter nicht zu sehen sind oder die jeweilige Person aus der Szene heraus- oder in die Szene hineingeht. Diese Funktionalität kann beispielsweise im Rahmen einer Anwendung eingesetzt werden, die Sie benachrichtigt, wenn der Paketbote vor Ihrer Haus- oder Wohnungstür steht. Rekognition Video ermöglicht außerdem, Metadaten wie Objekte, Aktivitäten, Szenen, bekannte Persönlichkeiten und Gesichter aufzuzeichnen. Dies erleichtert das Durchsuchen von Videos.

F: Was ist Deep Learning?

Deep Learning ist ein Unterbereich des Machine Learning und spielt eine wichtige Rolle im Fachgebiet künstliche Intelligenz. Beim Deep Learning werden auf Grundlage von Rohdaten Abstraktionen auf hoher Ebene abgeleitet. Dafür wird ein tiefes Netz mit mehreren Verarbeitungsschichten durchlaufen, in denen verschiedene lineare und nicht lineare Transformationen stattfinden. Deep Learning ist an die Fähigkeiten der Informationsverarbeitung und Kommunikation des menschlichen Gehirns angelehnt. Es ersetzt manuelle Funktionen durch Funktionen, die auf Grundlage riesiger Datenmengen erlernt wurden. Der Lernprozess erfolgt durch die sich wiederholende Beurteilung Hunderttausender Parameter im tiefen Netz, wobei effiziente Algorithmen genutzt werden.

Mehrere Deep Learning-Architekturen wie CNNs (Convolutional Deep Neural Networks) und rückgekoppelte neuronale Netze wurden auf Technologien für maschinelles Sehen, Spracherkennung, Verarbeitung natürlicher Sprache und Erkennung von Audio angewendet, um herausragende Ergebnisse bei der Umsetzung verschiedenster Aufgaben zu erzielen.

Amazon Rekognition gehört zur Familie der Amazon AI-Dienste. Die Amazon KI-Dienste verwenden Deep Learning, um Bilder zu verstehen, Text in natürlich klingende Sprache umzuwandeln und intuitive Text- und Sprachoberflächen für Konversationen zu erstellen.

F: Muss ich ein Experte für Deep Learning sein, um Amazon Rekognition verwenden zu können?

Nein. Mit Amazon Rekognition müssen Sie keine Deep Learning-Pipelines erstellen, verwalten oder aktualisieren.

Um präzise Ergebnisse bei der Durchführung komplexer maschineller Sehfunktionen zu erzielen, wie zum Beispiel die Erkennung von Objekten und Szenen, Gesichtsanalyse oder Gesichtserkennung, müssen Deep Learning-Systeme optimal abgestimmt und mithilfe eines riesigen Fundaments an Daten aufgebaut werden, die überprüft und mit einem Label versehen wurden. Die Ermittlung, Bereinigung und korrekte Benennung von Daten ist eine zeitraubende und kostspielige Aufgabe. Die Pflege und der Aufbau eines tiefen neuronalen Netzes ist außerdem berechnungsintensiv und erfordert oft maßgeschneiderte Hardware einschließlich Grafikprozessoren.

Amazon Rekognition ist vollständig verwaltet und kann schon im Auslieferungszustand Aufgaben der Bild- und Videoerkennung durchführen, sodass Sie weder Zeit noch Ressourcen für die Erstellung einer Deep Learning-Pipeline aufwenden müssen. Amazon Rekognition wird auf Basis der neuesten Forschungsergebnisse stets weiterentwickelt und durch aktuelle Lerndaten kontinuierlich erweitert und verbessert. So können Sie sich ganz auf das Design und die Entwicklung hochwertiger Anwendungen konzentrieren.

F: Was sind die gängigsten Anwendungsfälle für Amazon Rekognition?

Die gängigsten Anwendungsfälle für Rekognition Image umfassen:

  • Durchsuchbare Bildbibliothek
  • Gesichtsbasierte Benutzerverifizierung
  • Stimmungsanalyse
  • Gesichtserkennung
  • Image Moderation

Die gängigsten Anwendungsfälle für Rekognition Video umfassen:

  • Suchindex für Videoarchive
  • Einfaches Filtern von Videos auf anzügliche oder sexuell eindeutige Inhalte

F: Was sind die ersten Schritte mit Amazon Rekognition?

Wenn Sie sich noch nicht bei Amazon Rekognition angemeldet haben, klicken Sie auf der Seite für Amazon Rekognition auf "Testen Sie Amazon Rekognition", und melden Sie sich an. Hierfür ist ein Amazon Web Services-Konto erforderlich. Wenn Sie noch kein Konto haben, werden Sie bei der Anmeldung aufgefordert, ein Konto zu erstellen. Sobald Sie sich angemeldet haben, können Sie Amazon Rekognition mit Ihren eigenen Bildern und Videos ausprobieren. Verwenden Sie hierfür die Verwaltungskonsole von Amazon Rekognition, oder laden Sie die Amazon Rekognition-SDKs herunter, um mit der Erstellung Ihrer eigenen Anwendungen zu beginnen. Schritt-für-Schritt-Anweisungen finden Sie im Handbuch Erste Schritte.

F: Welche APIs bietet Amazon Rekognition?

Amazon Rekognition Image bietet APIs zur Erkennung von Objekten, Szenen, bekannten Persönlichkeiten und anstößigen Inhalten, zur Erkennung und Analyse von Gesichtern, zum Gesichtsvergleich und zur Suche ähnlicher Gesichter in einer Gesichtssammlung. Darüber hinaus werden APIs zur Verwaltung von Ressourcen bereitgestellt. Rekognition Image bietet außerdem APIs für den Gesichtsabgleich und die Textextraktion, während Rekognition Video auch APIs zum Verfolgen von Personen und Verwalten von Livestreams von Acuity bietet. Weitere Informationen finden Sie in der API-Referenz zu Amazon Rekognition.

F: Welche Bild- und Videoformate werden von Amazon Rekognition unterstützt?

Amazon Rekognition Image unterstützt derzeit die Bildformate JPEG und PNG. Sie können Bilder entweder als S3-Objekt oder als Byte-Array übermitteln. Amazon Rekognition Video-Vorgänge können Videos analysieren, die in Amazon S3-Buckets gespeichert werden. Das Video muss mit dem H.264-Codec kodiert sein. Die Dateiformate MPEG-4 und MOV werden unterstützt. Bei einem Codec handelt es sich um Software oder Hardware, die Daten zur schnelleren Übertragung komprimiert und empfangene Daten in seine ursprüngliche Form dekomprimiert. Der Codec H.264 wird oft für das Aufzeichnen, Komprimieren und Verbreiten von Videoinhalten verwendet. Videodateiformate enthalten möglicherweise mehrere Codecs. Falls Videodateien in den Dateiformaten MOV und MPEG-4 nicht in Rekognition Video verarbeitet werden können, prüfen Sie, ob das Video mit H.264 kodiert wurde.

F: Welche Dateigrößen werden von Amazon Rekognition unterstützt?

Amazon Rekognition Image unterstützt eine Bildgröße von bis zu 15 MB bei der Übermittlung als S3-Objekt und eine Bildgröße von bis zu 5 MB bei der Übermittlung als Byte-Array. Amazon Rekognition Video unterstützt Dateien mit bis zu 10 GB und 6 Stunden Laufzeit, falls sie als S3-Dateien verarbeitet werden.

F: Wie wirkt sich die Bildauflösung auf die Qualität der Rekognition Image-API-Ergebnisse aus?

Amazon Rekognition funktioniert für ein breites Auflösungsspektrum. Um optimale Ergebnisse zu erzielen, empfehlen wir die Verwendung von VGA (640 x 480) oder höher. Bei einer Auflösung unter QVGA (320 x 240) ist das Risiko höher, dass Gesichter, Objekte oder unangemessene Inhalte nicht erkannt werden, obwohl Amazon Rekognition Bilder mit mindestens 80 Pixeln pro Seite unterstützt.

F: Wie groß muss ein Objekt mindestens sein, um von Amazon Rekognition Image erkannt und analysiert werden zu können?

Als Faustregel gilt, dass das kleinste Objekt oder Gesicht mindestens 5 % der kürzeren Bildseite ausmachen muss (in Pixeln). Beispiel: In einem 1 600 x 900 großen Bild müsste das kleinste Gesicht oder Objekt mindestens 45 Pixel auf jeder Seite umfassen.

F: Wie kann ich Amazon Rekognition-Prognosen von Menschen überprüfen lassen?

Amazon Rekognition ist direkt in Amazon Augmented AI (Amazon A2I) integriert, sodass Sie Vorhersagen mit geringer Zuverlässigkeit vom Amazon Rekognition Image an menschliche Prüfer weiterleiten können. Mithilfe der Amazon Rekognition-API für die Inhaltsmoderation oder der Amazon A2I-Konsole können Sie die Bedingungen festlegen, unter denen Amazon A2I Prognosen an die Prüfer weiterleitet. Dabei kann es sich entweder um einen Zuverlässigkeitswert oder einen Zufallsstichprobenanteil handeln. Wenn Sie einen Zuverlässigkeitswert festlegen, leitet Amazon A2I nur Prognosen an die Prüfer weiter, die unter diesem Wert liegen. Diese Schwellenwerte lassen sich jederzeit anpassen, sodass Sie den richtigen Kompromiss aus Genauigkeit und Kosten finden können. Alternativ können Sie einen Prozentsatz für Stichproben festlegen. Dann leitet Amazon A2I zufällige Stichproben an die Prüfer weiter. So lässt sich die Genauigkeit eines Modells regelmäßig überprüfen. Amazon A2I bietet Prüfern zudem eine Weboberfläche mit allen nötigen Anweisungen und Tools für ihre Prüfaufgaben. Weitere Informationen zur Überprüfung durch Menschen mit Amazon Rekognition finden Sie auf der Amazon A2I-Website.

F: Wie wirkt sich die Videoauflösung auf die Qualität der Rekognition Video-API-Ergebnisse aus?

Das System ist darauf trainiert, Gesichter zu erkennen, die größer als 32 Pixel (auf der kürzeren Bildseite) sind. Für die Erkennung ist also eine Mindestgesichtsgröße zwischen 1/7 der kürzeren Bildseite bei QVGA-Auflösung und 1/30 bei HD-1080p-Auflösung erforderlich. So müssen Benutzer beispielsweise bei VGA-Auflösung eine verringerte Leistung erwarten, wenn Gesichter erkannt werden sollen, die kleiner als 1/10 der kürzeren Bildseite sind.

F: Wodurch wird die Qualität der Rekognition Video-APIs außerdem eingeschränkt?

Neben der Auflösung beeinträchtigen Unschärfen, sich schnell fortbewegende Personen, Lichtverhältnisse und die Haltung der Zielperson die Qualität der APIs.

F: Welche Benutzervideoinhalte sind besonders geeignet für die Rekognition Video-APIs?

Diese API funktioniert am besten mit Videos, die mit Amateur- oder Profiausrüstung mit einem frontalen Sichtfeld in normalen Farb- und Lichtverhältnissen aufgenommen wurden. Diese API wurde nicht für Schwarzweißvideos, Infrarot oder extreme Lichtverhältnisse getestet. Für Anwendungen, bei denen falsche Alarme besonders heikel sind, sollten Ausgaben verworfen werden, wenn sie einen bestimmten festgelegten (anwendungsspezifischen) Zuverlässigkeitswert nicht erreichen.

F: In welchen AWS-Regionen ist Amazon Rekognition verfügbar? 

Eine Liste aller Regionen, in denen Amazon Rekognition verfügbar ist, entnehmen Sie der Tabellenübersicht zu den AWS-Regionen.

Erkennung von Objekten und Szenen

F: Was ist ein Label?

Ein Label beschreibt ein Objekt, eine Szene oder ein Konzept in einem Bild. Ein Foto von einem tropischen Strand kann zum Beispiel Labels wie „Person“, „Water“, „Sand“, „Palm Tree“, „Swimwear“ (Objekt), „Beach“ (Szene) und „Outdoors“ (Konzept) enthalten. 

F: Was bedeutet „Zuverlässigkeitswert“ und wie ist dieser Wert zu verstehen?

Der Zuverlässigkeitswert ist eine Zahl zwischen 0 und 100, die auf die Wahrscheinlichkeit hinweist, dass eine bestimmte Vorhersage zutrifft. Wenn im Beispiel mit dem tropischen Strand der Prozess zur Objekt- und Szenenerkennung einen Zuverlässigkeitswert von 99 für das Label "Wasser" und 35 für das Label "Palme" ergibt, ist die Wahrscheinlichkeit, dass das Bild Wasser enthält, höher als die Wahrscheinlichkeit, dass eine Palme vorhanden ist.

Anwendungen, die sehr anfällig für Erkennungsfehler sind (falsch positives Ergebnis) sollten Ergebnisse verwerfen, die einem Zuverlässigkeitswert unter einem bestimmten Schwellenwert zugeordnet sind. Der optimale Schwellenwert ist abhängig von der Anwendung. In vielen Fällen wird eine optimale Benutzererfahrung gewährleistet, wenn der minimale Zuverlässigkeitswert höher als der Standardwert eingestellt wird.

F: Was ist die Erkennung von Objekten und Szenen?

Bei der Erkennung von Objekten und Szenen wird ein Bild bzw. Video analysiert, um diesem Bild basierend auf seinen visuellen Inhalten Labels zuzuweisen. Für diesen Prozess verwendet Amazon Rekognition Image die DetectLabels-API. Die API ermöglicht die automatische Erkennung Tausender Objekte, Szenen und Konzepte, und sie gibt einen Zuverlässigkeitswert für jedes Label zurück. DetectLabels verwendet einen standardmäßigen Schwellenwert von 50. Die Erkennung von Objekten und Szenen ist ideal für Kunden, die große Bildbibliotheken durchsuchen und organisieren möchten, darunter Kunden- und Lifestyle-Anwendungen auf Basis von Inhalten, die von Benutzern generiert werden, sowie Technologieunternehmen, die ihre Targeting-Algorithmen verbessern möchten.

F: Kann Amazon Rekognition Objektpositionen erkennen und Begrenzungsrahmen zurückgeben?

Ja, Amazon Rekognition kann den Standort vieler gängiger Objekte wie "Person", "Car", "Gun" oder "Dog" in Bildern und Videos erkennen. Sie erhalten die Koordinaten des umschließenden Rechtecks für jede Instanz des gefundenen Objekts sowie einen Vertrauenswert. Weitere Informationen zur API-Antwortstruktur für Objektbegrenzungsrahmen finden Sie in der Dokumentation.

F: Liefert Amazon Rekognition Informationen über die Beziehung zwischen erkannten Labels?

Ja, für jedes gefundene Label gibt Amazon Rekognition die übergeordneten Labels zurück, falls sie existieren. Überordnungen werden in hierarchischer Reihenfolge zurückgegeben - das linke Label ist die unmittelbare Überordnung oder Synonym, während die folgenden Labels Überordnungen von Überordnungen sind. Wenn beispielsweise ein "Car" identifiziert wird, gibt Amazon Rekognition zwei übergeordnete Labels zurück: "Vehicle" (übergeordnet) und "Transportation" (übergeordnet von übergeordneten). Weitere Informationen zur Verwendung hierarchischer Taxonomiebeziehungen finden Sie in der Dokumentation.

F: Welche Arten von Labels unterstützt Amazon Rekognition?

Rekognition unterstützt Tausende von Labels zu gängigen Kategorien wie beispielsweise:

  • Personen und Veranstaltungen: "Wedding", "Bride", "Baby", "Birthday Cake", "Guitarist" usw.
  • Essen und Trinken: "Apple", "Sandwich", "Wine", "Cake", "Pizza" usw.
  • Natur und Outdoor: "Beach", "Mountains", "Lake", "Sunset", "Rainbow" usw.
  • Tiere und Haustiere: "Dog", "Cat", "Horse", "Tiger", "Turtle" usw.
  • Haus und Garten: "Bed", "Table", "Backyard", "Chandelier", "Bedroom" usw.
  • Sport und Freizeit: "Golf", "Basketball", "Hockey", "Tennis", "Hiking" usw.
  • Pflanzen und Blumen: "Rose", "Tulip", "Palm Tree", "Forest", "Bamboo" usw.
  • Kunst und Unterhaltung: "Sculpture", "Painting", "Guitar", "Ballet", "Mosaic" usw.
  • Transport und Fahrzeuge: "Airplane", "Car", "Bicycle", "Motorcycle", "Truck" usw.
  • Elektronik: „Computer“, „Mobile Phone“, „Video Camera“, „TV“, „Headphones“ usw.

F: Inwiefern underscheidet sich die Erkennung von Objekten und Szenen bei der Videoanalyse?

Rekognition Video ermöglicht Ihnen, automatisch Tausende von Objekten (z. B. Fahrzeuge oder Haustiere) und Aktivitäten (z. B. Feiern oder Tanzen) zu erkennen, und zeigt für alle Label Zeitstempel und Zuverlässigkeitswerte an. Außerdem nutzt es Bewegungs- und Zeitkontext im Video, um komplexe Aktivitäten wie das Ausblasen von Kerzen oder das Löschen eines Feuers genau zu identifizieren.

F: Ich kann das gewünschte Label nicht finden. Wie kann ich ein neues Label anfordern?

Bitte senden Sie Ihre Anfragen an den AWS-Kundensupport. Der Label-Katalog von Amazon Rekognition wird basierend auf Kunden-Feedback kontinuierlich erweitert.

F: Wie können Sie überprüfen, ob Amazon Rekognition seine Modelle aktualisiert hat?

Amazon Rekognition gibt einen LabelModelVersion-Parameter zurück, der Sie darüber informiert, ob das Modell aktualisiert wurde. Objekt- und Szenenerkennungsmodelle werden häufig auf der Grundlage von Kundenfeedback aktualisiert.

Amazon Rekognition Custom Labels

F: Kann ich Custom Labels zur Analyse von Gesichtern, benutzerdefinierter Texterkennung oder zur Erfassung unsicherer Bildinhalte verwenden?

Nein. Custom Labels ist darauf ausgelegt, Objekte und Szenen in Bildern zu erfassen. Custom Labels ist nicht zur Analyse von Gesichtern, benutzerdefinierter Texterkennung oder zur Erfassung unsicherer Bildinhalte geeignet. Für diese Aufgaben müssen Sie Rekognition-APIs verwenden. In der Dokumentation finden Sie weitere Informationen zur Gesichtsanalyse, Texterkennung und Moderation.

F: Wie viele Bilder sind erforderlich, um ein benutzerdefiniertes Modell zu trainieren?

Die Anzahl der Bilder, die zum Trainieren eines benutzerdefinierten Modells benötigt werden, hängt von der Vielseitigkeit der benutzerdefinierten Labels, die das Modell vorhersagen soll, und der Qualität der Trainingsdaten ab. So kann beispielsweise ein eindeutiges Logo auf einem Bild mit 1–2 Trainingsbildern erkannt werden. Bei einem subtileren Logo, das in vielen Variationen (Maßstab, Blickwinkel, Verformungen) erkannt werden muss, können zehn bis hundert Trainingsbeispiele mit hochwertigen Anmerkungen erforderlich sein. Wenn Sie bereits eine große Anzahl von beschrifteten Bildern haben, empfehlen wir Ihnen, ein Modell mit allen Bildern zu trainieren, die Sie zur Verfügung haben. Informationen zur Maximalgröße von Trainingsdatensätzen finden Sie in der Dokumentation.

Obwohl manchmal Hunderte von Bildern erforderlich sind, um ein benutzerdefiniertes Modell mit hoher Genauigkeit zu trainieren, können Sie mit Custom Labels zunächst ein Modell mit Dutzenden von Bildern pro Etikett trainieren und dann Ihre Testergebnisse überprüfen und ggf. neue Trainingsbilder hinzufügen und Ihr Modell erneut trainieren, um Ihr es iterativ zu verbessern.

F: Wie viele Inferenz-Rechenressourcen muss ich für mein benutzerdefiniertes Modell bereitstellen?

Die Anzahl der benötigten parallelen Inferenz-Rechenressourcen ist davon abhängig, wie viele Bilder Sie zu einem bestimmten Zeitpunkt verarbeiten müssen. Der Durchsatz einer einzelnen Ressource hängt von Faktoren wie der Größe der Bilder, der Komplexität dieser Bilder (wie viele erkannte Objekte sichtbar sind) und der Komplexität Ihres benutzerdefinierten Modells ab. Wir empfehlen Ihnen, die Häufigkeit, mit der Sie Ihr benutzerdefiniertes Modell bereitstellen müssen, und die Anzahl der Bilder, die gleichzeitig verarbeitet werden müssen, zu überwachen, um die Bereitstellung Ihres benutzerdefinierten Modells möglichst effizient zu planen.
Wenn Sie erwarten, Bilder regelmäßig zu verarbeiten (z.B. einmal täglich oder wöchentlich oder zu geplanten Zeiten während des Tages), sollten Sie mit der Bereitstellung Ihres benutzerdefinierten Modells zu einem geplanten Zeitpunkt beginnen, alle Ihre Bilder verarbeiten und dann die Bereitstellung stoppen. Wenn Sie die Bereitstellung nicht einstellen, werden Ihnen Gebühren berechnet, auch wenn keine Bilder verarbeitet werden.

F: Meine Schulung ist fehlgeschlagen. Fallen trotzdem Kosten an?

Nein. Für die Rechenressourcen fallen keine Kosten an, wenn Ihre Schulung nicht erfolgreich ist.

Erkennung unsicherer Inhalte

F: Was ist die Erkennung unsicherer Inhalte?

Die Erkennung unsicherer Inhalte von Amazon Rekognition ist eine Deep-Learning-basierte, benutzerfreundliche API zur Erkennung unangemessener oder mehrdeutiger Erwachseneninhalte, gewalttätiger Inhalte, Waffen und visuell störender Inhalte in Bildern und Videos. Neben dem Markieren eines Bilds basierend auf dem Vorhandensein von Erwachseneninhalten gibt Amazon Rekognition auch eine hierarchische Liste mit Bewertungen zurück. Diese Bewertungen geben bestimmte Kategorien von Erwachseneninhalten an und stellen so Entwicklern eine genauere Kontrolle bereit, um große Mengen an von Benutzern generierten Inhalten (User Generated Content, UGC) zu filtern und zu verwalten. Diese API kann in Moderations-Workflows für Anwendungen wie Social Network- oder Dating-Websites, Fotofreigabeplattformen, Blogs und Foren, Apps für Kinder, E-Commerce-Websites, Unterhaltungs- und Onlinewerbeservices verwendet werden.

F: Welche Arten von unsicheren Inhalten erkennt Amazon Rekognition?

Amazon Rekognition erkennt die folgenden Arten von unangemessenen und mehrdeutigen Erwachseneninhalten in Bildern:

Detaillierte Nacktheit:

  • Nacktheit
  • Grafische Nacktheit (männlich)
  • Grafische Nacktheit (weiblich)
  • Sexuelle Aktivität
  • Illustrierte Nacktheit oder sexuelle Aktivität
  • Erwachsenen-Spielzeuge

Mehrdeutig:

  • Schwimmkleidung oder Unterwäsche (weiblich)
  • Schwimmkleidung oder Unterwäsche (männlich)
  • Teilweise Nacktheit
  • Freizügige Kleidung

Die Image Moderation-API von Amazon Rekognition gibt eine Hierarchie mit Kategorien sowie eine Bewertung für jede entdeckte Kategorie zurück. Rekognition kann bei einem unangemessenen Bild beispielsweise "Explicit Nudity" (detaillierte Nacktheit) mit einer sehr hohen Bewertung zurückgeben. Entwickler können damit Inhalte entsprechend markieren. In der gleichen Antwort gibt Rekognition außerdem eine zweite Genauigkeitsstufe zurück, indem zusätzlicher Kontext wie "Graphic Male Nudity" (grafische Nacktheit (männlich)) mit einer eigenen Bewertung bereitgestellt wird. Entwickler können mit diesen Informationen eine komplexere Filterlogik erstellen, um verschiedene Regionen und Demografien zu bedienen.

Darüber hinaus kann Amazon Rekognition die folgenden Arten von gewalttätigen und visuell störenden Inhalten erkennen:

Gewalt:

  • Grafische Gewalt oder Blut
  • Körperliche Gewalt
  • Waffengewalt
  • Waffen
  • Selbstverletzung

Optisch störend:

  • Ausgemergelte Körper
  • Leichen
  • Hinrichtung

Bitte beachten Sie, dass die API für die Erkennung unangemessener und mehrdeutiger Erwachseneninhalte keinen erschöpfenden Filter darstellt oder zu sein vorgibt. Außerdem erkennt diese API nicht, ob ein Bild illegale Inhalte (z. B. Kinderpornografie) oder unnatürliche Erwachseneninhalte enthält.

F: Kann die API von Amazon Rekognition für die Erkennung unsicherer Inhalte andere ungeeignete Inhalte neben unangemessenen und mehrdeutigen Erwachseneninhalten erkennen?

Derzeit unterstützt Rekognition nur die oben erläuterten Kategorien. Wir arbeiten fortlaufend daran, Kategorien basierend auf Feedback von Kunden hinzuzufügen und zu verbessern.

Wenn Sie andere Arten unangemessener Inhalte in Bildern erkennen müssen, wenden Sie sich bitte über den weiter unten in diesem Abschnitt erläuterten Feedback-Prozess an uns.

F: Wo sehe ich, welche Version des Modells ich derzeit verwende?

Amazon Rekognition verbessert seine Modelle regelmäßig. Um die Modellversion nachzuverfolgen, können Sie das Feld „ModerationModelVersion“ in der API-Antwort verwenden.

F: Wie kann ich sicherstellen, dass Amazon Rekognition die Genauigkeitsziele für meinen unsicheren Anwendungsfall für die Bild- oder Videoerkennung erfüllt?

Die Modelle von Amazon Rekognition für die Erkennung unsicherer Inhalte wurden umfangreich optimiert und getestet, aber wie empfehlen Ihnen, die Genauigkeit Ihrer eigenen Datensätze zu messen, um die Leistung einzuordnen.

Sie können den "MinConfidence"-Parameter in Ihren API-Anforderungen verwenden, um ein Gleichgewicht zwischen der Inhaltserkennung und der Genauigkeit der Erkennung herzustellen. Wenn Sie "MinConfidence" reduzieren, werden Sie höchstwahrscheinlich die meisten unangemessenen Inhalte erkennen, markieren aber möglicherweise auch Inhalte, die in Wirklichkeit weder unangemessen noch mehrdeutig sind. Wenn Sie "MinConfidence" erhöhen, stellen Sie wahrscheinlich sicher, dass alle erkannten Inhalte tatsächlich unangemessen oder mehrdeutig sind, allerdings werden einige unangemessene Inhalte möglicherweise nicht erkannt. Beispiele zum Verwenden von „MinConfidence“ für Bilder finden Sie hier in der Dokumentation.

F: Wie kann ich Feedback zu Rekognition geben, um die Erkennung unsicherer Inhalte zu verbessern?

Bitte senden Sie Ihre Anfragen über den AWS-Kundensupport. Amazon Rekognition erweitert basierend auf dem Kundenfeedback fortlaufend die Arten unangemessener Inhalte, die erkannt werden. Bitte beachten Sie, dass illegale Inhalte (z. B. Kinderpornografie) durch diesen Prozess nicht verarbeitet werden.

Gesichtsanalyse

F: Was ist die Gesichtsanalyse?

Mit der Gesichtsanalyse lassen sich Gesichter innerhalb von Bildern erkennen und davon ausgehend relevante Gesichtsattribute erfassen. Amazon Rekognition Image gibt für jedes Gesicht, das in einem Bild erkannt wird, den Begrenzungsrahmen sowie Attribute wie Geschlecht, Vorhandensein einer Sonnenbrille und Gesichtserkennungspunkte zurück. Rekognition Video gibt die Gesichter, die in einem Video erkannt wurden, mit Zeitstempeln, der Position und einem Begrenzungsrahmen mit Gesichtserkennungspunkten zurück.

F: Welche Gesichtsattribute kann ich mit Amazon Rekognition erfassen?

Amazon Rekognition gibt für jedes erkannte Gesicht die folgenden Gesichtsattribute sowie einen Begrenzungsrahmen und den Zuverlässigkeitswert für jedes Attribut zurück:

  • Geschlecht
  • Lächeln
  • Stimmung
  • Brille
  • Sonnenbrille
  • Augen geöffnet
  • Mund geöffnet
  • Schnauzbart
  • Bart
  • Position
  • Qualität
  • Gesichtsmerkmale

F: Was ist die Gesichtsposition?

Die Gesichtsposition bezeichnet die Rotation eines erkannten Gesichtes auf der Nick-, Roll- und Gierachse. Jeder dieser Parameter wird als ein Winkel zwischen -180 und +180 Grad zurückgegeben. Anhand der Gesichtsposition kann die Ausrichtung des Polygons um das Gesicht herum ermittelt werden (im Gegensatz zum rechteckigen Begrenzungsrahmen), um Abweichungen zu messen, Gesichter präzise nachzuverfolgen usw.

F: Was ist die Gesichtsqualität?

Die Gesichtsqualität beschreibt die Qualität des erkannten Bildes mithilfe der beiden Parameter Schärfe und Helligkeit. Beide Parameter werden als Werte zwischen 0 und 1 zurückgegeben. Sie können einen Schwellenwert auf diese Parameter anwenden, um optimal beleuchtete und scharf dargestellte Gesichter herauszufiltern. Dies ist für Anwendungen nützlich, in denen die Qualität der Gesichtsaufnahmen wichtig ist, zum Beispiel für Gesichtsvergleich und Gesichtserkennung.

F: Was sind Gesichtsmerkmale?

Gesichtsmerkmale sind eine Reihe von hervorstehenden Punkten, die sich normalerweise am Rand, an der Spitze oder in der Mitte von wichtigen Gesichtsteilen wie Augen, Nase und Mund befinden. Die DetectFaces-API von Amazon Rekognition gibt eine Gruppe von Gesichtsmerkmalen zurück, die Ihnen dabei helfen, Gesichter freizustellen, ein Gesicht mit einem anderen Gesicht zu kombinieren, durch Überlagern benutzerdefinierter Masken individuelle Filter zu erstellen usw.

F: Wie viele Gesichter können in einem Bild erkannt werden?

Mit Amazon Rekognition lassen sich bis zu 100 Gesichter in einem Bild erkennen.

F: Inwiefern unterscheidet sich die Gesichtsanalyse für die Videoanalyse?

Mit Rekognition Video können Sie Gesichter innerhalb von Videos erkennen und Gesichtsmerkmale analysieren; so kann analysiert werden, ob das Gesicht lächelt, ob die Augen geöffnet sind oder ob Emotionen erkennbar sind. Rekognition Video gibt die erkannten Gesichter mit Zeitstempeln, der Position und einem Begrenzungsrahmen mit Gesichtserkennungspunkten (z. B. linkes Auge, rechtes Auge, Nase, linker Mundwinkel, rechter Mundwinkel) zurück. Diese Positions- und Zeitinformationen lassen sich dazu einsetzen, die Stimmung des Benutzers im Lauf der Zeit zu erfassen und weitere Funktionen wie das automatische Umrahmen, Hervorheben oder Zentrieren von Gesichtern bereitzustellen.

F: Was außer der Videoauflösung beeinflusst die Qualität der Rekognition Video-APIs?

Neben der Videoauflösung spielen die Qualität und der repräsentative Teil der zu durchsuchenden Gesichtssammlungen eine große Rolle. Die Nutzung verschiedener Gesichtsbeispiele pro Person mit verschiedenen Variationen z. B. Bart, Brille, Pose (Profil und Frontal) verbessert die Leistung enorm. In der Regel ist die Qualität bei sich schnell fortbewegenden Menschen und verschwommenen Videos vermindert.

Gesichtsvergleich

F: Was ist der Gesichtsvergleich?

Beim Gesichtsvergleich wird ein Gesicht mit einem oder mehreren Gesichtern verglichen, um die Ähnlichkeit zu messen. Mit der CompareFaces-API von Amazon Rekognition Image können Sie die Wahrscheinlichkeit messen, mit der Gesichter in zwei Bildern von derselben Person stammen. Die API vergleicht ein Gesicht im Quellbild mit jedem Gesicht, das im Zielbild erkannt wurde, und gibt für jeden Vergleich einen Ähnlichkeitswert zurück. Für jedes erkannte Gesicht wird außerdem ein Begrenzungsrahmen und ein Zuverlässigkeitswert angegeben. Mit der Funktion zum Gesichtsvergleich können Sie die Identität einer Person anhand eines bereits gespeicherten persönlichen Fotos nahezu in Echtzeit überprüfen.

F: Kann ich ein Quellbild mit mehr als einem Gesicht verwenden? 

Ja. Wenn das Quellbild mehrere Gesichter enthält, erkennt CompareFaces das größte Gesicht und vergleicht es mit jedem erkannten Gesicht im Zielbild.

F: Mit wie vielen Gesichtern kann ich ein Gesicht vergleichen?

Sie können ein Gesicht im Quellbild mit bis zu 15 erkannten Gesichtern im Zielbild vergleichen.

Gesichtserkennung

F: Was ist die Gesichtserkennung?

Bei der Gesichtserkennung wird die Identität einer Person erkannt oder überprüft, indem eine Sammlung von Gesichtern nach dem entsprechenden Gesicht durchsucht wird. Die Gesichtserkennung kann ganz einfach in Anwendungen eingebunden werden, zum Beispiel für die Multifaktor-Authentifizierung für Bankzahlungen oder den automatisierten Zugang zu Bürogebäuden.

F: Was ist eine Gesichtssammlung, und wie kann ich sie erstellen?

Eine Gesichtssammlung ist ein durchsuchbarer Index mit Gesichtsmerkmalen in Form von Vektoren, die Sie besitzen und verwalten. Mit der CreateCollection-API können Sie ganz einfach eine Sammlung in einer von AWS unterstützten Region erstellen und einen Amazon-Ressourcennamen (ARN) erhalten. Jeder Gesichtssammlung ist eine eindeutige CollectionId zugewiesen.

F: Wie kann ich Gesichter zu einer Sammlung hinzufügen oder aus einer Sammlung löschen?

Um ein Gesicht zu einer vorhandenen Gesichtssammlung hinzuzufügen, verwenden Sie die IndexFaces-API. Diese API nimmt ein Bild in Form eines S3-Objekts oder Byte-Arrays an und fügt eine Vektordarstellung der erkannten Gesichter zur Gesichtssammlung hinzu. IndexFaces gibt außerdem eine eindeutige FaceId und einen Begrenzungsrahmen für jedes hinzugefügte Bild zurück.

Um ein Gesicht aus einer vorhandenen Gesichtssammlung zu löschen, verwenden Sie die DeleteFaces-API. Diese API greift auf die bereitgestellte Gesichtssammlung zu (mithilfe einer CollectionId), und entfernt die Einträge, die der Liste der FaceIds entsprechen. Weitere Informationen zum Hinzufügen und Löschen von Gesichtern finden Sie im Beispiel zur Verwaltung von Sammlungen.

F: Wie kann ich innerhalb einer Gesichtssammlung nach einem Gesicht suchen?

Sobald Sie eine indizierte Gesichtssammlung erstellt haben, können Sie sie entweder anhand eines Bildes (SearchFaceByImage) oder einer FaceId (SearchFaces) nach einem Gesicht durchsuchen. Diese APIs überprüfen ein eingegebenes Bild und geben eine Gruppe an übereinstimmenden Gesichtern zurück, die nach Ähnlichkeitsgrad geordnet sind, das heißt, das Bild mit der größten Ähnlichkeit wird als Erstes angezeigt. Weitere Informationen finden Sie im Beispiel zum Suchen nach Gesichtern.

F: Inwiefern unterscheidet sich die Gesichtserkennung für die Videoanalyse?

Rekognition Video ermöglicht das Durchführen von Echtzeitgesichtssuchen anhand von Sammlungen, die Millionen Gesichter enthalten. Hierzu wird zunächst eine Sammlung aus Gesichtern erstellt, in der Gesichter in Form von Vektorrepräsentationen von Gesichtsmerkmalen gespeichert werden. Rekognition durchsucht dann die Gesichtssammlung nach optisch ähnlichen Gesichtern im gesamten Video. Rekognition gibt für jedes Gesicht im Video einen Zuverlässigkeitswert aus, sodass Sie in Ihrer Anwendung nur die wahrscheinlichen Treffer anzeigen können.

F: Was außer der Videoauflösung beeinflusst die Qualität der Video-APIs?

Neben der Videoauflösung spielen die Qualität und der repräsentative Teil der zu durchsuchenden Gesichtssammlungen eine große Rolle. Die Nutzung verschiedener Gesichtsbeispiele pro Person mit verschiedenen Variationen z. B. Bart, Brille, Pose (Profil und Frontal) verbessert die Leistung enorm. In der Regel werden sich sehr schnell fortbewegende Personen sehr schlecht erkannt. Außerdem ist die Qualität bei verschwommenen Bildern geringer.

Erkennung von Prominenten

F: Was ist die Celebrity Recognition?

Die Celebrity Recognition-API von Amazon Rekognition ist eine benutzerfreundliche Deep-Learning-basierte API für die Erkennung von prominenten, bemerkenswerten oder auf ihrem Gebiet herausragenden Persönlichkeiten. Die RecognizeCelebrities-API ist für große Datenmengen konzipiert und erkennt Persönlichkeiten aus den verschiedensten Bereichen wie Politik, Sport, Wirtschaft, Entertainment und Medien. Damit ist diese Persönlichkeitserkennung ideal für Amazon-Kunden, die ihre digitalen Bildbibliotheken nach Personen ihres Interesses durchsuchen möchten.

F: Wer kann durch die Celebrity Recognition-API erkannt werden?

Amazon Rekognition kann nur Persönlichkeiten erkennen, auf die die Deep-Learning-Modelle trainiert wurden. Dabei ist und bezweckt die RecognizeCelebrities-API in keiner Weise, eine Autorität bzw. eine umfassende Liste aller bekannten und berühmten Personen zu sein. Diese Funktion kennt die Daten einer großen Palette an Persönlichkeiten, die nach Anforderungen und Feedback unserer Kunden zusammengestellt wurde. Amazon fügt laufend neue Namen hinzu. Der Fakt aber, dass Recognize Celebrities nicht alle Personen erkennt, die von anderen Gruppierungen oder unseren Kunden als prominent bezeichnet werden, hat keinerlei Aussagekraft hinsichtlich unserer Meinung zum Berühmtheitsstatus einzelner Personen. Falls Sie gerne weitere Persönlichkeiten in die Liste der von der Persönlichkeitserkennung erkannten Personen aufnehmen würden, senden Sie uns hierzu ihr Feedback.

F: Kann eine durch die Amazon Rekognition-API erkannte Person verlangen, aus dieser Funktion entfernt zu werden?

Ja. Eine Person, die nicht in dieser Funktion geführt sein will, kann via E-Mail eine entsprechende Anfrage an den AWS-Kundenservice senden. Wir werden die Entfernung sofort veranlassen.

F: Welche Quellen mit weiteren Informationen zu einer Persönlichkeit werden unterstützt?

Die API unterstützt eine optionale Liste mit Quellen, die weitere Informationen zu einer Persönlichkeit bereitstellen. Diese ist Bestandteil der API-Rückgabe. Derzeit stellen wir die IMDB-URL bereit, sofern verfügbar. Weitere Quellen können noch hinzukommen.

F: Inwiefern unterscheidet sich die Persönlichkeitserkennung für die Videoanalyse?

Rekognition Video ermöglicht Ihnen zu erkennen, wann und wo bekannte Persönlichkeiten in einem Video auftauchen. Die Ausgabe mit Zeitstempel zeigt den Namen und die eindeutige Kennung der Persönlichkeit, die Koordinaten des Begrenzungsrahmens, den Zuverlässigkeitswert sowie URLs zu weiteren Inhalten zur betreffenden Person an, beispielsweise den IMDB-Link der Person. Die Persönlichkeit wird auch erkannt, wenn ihr Gesicht im Video teilweise verdeckt wird. Diese Funktion ermöglicht, digitale Videobibliotheken für Anwendungsfälle hinsichtlich spezifischer Marketing- und Medienanforderungen zu indizieren und zu durchsuchen.

F: Was außer der Videoauflösung beeinflusst die Qualität der Rekognition Video-APIs?

Sich sehr schnell bewegende Persönlichkeiten und verschwommene Videoaufnahmen beeinträchtigen möglicherweise die Qualität der Rekognition Video-APIs. Des Weiteren beeinträchtigen starkes Make-up und andere Täuschungsmaßnahmen, zu denen viele Schauspieler greifen, die Qualität.

Texterkennung

F: Was ist Texterkennung?

Texterkennung ist eine Funktion von Amazon Rekognition, mit der Sie Text in Bildern oder Videos, wie Straßennamen, Bildunterschriften, Produktnamen, eingeblendete Grafiken, Videountertitel und Autokennzeichen, ermitteln und erkennen können. Texterkennung wurde speziell auf reale Bilder und Videos statt auf Abbildungen in Dokumenten ausgelegt. Die DetectText-API von Amazon Rekognition verarbeitet ein Bild und gibt die Textkennung sowie einen Begrenzungsrahmen für jede ermittelte Zeichenkette mit einem Zuverlässigkeitswert aus. In Social Media- und Image Sharing-Anwendungen können Sie beispielsweise eine visuelle Suche basierend auf einem Index an Bildern aktivieren, die dieselben Textkennungen enthalten. In Sicherheitsanwendungen können Sie Fahrzeuge anhand von Autokennzeichen auf Bildern ermitteln, die mit Verkehrskameras aufgenommen wurden. Entsprechend können Sie bei Videos mit den StartTextDetection- und GetTextDetection-APIs Text erkennen und Zuversichtlichkeitsbewertungen und Zeitstempel für jede Erkennung erhalten. In Medien- und Unterhaltungsanwendungen können Sie Text-Metadaten erstellen, um Suchen nach relevanten Inhalten, wie Nachrichten, Sportergebnissen, Werbung und Bildunterschriften, zu unterstützen. Sie können den erkannten Text auch auf Richtlinien- oder Compliance-Verstöße überprüfen, z. B. eine E-Mail-Adresse oder Telefonnummer, die von Spammern überdeckt wurde.

F: Welche Textarten unterstützt Amazon Rekognition Texterkennung?

Texterkennung wurde speziell auf reale Bilder und Videos statt auf Abbildungen in Dokumenten ausgelegt. Die Funktion unterstützt die meisten lateinischen Schriften und Ziffern, die in einer großen Vielfalt von Layouts, Schriftarten und Schriftschnitten integriert sind. Sie unterstützt zudem Hintergrundobjekte wie Banner oder Plakate, die mit Text in unterschiedlichen Ausrichtungen überlagert sind. Texterkennung erkennt bis zu 50 Zeichenfolgen pro Bild oder Video und listet diese als Wörter und Zeilen auf. Texterkennung unterstützt Text, der um bis zu -90 bis +90 Grad von der horizontalen Achse aus gedreht wurde.

F: Kann ich die Texterkennung auf bestimmte Regionen in einem Bild oder Video beschränken?

Ja, Sie können mit den Filteroptionen der Texterkennung bis zu 10 interessante Regionen in der API-Anforderung angeben. Amazon Rekognition gibt nur Text zurück, der innerhalb dieser Regionen liegt. 

F: Kann ich die Texterkennung nach Wortzuverlässigkeit oder Größe des Begrenzungsrahmens filtern?

Ja, in der API-Anforderung können Sie die Filteroptionen für die Texterkennung verwenden, um Schwellenwerte für die minimale Zuversichtlichkeitsbewertung oder die minimalen Abmessungen des Begrenzungsrahmens anzugeben.

F: Wie kann ich Feedback zu Rekognition geben, um die Texterkennung zu verbessern?

Bitte senden Sie Ihre Anfragen über den AWS-Kundensupport. Amazon Rekognition erweitert basierend auf dem Kundenfeedback fortlaufend die erkannten Typen von Textinhalten.

Amazon Rekognition Video

F: Welche Arten von Entitäten kann Amazon Rekognition Video erkennen?
Amazon Rekognition Video kann Objekte, Szenen, Gesichter, Prominente, Text und unangemessene Inhalte in Videos erkennen. Außerdem können Sie mithilfe eigener Repositorys oder Sammlungen von Gesichtsbildern nach Gesichtern suchen, die in einem Video auftauchen.

F: Welche Dateiformate und Codecs werden von Amazon Rekognition Video unterstützt?
Amazon Rekognition Video unterstützt H.264-Dateien im MPEG-4- (MP4) oder MOV-Format. Wenn Ihre Videodateien einen anderen Codec verwenden, können Sie sie mit AWS Elemental MediaConvert in H.264 transcodieren.

F: Wie funktionieren asynchrone Amazon Rekognition Video-APIs? 
Amazon Rekognition Video kann Videos verarbeiten, die in Amazon S3-Buckets gespeichert sind. Sie können eine asynchrone Gruppe von Vorgängen nutzen: Sie beginnen die Videoanalyse durch den Aufruf eines Start-Vorgangs wie etwa StartLabelDetection zur Erkennung von Objekten und Szenen. Der Fortschritt der Anforderung wird in einem Thema des Amazon Simple Notification Service (SNS) veröffentlicht. Zum Abrufen des Fortschritts aus dem Amazon SNS-Thema verwenden Sie eine Warteschlange von Amazon Simple Queue Service (SQS) oder eine AWS Lambda-Funktion. Sobald Sie den Fortschritt abgerufen haben, rufen Sie einen Get-Vorgang (z. B. GetLabelDetection) auf, um die Ergebnisse der Anforderung abzurufen. Eine Liste der verfügbaren Amazon Rekognition Video-APIs finden Sie auf dieser Seite.

F: Wie finde ich die Zeitachse für erkannte Objekte in einem Video?
Amazon Rekognition Video gibt für jede erkannte Entität auf der Videozeitachse Zeitstempel in Millisekunden zurück. So kann zum Beispiel mithilfe der Label-Erkennung ein "Hund" 166 ms nach dem Start eines Videos gefunden werden. Anhand dieser Informationen können Sie die Zeitachse eines Objekts oder Prominenten im Video nachvollziehen. Eine API-Beispielantwort mit Zeitstempeln finden Sie auf dieser Seite zum Erkennen von Objekten und Szenen in Amazon Rekognition Video.

F: Wie viele gleichzeitige Aufgaben zur Videoanalyse kann ich mit Amazon Rekognition Video ausführen?
Mit Amazon Rekognition Video können sie bis zu 20 Aufgaben gleichzeitig verarbeiten. Weitere Einzelheiten zu Limits finden Sie auf der Seite zu Obergrenzen.

F: Welche Videoauflösung sollte ich verwenden?
Amazon Rekognition Video verarbeitet automatisch Videos in ganz unterschiedlicher Auflösung und Qualität. Um optimale Ergebnisse zu erzielen, empfehlen wir eine Auflösung von 720p (1280 × 720 Pixel) bis 1080p (1920 x 1080 Pixel) oder entsprechende Auflösungen in anderen Seitenverhältnissen. Sehr niedrige Auflösungen (wie etwa QVGA oder 240p) und Videos in äußerst geringer Qualität können sich negativ auf die Qualität der Ergebnisse auswirken.

F: Wie analysiere ich Videos in Echtzeit?
Im Streamingmodus können Sie Gesichter in Echtzeit mit einer Sammlung von Gesichtsbildern abgleichen. Die Rekognition Video-APIs für die Gesichtersuche lassen sich standardmäßig in Videostreams von Amazon Kinesis Video Streams einbetten. Hierbei handelt es sich um einen Service, mit dem Entwickler Tausende Live-Feeds und zugehörige Metadaten übertragen können. Hinsichtlich Sicherheitsanwendungen für Unternehmen erleichtert und präzisiert dies die Echtzeiterkennung von Personen von besonderem Interesse.

F: Funktioniert Amazon Rekognition Video mit Amazon Kinesis Video Streams?
Bei der Verarbeitung von Videostreams verwendet Rekognition Video Kinesis-Video-Streams als Eingabe. Die Analyseergebnisse werden von Rekognition Video an einen Kinesis-Datenstrom ausgegeben und schlussendlich von der Clientanwendung gelesen. Rekognition Video umfasst einen Streamprozessor, mit dem Sie die Analyse gestreamter Videos starten und steuern können. Weitere Informationen finden Sie unter Verwendung gestreamter Videos.

F: Was ist die Wegverfolgung von Personen (People Pathing)?
Mit Rekognition Video können Sie den Weg einzelner Personen entlang der Videozeitachse nachverfolgen. Rekognition Video entdeckt Personen auch, wenn die Kamera in Bewegung ist, und gibt für jede Person einen Begrenzungsrahmen und das Gesicht sowie die Gesichtsattribute und Zeitstempel zurück. Hinsichtlich Anwendungen für den Einzelhandel ermöglicht dies das anonyme Generieren von Einblicken in das Kundenverhalten, etwa dazu, wie sich Kunden durch die Gänge eines Geschäfts bewegen oder wie lange sie an der Kasse anstehen.

Medienanalysen mit Amazon Rekognition Video

F: Welche Arten von Medienanalysen kann Amazon Rekognition Video durchführen?
Amazon Rekognition Video kann derzeit vier Arten gängiger operativer Aufgaben zur Medienanalyse durchführen:

  • Erkennung schwarzer Einzelbilder: Videos enthalten oft eine kurze Folge leerer schwarzer Einzelbilder ohne Ton, die als Hinweise zum Einfügen von Werbung dienen oder zur Abgrenzung des Endes eines Programmteils, wie etwa einer Szene oder des Vorspanns. Mit Amazon Rekognition Video können Sie solche Sequenzen mit schwarzen Einzelbildern erkennen, um die Schaltung von Werbung zu automatisieren, Inhalte für VOD zu verpacken und verschiedene Programmteile oder Szenen abzugrenzen. Schwarze Einzelbilder mit Ton (wie z. B. Ausblendungen oder Voiceover-Passagen) werden als Inhalt betrachtet und nicht zurückgegeben.
  • Abspannerkennung: Mit Amazon Rekognition Video können Sie automatisch genau die Einzelbilder erkennen, bei denen der Abspann von Filmen oder Fernsehsendungen beginnt und endet. Anhand dieser Informationen können Sie Markierungen für interaktive Zuschauerhinweise (wie z. B. "Nächste Episode") in VOD-Anwendungen generieren oder das letzte Einzelbild des Programminhalts in einem Video ausfindig machen. Amazon Rekognition Video ist auf die Verarbeitung einer Vielfalt von Abspannstilen ausgelegt, von einfachen durchlaufenden Abspannen bis hin zu anspruchsvolleren Abspannen nebst Inhalt. Vorspanne werden automatisch ausgeschlossen.
  • Einstellungserkennung: Eine Einstellung besteht aus einer Reihe von aufeinanderfolgenden, zusammenhängenden Bildern, die von einer einzigen Kamera aufgenommen werden und eine kontinuierliche Handlung in Zeit und Raum darstellen. Mit Amazon Rekognition Video können Sie den Beginn, das Ende und die Dauer jeder Einstellung erkennen und alle Einstellungen in einem Inhalt berücksichtigen. Metadaten zu Einstellungen können für verschiedene Anwendungen verwendet werden: Dazu zählen das Erstellen von Werbevideos mit ausgewählten Einstellungen, das Generieren von Vorschaubildern, die Übergänge zwischen den Einstellungen vermeiden, und das Einfügen von Werbung in Einstellungen, die das Zuschauererlebnis nicht stören, z. B. in der Mitte einer Einstellung, wenn jemand spricht.
  • Erkennung von Farbbalken: Mit Amazon Rekognition Video können Sie Videoabschnitte erkennen, die SMPTE-Farbbalken anzeigen. Dabei handelt es sich um eine Reihe von Farben, die in bestimmten Mustern angezeigt werden, damit die Farben auf Monitoren, in Programmen und in Kameras richtig eingestellt sind. Diese Metadaten sind nützlich, um Inhalte für VOD-Anwendungen vorzubereiten, indem Abschnitte mit Farbbalken daraus entfernt werden. Zudem lassen sich damit Probleme wie etwa der Verlust von Übertragungssignalen in einer Aufzeichnung erkennen, wenn anstelle des Inhalts Farbbalken kontinuierlich als Standardsignal angezeigt werden.

Amazon Rekognition Video gibt den Start, das Ende, die Dauer und die Zeitcodes für jede erkannte Entität an.

F: Was sind die ersten Schritte für Medienanalysen mit Amazon Rekognition Video?
Funktionen zur Medienanalyse stehen über die Abschnittserkennungs-API von Amazon Rekognition Video zur Verfügung. Hierbei handelt es sich um eine asynchrone API, die aus zwei Vorgängen besteht: StartSegmentDetection zum Starten der Analyse und GetSegmentDetection zum Abrufen der Analyseergebnisse. Weitere Informationen zu den ersten Schritten finden Sie in der Dokumentation.

Wenn Sie die Ergebnisse von Medienanalysen visualisieren oder andere Amazon-KI-Services wie Amazon Transcribe mit eigenen Videos ausprobieren möchten, nutzen Sie bitte die Media Insights Engine (MIE). Dabei handelt es sich um ein serverloses Framework zur einfachen Generierung von Einblicken und zur Entwicklung von Anwendungen für Ihre Video-, Audio-, Text- und Bildressourcen mit Machine Learning- und Medienservices von AWS. Mithilfe der mitgelieferten AWS CloudFormation-Vorlage können Sie mühelos Ihre eigene MIE-Instance starten. Anschließend können Sie mit der Beispielanwendung, die auf der Registerkarte "Ausgaben" der AWS CloudFormation-Konsole verlinkt ist, eigene Videos ausprobieren und Analyseergebnisse visualisieren.

F: Was ist ein bildgenauer Zeitcode?
Bildgenaue Zeitcodes liefern für den relevanten Abschnitt von Videos oder Entitäten die genaue Nummer des Einzelbildes. Medienunternehmen verarbeiten Zeitcodes üblicherweise im SMPTE-Format (Society of Motion Picture and Television Engineers) "Stunden:Minuten:Sekunden:Bildnummer", zum Beispiel 00:24:53:22.

F: Ist die Abschnittserkennung von Amazon Rekognition Video genau?
Ja, die Abschnittserkennungs-API von Amazon Rekognition Video bietet bildgenaue SMPTE-Zeitcodes sowie Zeitstempel im Millisekundenbereich für den Beginn und das Ende jedes erkannten Abschnitts.

F: Welche Arten von Bildratenformaten kann die Abschnittserkennung von Amazon Rekognition Video verarbeiten?
Die Abschnittserkennung von Amazon Rekognition Video verarbeitet automatisch ganzzahlige, gebrochene und Drop-Frame-Standards für Bildraten zwischen 15 und 60 Bildern pro Sekunde (fps). Es werden zum Beispiel gängige Bildraten wie 23,976, 25, 29,97 und 30 fps unterstützt. Anhand der Bildratendaten werden in jedem Fall bildgenaue Zeitcodes bereitgestellt.

Fakturierung

F: Wie zählt Amazon Rekognition die Anzahl der verarbeiteten Bilder?

Bei Verwendung von APIs, die Bilder als Eingaben akzeptieren, zählt Amazon Rekognition die tatsächliche Anzahl der analysierten Bilder als die Anzahl der verarbeiteten Bilder. Zu dieser Kategorie gehören DetectLabels, DetectModerationLabels, DetectFaces, IndexFaces, RecognizeCelebrities und SearchFaceByImage. Bei Verwendung der CompareFaces-API, die zwei Bilder als eine Eingabe erfasst, wird nur das Quellbild als ein verarbeitetes Bild gewertet.

Bei Verwendung von API-Aufrufen, die kein Bild als Eingabeparameter erfordern, zählt Amazon Rekognition jeden API-Aufruf als ein verarbeitetes Bild. SearchFaces gehört zu dieser Kategorie.

Die verbleibenden Amazon Rekognition-APIs – ListFaces, DeleteFaces, CreateCollection, DeleteCollection und ListCollections – zählen nicht für verarbeitete Bilder.

F: Wie misst Amazon Rekognition die Dauer des verarbeiteten Videomaterials?

Hinsichtlich archivierter Videos misst Amazon Rekognition die Dauer des von der API verarbeiteten Videomaterials in Minuten und berechnet Gebühren entsprechend. Hinsichtlich Livestreamvideos werden Gebühren für jedes fünfsekündige Videosegment berechnet, das verarbeitet wird.

F: Für welche APIs werden von Amazon Rekognition Gebühren berechnet?

Amazon Rekognition Image berechnet für die folgenden APIs: DetectLabels, DetectModerationLabels, DetectText, DetectFaces, IndexFaces, RecognizeCelebrities, SearchFaceByImage, CompareFaces und SearchFaces. Die Gebühren Amazon Rekognition Video basieren auf der Videodauer in Minuten, die von den APIs StartLabelDetection, StartFaceDetection, StartFaceDetection, StartTextDetection, StartContentModeration, StartPersonTracking, StartCelebrityRecognition, StartFaceSearch und StartStreamProcessor erfolgreich verarbeitet wurden.

F: Wie viel kostet Amazon Rekognition?

Auf der Seite mit den Preisen von Amazon Rekognition finden Sie aktuelle Preisinformationen.

F: Fallen Gebühren für die Merkmalsvektoren an, die ich in meinen Gesichtssammlungen speichere?

Ja. Amazon Rekognition berechnet monatlich 0,01 USD pro 1 000 Gesichtsvektoren. Weitere Informationen finden Sie auf der Seite mit der Preisübersicht.

F: Ist Amazon Rekognition Teil des kostenlosen AWS-Kontingents?

Ja. Im Rahmen des kostenlosen Nutzungskontingents von AWS können Sie Amazon Rekognition zum Einstieg kostenlos verwenden. Nach der Anmeldung können Amazon Rekognition-Neukunden für die Dauer des ersten Jahres jeden Monat bis zu 5 000 Bilder analysieren lassen. Im Rahmen des kostenlosen Nutzungskontingents können Sie alle Amazon Rekognition-APIs verwenden und bis zu 1 000 Gesichter speichern. Des Weiteren können Amazon Rekognition Video-Kunden im ersten Jahr 1 000 Videominuten pro Monat gratis analysieren.

F: Sind Steuern bereits in den Preisen enthalten?

Einzelheiten zu Steuern finden Sie unter Amazon Web Services – Steuerhilfe.

AWS-Integration

F: Funktioniert Amazon Rekognition Video mit Bildern, die auf Amazon S3 gespeichert sind?

Ja. Um mit dem Analysieren von Bildern aus Amazon S3 zu beginnen, verweisen Sie die Amazon Rekognition-API auf Ihren S3-Bucket. Sie müssen die Daten nicht verschieben. Weitere Informationen zur Verwendung von S3-Objekten mit Amazon Rekognition API-Aufrufen finden Sie in der Übung zur Erkennung von Bezeichnungen.

F: Kann ich Amazon Rekognition mit Bildern verwenden, die in einem Amazon S3-Bucket in einer anderen Region gespeichert sind?

Nein. Bitte stellen Sie sicher, dass sich der Amazon S3-Bucket, den Sie verwenden möchten, in derselben Region wie Ihr Amazon Rekognition-API-Endpunkt befindet.

F: Wie kann ich mit Amazon Rekognition mehrere Bilddateien in einem Stapel verarbeiten?

Sie können Ihre Amazon S3-Bilder in einem Stapel verarbeiten, indem Sie die Schritte aus dem GitHub-Beispiel zur Stapelverarbeitung mit Amazon Rekognition nachvollziehen.

F: Wie kann ich AWS Lambda mit Amazon Rekognition verwenden?

Amazon Rekognition bietet direkten Zugriff auf AWS Lambda und die Integration von Trigger-basierten Funktionen zur Bildanalyse in Ihre AWS-Datenspeicher wie Amazon S3 und Amazon DynamoDB. Wenn Sie Amazon Rekognition mit AWS Lambda verwenden möchten, befolgen Sie diese Schritte, und wählen Sie den Amazon Rekognition-Blueprint aus.

F: Funktioniert Amazon Rekognition mit AWS CloudTrail?

Ja. Amazon Rekognition unterstützt die Protokollierung der folgenden Aktionen als Ereignisse in CloudTrail-Protokolldateien: CreateCollection, DeleteCollection, CreateStreamProcessor, DeleteStreamProcessor, DescribeStreamProcessor, ListStreamProcessors und ListCollections. Weitere Details zu den Amazon Rekognition API-Befehlen, die in AWS CloudTrail integriert sind, finden Sie unter Protokollierung von API-Aufrufen mit AWS CloudTrail.

Datenschutz

F: Werden Bild- und Videoeingaben, die von Amazon Rekognition verarbeitet werden, gespeichert? Wie werden sie von AWS genutzt?

Amazon Rekognition kann Bild- und Videoeingaben, die vom Dienst verarbeitet werden, ausschließlich speichern und verwenden, um den Dienst bereitzustellen und aufrechtzuerhalten und, sofern Sie sich nicht wie unten angegeben abmelden, die Qualität von Amazon Rekognition und anderen Amazon-Technologien des Machine Learning/der künstlichen Intelligenz zu verbessern und zu entwickeln. Die Nutzung Ihrer Inhalte ist wichtig für die kontinuierliche Verbesserung Ihrer Amazon Rekognition-Kundenerfahrung, einschließlich der Entwicklung und Schulung verwandter Technologien. Wir verwenden keine personenbezogenen Informationen, die in Ihren Inhalten enthalten sein können, um Produkte, Services oder Marketingmaterialien auf Sie oder Ihre Endbenutzer abzuzielen. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/. Mit einer der Opt-Out-Mechanismen von AWS Organizations können Sie die Verwendung Ihrer Bild- und Videoeingaben zur Verbesserung oder Entwicklung der Qualität von Amazon Rekognition und anderen Machine-Learning-Technologien / Technologien künstlicher Intelligenz von Amazon ablehnen. Informationen zu Ihren Opt-Out-Möglichkeiten finden Sie unter Managing AI services opt-out policy.

F: Habe ich die Möglichkeit, von Amazon Rekognition gespeicherte Bild- und Videoeingaben zu löschen?

Ja. Um Bild- und Videoeingaben löschen zu lassen, die Ihrem Konto zugeordnet sind, wenden Sie sich bitte an den AWS Support. Durch das Löschen von Bild- und Videoeingaben verringert sich möglicherweise die Qualität Ihrer Amazon Rekognition-Erfahrung.

F: Wer hat Zugriff auf Inhalte, die von Amazon Rekognition verarbeitet und gespeichert werden?

Nur berechtigte Mitarbeiter haben Zugriff auf Inhalte, die von Amazon Rekognition verarbeitet und gespeichert werden. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/.

F: Bin ich immer noch Eigentümer der Inhalte, die von Amazon Rekognition verarbeitet und gespeichert werden?

Sie behalten immer die Eigentümerschaft an den Inhalten und wir verwenden Ihre Inhalte nur mit Ihrer Zustimmung.

F: Werden die Inhalte, die von Amazon Rekognition verarbeitet werden, aus der AWS-Region, in der ich Amazon Rekognition verwende, in andere verschoben?

Jegliche von Amazon Rekognition verarbeiteten Inhalte werden in der AWS-Region, in der Sie Amazon Rekognition verwenden, verschlüsselt und im Ruhezustand gespeichert. Sofern Sie sich nicht wie unten angegeben abmelden, kann ein Teil der von Amazon Rekognition verarbeiteten Inhalte in einer anderen AWS-Region gespeichert werden, und zwar ausschließlich im Zusammenhang mit der kontinuierlichen Verbesserung und Entwicklung Ihret Amazon Rekognition-Kundenerfahrung und anderer Amazon Technologien hinsichtlich Maschine Learning / künstliche Intelligenz. Um Bild- und Videoeingaben löschen zu lassen, die Ihrem Konto zugeordnet sind, wenden Sie sich bitte an den AWS-Support. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/. Ihre Inhalte werden nicht in einer anderen AWS-Region gespeichert, wenn Sie die Option deaktivieren, dass Ihre Inhalte zur Verbesserung und Entwicklung der Qualität von Amazon Rekognition und anderen Amazon-Technologien hinsichtlich Machine Learning / künstliche Intelligenz verwendet werden. Informationen zu Ihren Opt-Out-Möglichkeiten finden Sie unter Managing AI services opt-out policy.

F: Kann ich Amazon Rekognition zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich an Kinder unter 13 Jahren richten und dem Children’s Online Privacy Protection Act (COPPA) unterliegen?

Ja, entsprechend der Konformität mit den Amazon Rekognition-Nutzungsbedingungen, einschließlich Ihrer Verpflichtung, alle erforderlichen Hinweise bereitzustellen und alle erforderlichen überprüfbaren elterlichen Freigaben unter dem COPPA zu erhalten, können Sie Amazon Rekognition zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich ganz oder teilweise an Kinder unter 13 Jahren richten.

F: Wie ermittle ich, ob meine Website, mein Programm oder meine Anwendung dem COPPA unterliegt?

Informationen zu den Anforderung des COPPA und Hinweise, um zu ermitteln, ob Ihre Website, Ihr Programm oder Ihre Anwendung dem COPPA unterliegt, finden Sie direkt in den von der United States Federal Trade Commission bereitgestellten und verwalteten Ressourcen. Diese Website enthält außerdem Informationen, um zu ermitteln, ob sich ein Service ganz oder teilweise an Kinder unter 13 Jahre richtet.

F: Ist Amazon Rekognition ein HIPAA-geeigneter Service?

Amazon Rekognition ist ein Dienst, der die HIPAA-Voraussetzungen im Business Associate Addendum (AWS BAA) erfüllt. Mit einem AWS Business Associate Agreement (BAA) verwendet, verwaltet und legt Amazon Rekognition Ihre patientenbezogenen Daten nur entsprechend Ihres AWS-BAA offen.

Zugriffskontrolle

F: Wie kann ich den Zugriff auf Amazon Rekognition steuern?

Amazon Rekognition ist in AWS Identity and Access Management (IAM) integriert. Mithilfe der IAM-Richtlinien für AWS kann sichergestellt werden, dass nur autorisierte Benutzer Zugriff auf Amazon Rekognition-APIs haben. Weitere Informationen finden Sie auf der Seite zur Authentifizierung und Zugriffssteuerung in Amazon Rekognition.

Missbrauch melden

F: Wie kann ich einen potenziellen Missbrauch von Amazon Rekognition melden?

Wenn Sie vermuten, dass Amazon Rekognition in einer Weise verwendet wird, die missbräuchlich oder illegal ist oder Ihre Rechte oder die Rechte anderer Personen verletzt, melden Sie bitte diese Nutzung und AWS wird das Problem untersuchen.

Weitere Informationen zu den Amazon Rekognition-Preisen

Zur Seite mit den Preisen
Bereit zum Entwickeln?
Erste Schritte mit AWS Rekognition
Haben Sie Fragen?
Kontakt