Allgemeines

F: Was ist Amazon Transcribe?

Amazon Transcribe ist ein AWS-Service, mit dem Kunden ganz einfach Sprache in Text umwandeln können. Dank Automatic Speech Recognition(ASR)-Technologie (Technologie zur automatischen Spracherkennung) können Kunden Amazon Transcribe in verschiedenen Bereichen ihres Unternehmens einsetzen, zum Beispiel für die Transkription sprachbasierter Kundenservice-Anrufe, die Erstellung von Untertiteln für Audio-/Videoinhalte in Echtzeit oder die textbasierte Durchführung von Inhaltsanalysen für Audio-/Videoinhalte.  

F: Wie interagiert Amazon Transcribe mit anderen AWS-Produkten?

Amazon Transcribe wandelt Audioeingaben in Text um, was Ihnen neue Möglichkeiten bei Anwendungen zur Textanalyse mittels Spracheingabe ermöglicht. Wenn Kunden beispielsweise Amazon Comprehend auf die konvertierten Textdaten von Amazon Transcribe ansetzen, können sie eine Stimmungsanalyse durchführen oder Entitäten und Schlüsselphrasen extrahieren. Kunden können Amazon Transcribe auch in Amazon Translate und Amazon Polly integrieren, um Spracheingaben in einer Sprache zu ermöglichen, diese dann in eine andere Sprache zu übersetzen und als Sprachausgabe wiederzugeben, wodurch effektiv Kommunikation in verschiedenen Sprachen möglich wird. Amazon Transcribe kann außerdem in Amazon Elasticsearch integriert werden, um textbasierte Suchvorgänge in Audio-/Videobibliotheken zu indexieren und durchzuführen. 

F: Was muss ich vor der Nutzung von Amazon Transcribe noch wissen?

Der Amazon Transcribe-Service ist auf die Verarbeitung einer Vielfalt von Sprach- und akustischen Eigenschaften ausgelegt, darunter Variationen in Lautstärke, Tonhöhe und Sprechgeschwindigkeit. Die Qualität und der Inhalt des Audiosignals (u. a. Faktoren wie Hintergrundgeräusche, gleichzeitig sprechende Personen, Sprache mit Akzent oder Wechsel zwischen verschiedenen Sprachen innerhalb einer Audiodatei) können sich auf die Genauigkeit der Ausgabe auswirken. Der Service wird von uns ständig aktualisiert, damit er weitere akustische Variationen und Inhaltsarten besser verarbeiten kann. 

Verwenden von Amazon Transcribe

F: Wie können Entwickler auf Amazon Transcribe zugreifen?

Für einen einfachen Einstieg in Amazon Transcribe senden Sie einen Job über die Konsole, um eine Audiodatei zu transkribieren. Sie können den Service auch direkt über die AWS-Befehlszeilenschnittstelle aufrufen oder eines der unterstützten SDKs Ihrer Wahl verwenden, um ihn in Ihre Anwendungen zu integrieren. So oder so können Sie in Amazon Transcribe einsteigen, um automatisierte Transkripte für Ihre Audiodateien mit nur wenigen Zeilen Code zu erstellen.

F: Welche Arten von Eingaben werden von Amazon Transcribe unterstützt?

Amazon Transcribe unterstützt sowohl 16-kHz- als auch 8-kHz Audiostreams und mehrere Audiokodierungen, einschließlich WAV, MP3, MP4 und FLAC.

F: Unterstützt Amazon Transcribe Echtzeittranskriptionen?

Ja. Amazon Transcribe ermöglicht es Benutzern, einen bidirektionalen Stream über HTTP2 zu eröffnen. Benutzer können einen Audiostream an den Service senden, während Sie in Echtzeit einen Textstream zurückerhalten.  

F: Welche Enkodierung wird von der Echtzeittranskription unterstützt?

Die Streaming-Transkription unterstützt aktuell lineare PCM-Enkodierung in 16-Bit. 

F: Welche Sprachen unterstützt Amazon Transcribe?

Informationen zur Sprachunterstützung finden Sie auf dieser Dokumentationsseite

F: Auf welchen Geräten funktioniert Amazon Transcribe?

Amazon Transcribe ist im Grunde plattformunabhängig. Amazon Transcribe funktioniert generell mit allen Geräten, die über ein integriertes Mikrofon besitzen, wie Telefone, PCs, Tablets und IoT-Geräte (zum Beispiel Soundsysteme). Die Amazon Transcribe-API kann die Qualität der Audioeingabe (8 kHz oder 16 kHz) erkennen und wählt automatisch das richtige Akustikmodell zur Umwandlung von Sprache in Text aus. Entwickler können die Transcribe-API ferner über ihre Anwendungen aufrufen, um die Sprache-zu-Text-Funktionen zu nutzen. 

F: Gibt es Begrenzungen bei der Größe der Audioinhalte, die Amazon Transcribe verarbeiten kann?

In Amazon Transcribe sind Serviceaufrufe für unseren Batch-Service auf 4 Stunden (oder 2 GB) pro API-Aufruf begrenzt. Der Streaming-Service kann bis zu 4 Stunden lang offene Verbindungen unterstützen. 

F: Welche Programmiersprachen unterstützt Amazon Transcribe?

Der Amazon Transcribe Batch Service unterstützt .NET, Go, Java, Javascript, PHP, Python und Ruby.
Amazon Transcribe Echtzeit-Service unterstützt Java SDK, Ruby SDK und C++ SDK. Weitere SDK-Unterstützung ist in Vorbereitung. Weitere Details finden Sie auf der Seite mit den Ressourcen

F: Meine benutzerdefinierten Wörter des Vokabulars werden nicht erkannt! Was kann ich tun?

Die Spracherkennungsausgabe hängt neben benutzerdefinierten Vokabulareinträgen von einer Reihe von Faktoren ab, sodass keine Gewähr dafür besteht, dass ein Begriff korrekt erkannt wird, wenn er in das benutzerdefinierte Vokabular aufgenommen wurde.
Der häufigste Grund ist jedoch, dass einem benutzerdefinierten Wort die richtige Aussprache fehlt. Wenn Sie keine Aussprache für Ihr benutzerdefiniertes Wort angegeben haben, versuchen Sie bitte, eine zu erstellen. Wenn Sie bereits eine zur Verfügung gestellt haben, überprüfen Sie die Richtigkeit, oder fügen Sie ggf. andere Aussprachevarianten hinzu. Dies kann durch Erstellen mehrerer Einträge in der benutzerdefinierten Vokabulardatei erfolgen, die sich im Aussprachefeld unterscheiden.

F: Warum sehe ich zu viele benutzerdefinierte Wörter in meiner Ausgabe?

Benutzerdefinierte Vokabulare sind für eine kleine Liste von Zielwörtern optimiert; größere Vokabulare können zu einer Übergenerierung von benutzerdefinierten Wörtern führen, insbesondere wenn sie Wörter enthalten, die in ähnlicher Weise ausgesprochen werden. Wenn Sie eine große Liste haben, versuchen Sie bitte, sie auf seltene Wörter und Wörter zu reduzieren, die tatsächlich in Ihren Audiodateien erwartet werden. Wenn Sie über ein großes Vokabular verfügen, das mehrere Anwendungsfälle abdeckt, teilen Sie es in separate Listen für verschiedene Anwendungsfälle auf. Die Wörter, die kurz sind und ähnlich wie viele andere Wörter klingen, können zu einer Übergenerierung führen (zu viele benutzerdefinierte Wörter, die in der Ausgabe angezeigt werden). Es ist vorzuziehen, diese Wörter mit umgebenden Wörtern zu kombinieren und sie als durch einen Bindestrich getrennte Phrasen aufzulisten. Beispielsweise könnte das benutzerdefinierte Wort „A.D.“ als Teil eines Ausdrucks wie „A.D.-Konverter“ aufgenommen werden.

F: Es gibt zwei Möglichkeiten, Aussprachen zu vermitteln – IPA- oder SoundsLike-Felder in der benutzerdefinierten Vokabulartabelle. Welche ist besser?

IPA ermöglicht präzisere Aussprachen. Sie sollten IPA-Aussprachen bereitstellen, wenn Sie IPA generieren können (z. B. aus einem Lexikon mit IPA-Aussprache oder einem Online-Konverter-Tool).

F: Ich möchte IPA verwenden, aber ich bin kein Sprachexperte. Gibt es ein Online-Tool, das ich verwenden kann?

Mehrere Standardwörterbücher, wie das Oxford English Dictionary oder das Cambridge Dictionary (einschließlich ihrer Online-Versionen), bieten Aussprachen in IPA. Es gibt auch Online-Konverter (z. B. easypronunciation.com oder tophonetics.com für Englisch) — Beachten Sie jedoch, dass diese Tools in den meisten Fällen auf zugrunde liegenden Wörterbüchern basieren und für einige Wörter, wie z. B. Eigennamen, möglicherweise keine korrekte IPA generieren. Amazon Transcribe unterstützt keine Tools von Drittanbietern.

F: Muss ich verschiedene IPA-Standards verwenden, die für andere Akzente derselben Sprache spezifisch sind? (z. B. US-Englisch im Vergleich zu britisches Englisch)?

Sie sollten den IPA-Standard verwenden, der für die zu verarbeitende Audiodatei geeignet ist, das heißt, wenn Sie z. B. eine Audiodatei von einem britisch Englisch-Sprechenden verarbeiten, verwenden Sie den britisch Englischen-Aussprachestandard. Der Satz der zulässigen IPA-Symbole kann sich für die verschiedenen Sprachen und Dialekte unterscheiden, die von Amazon Transcribe unterstützt werden. Bitte stellen Sie sicher, dass Ihre Aussprache nur die zulässigen Zeichen enthält. Details zu den IPA-Zeichensätzen finden Sie in der Dokumentation: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

F: Wie kann ich die Aussprache mithilfe des SoundsLike-Feldes in der benutzerdefinierten Vokabulartabelle bereitstellen?

Sie können ein Wort oder eine Phrase in kleinere Stücke zerlegen und eine Aussprache für jedes Stück bereitstellen, indem Sie die Standard-Orthographie der Sprache verwenden, um den Klang des Wortes nachzuahmen. Im Englischen können Sie z. B. Aussprachehinweise für den Ausdruck Los-Angeles wie folgt bereitstellen: loss-ann-gel-es. Der Hinweis für das Wort Etienne würde wie folgt aussehen: eh-tee-en. Sie trennen jeden Teil des Hinweises mit einem Bindestrich (-). Sie können jedes der zulässigen Zeichen für die Eingabesprache verwenden.

F: Wie funktionieren zwei verschiedene Arten der Bereitstellung von Akronymen (mit Punkten und ohne Punkte, aber mit Aussprachen)?

Wenn Sie ein Akronym verwenden, das Punkte enthält, wird die Rechtschreibaussprache intern generiert. Wenn Sie keine Punkte verwenden, geben Sie bitte die Aussprache im Aussprachefeld an. Für einige Akronyme ist es nicht offensichtlich, ob sie eine Rechtschreibaussprache oder eine wortartige Aussprache haben (z. B. wird NATO oft als „n eɪ t oʊ“ (nay-toh) ausgesprochen, anstatt „ɛn eɪ ti oʊ“ (N. A. T. O.)).

F: Wo finde ich Beispiele für die Verwendung von benutzerdefinierten Aussprachen?

Beispieleingabeformate und Beispiele finden Sie in der Dokumentation: https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html.

F: Was passiert, wenn ich den falschen IPA verwende? Wenn ich unsicher bin, ist es besser, wenn ich keine IPA eingebe?

Das System verwendet die Aussprache, die Sie bereitstellen; dies sollte die Wahrscheinlichkeit erhöhen, dass das Wort richtig erkannt wird, wenn die Aussprache richtig ist und mit dem übereinstimmt, was gesprochen wurde. Wenn Sie nicht sicher sind, dass Sie korrektes IPA generieren, führen Sie bitte einen Vergleich durch, indem Sie Ihre Audiodateien mit einem Vokabular verarbeiten, das Ihre IPA-Aussprachen enthält, und mit einem Vokabular, das nur die Wörter (und optional als Formulare anzeigen) enthält. Wenn Sie keine Aussprachen bereitstellen, verwendet der Dienst eine Annäherung, die möglicherweise besser als Ihre Eingabe funktioniert.

F: Kann ich bei Verwendung von DisplayAs-Formularen Zeichensätze anzeigen, die nichts mit der zu transkribierenden Originalsprache zu tun haben? (z. B. Ausgabe „Straße“ als „街道“).

Ja. Während Phrasen nur einen eingeschränkten Satz von Zeichen für die jeweilige Sprache verwenden dürfen, sind UTF-8-Zeichen, die sich von der Datei \t (TAB) unterscheiden, in der Spalte DisplayAs zulässig.

Preise und Verfügbarkeit

F: Was sind die Kosten dafür?

Auf der Seite Amazon Transcribe – Preise erfahren Sie mehr.

F: Welche AWS-Regionen sind für Amazon Transcribe verfügbar?

Diese Informationen finden Sie in der Tabelle für globale Infrastrukturregionen von AWS.

Datenschutz

F: Werden durch Amazon Transcribe verarbeitete Eingaben gespeichert und wie werden sie von AWS verwendet?

Amazon Transcribe speichert und verwendet von dem Service verarbeitete Eingaben ausschließlich, um den Service bereitzustellen und zu pflegen und die Qualität von Amazon Transcribe und anderen Machine-Learning-Technologien / Technologien künstlicher Intelligenz von Amazon zu verbessern und weiterzuentwickeln. Die Nutzung Ihrer Inhalte ist für die kontinuierliche Verbesserung Ihrer Amazon Transcribe-Kundenerfahrung wichtig, einschließlich der Entwicklung und der Schulung entsprechender Technologien. Wir verwenden keine personenbezogenen Informationen, die in Ihren Inhalten enthalten sein können, um Produkte, Services oder Marketingmaterialien auf Sie oder Ihre Endbenutzer abzuzielen. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/. Sie können die Option deaktivieren, dass Ihre Inhalte zur Verbesserung und Weiterentwicklung von Amazon Transcribe und anderen Amazon-Technologien hinsichtlich Machine Learning/künstliche Intelligenz verwendet werden, indem Sie den AWS Support kontaktieren.

F: Kann ich Spracheingaben, die von Amazon Transcribe gespeichert wurden, wieder löschen?

Ja. Um Spracheingaben löschen zu lassen, die Ihrem Konto zugeordnet sind, wenden Sie sich bitte an den AWS-Support. Durch das Löschen von Spracheingaben kann jedoch Ihre Benutzererfahrung mit Amazon Transcribe beeinträchtigt werden.

F: Wer hat Zugriff auf meine Inhalte, die von Amazon Transcribe verarbeitet und gespeichert werden?

Nur autorisierte Mitarbeiter haben Zugriff auf Ihre Inhalte, die von Amazon Transcribe verarbeitet werden. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/.

F: Bin ich immer noch der Eigentümer der Inhalte, die durch Amazon Transcribe verarbeitet und gespeichert werden?

Sie behalten immer die Eigentümerschaft an den Inhalten und wir verwenden Ihre Inhalte nur mit Ihrer Zustimmung.

F: Wird der von Amazon Transcribe verarbeitete Inhalt außerhalb der AWS-Region verschoben, in der ich Amazon Transcribe verwende?

Alle Inhalte, die von Amazon Transcribe verarbeitet werden, werden im Ruhezustand in der AWS-Region verschlüsselt und gespeichert, in der Sie Amazon Transcribe verwenden. Ein Teil der von Amazon Transcribe verarbeiteten Inhalte wird möglicherweise im Rahmen der fortlaufenden Verbesserung und Weiterentwicklung des Kundenerlebnisses von Amazon Transcribe und anderen Amazon-Technologien hinsichtlich Machine Learning/künstliche Intelligenz in einer anderen AWS-Region gespeichert. Wenn Sie die Option deaktivieren, dass Ihre Inhalte zur Weiterentwicklung von Amazon Transcribe und anderen Amazon-Technologien hinsichtlich Machine Learning/künstliche Intelligenz verwendet werden, indem Sie den AWS Support kontaktieren, dann werden Ihre Inhalte nicht in einer anderen AWS-Region gespeichert. Um Spracheingaben löschen zu lassen, die Ihrem Konto zugeordnet sind, wenden Sie sich bitte an den AWS-Support. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/.

F: Kann ich Amazon Transcribe zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich an Kinder unter 13 Jahren richten und dem Children’s Online Privacy Protection Act (COPPA) unterliegen?

Ja, entsprechend der Konformität mit den Amazon Transcribe-Nutzungsbedingungen, einschließlich Ihrer Verpflichtung, alle erforderlichen Hinweise bereitzustellen und alle erforderlichen überprüfbaren elterlichen Freigaben unter dem COPPA zu erhalten, können Sie Amazon Transcribe zusammen mit Websites, Programmen und anderen Anwendungen verwenden, die sich ganz oder teilweise an Kinder unter 13 Jahren richten.

F: Wie ermittle ich, ob meine Website, mein Programm oder meine Anwendung dem COPPA unterliegt?

Informationen zu den Anforderung des COPPA und Hinweise, um zu ermitteln, ob Ihre Website, Ihr Programm oder Ihre Anwendung dem COPPA unterliegt, finden Sie direkt in den von der United States Federal Trade Commission bereitgestellten und verwalteten Ressourcen. Diese Website enthält außerdem Informationen, um zu ermitteln, ob sich ein Service ganz oder teilweise an Kinder unter 13 Jahre richtet.

Weitere Informationen zu den Amazon Transcribe-Preisen

Zur Seite mit den Preisen
Sind Sie startbereit?
Testen Sie die Amazon Transcribe-Konsole
Haben Sie Fragen?
Kontakt