Funktionen von Amazon Transcribe – Amazon Web Services

Amazon Transcribe ist ein modellgestützter Service zur automatischen Spracherkennung (ASR) der Speech Foundation, der über 100 Sprachen unterstützt. Mit den Features von Transcribe können Audioeingaben aufgenommen, einfach zu lesende und zu überprüfende Transkripte erstellt, die Genauigkeit durch Anpassung verbessert und Inhalte gefiltert werden, um die Privatsphäre der Kunden zu gewährleisten.

Audioeingänge

Transcribe wurde für die Verarbeitung von Live- und aufgezeichneten Audio- oder Videoeingaben entwickelt, um qualitativ hochwertige Transkriptionen für die Suche und Analyse bereitzustellen. Wir bieten auch separate APIs an, die Kundenanrufe (Amazon Transcribe Call Analytics) und medizinische Konversationen (Amazon Transcribe Medical) auf einzigartige Weise verstehen.

Streaming und Batch-Transkription

Sie können Ihre vorhandenen Audioaufnahmen bearbeiten oder das Audio für die Echtzeit-Transkription streamen. Mit einer sicheren Verbindung können Sie einen Live-Audio-Stream an den Service senden und einen Text-Stream zurückerhalten.

Domain-spezifische Modelle

Wählen Sie ein Modell, das auf Telefonanrufe oder Multimedia-Videoinhalte abgestimmt ist. Transcribe passt sich beispielsweise an Telefonaudio mit geringer Klangtreue an, das in Kontaktzentren üblich ist.

Automatische Spracherkennung

Mit Amazon Transcribe können Sie automatisch die dominante Sprache in einer Audiodatei identifizieren und Transkriptionen generieren. Dies ist nützlich, wenn Ihre Medienbibliothek Audiodateien in verschiedenen Sprachen enthält. Sie können diese Funktion auch für die Klassifizierung von Medieninhalten verwenden und überprüfen, ob die gesprochene Hauptsprache in Ihren Videos und Podcasts korrekt beschriftet ist.

Leicht zu lesende Transkripte

Mit Amazon Transcribe können Sie genaue Transkripte erstellen, die einfach zu lesen, zu überprüfen und in Ihre spezifischen Anwendungen zu integrieren sind. Wir arbeiten daran, die Ergebnisse für nachgelagerte Aktivitäten wie die Analyse von Anrufprotokollen, Untertitelung und Inhaltssuche vorzubereiten.

Normalisierung von Interpunktion und Zahlen

Amazon Transcribe fügt automatisch Interpunktion und Formatierung hinzu, sodass die Ausgabe zu einem Bruchteil der Zeit und des Geldes der Qualität der manuellen Transkription entspricht. Zahlen werden anstelle von Wörtern auch in Ziffern oder „Normalform“ transkribiert.

Generierung von Zeitstempeln

Amazon Transcribe generiert für jedes Wort einen Zeitstempel, sodass Sie ein Wort oder eine Phrase in der Originalaufnahme leicht finden oder Untertitel zu Videos hinzufügen können.

Mehrere Sprecher erkennen

Sprecherwechsel werden automatisch erkannt und im Text zugeordnet, um Szenarien wie Telefonate, Meetings und Fernsehsendungen präzise zu erfassen. Um mehr über die Sprecheridentifikation zu erfahren.

Kanalidentifizierung

Contact Center können eine einzelne Audiodatei an Amazon Transcribe senden und der Service identifiziert die Produktion einer einzelnen Abschrift, die automatisch durch Kanalbezeichnungen kommentiert wird.

Anpassen Ihrer Ausgabe

Genauigkeit ist entscheidend und wir bieten Ihnen viele Optionen, um die Transkripte an Ihre spezifischen Geschäftsanforderungen und Ihre Umgangssprache anzupassen. Transcribe bietet außerdem bis zu 10 alternative Transkriptionen für jeden Satz, sodass Sie schnell die beste Option auswählen können, die für Ihren Inhalt und Ihre Domain am besten geeignet ist. Dies ist nützlich für Workflows zur manuellen Untertitelung von Untertiteln.

Benutzerdefiniertes Vokabular

Mit benutzerdefiniertes Vokabular können Sie dem Basisvokabular neue Wörter hinzufügen um genauere Transkriptionen für Domain-spezifische Wörter und Phrasen wie Produktnamen, Fachterminologie oder Namen von Personen zu generieren.

Benutzerdefinierte Sprachmodelle

Bei Bedarf können Sie Ihr eigenes benutzerdefiniertes Sprachmodell (CLM) für Ihren Anwendungsfall und Ihre Domain erstellen und trainieren, indem Sie einen Korpus von Textdaten an Amazon Transcribe senden. CLM ist eine geeignete Funktion, um die Genauigkeit der Spracherkennung mit Ihren eigenen Daten zu verbessern.

Funktionen für Benutzersicherheit und Datenschutz

Der Schutz der Privatsphäre und die Sicherheit der Kunden sind entscheidend. Bei Bedarf können Sie mit Transcribe Wörter, die sensibel oder für Ihr Publikum ungeeignet sind, maskieren oder aus den Transkriptionsergebnissen entfernen.

Vokabularfilter

Mit der Vokabelfilterung können Sie eine Liste von Wörtern angeben, die aus den Transkripten entfernt werden sollen. Sie können z. B. eine Liste von obszönen oder anstößigen Wörtern angeben und Amazon Transcribe entfernt diese automatisch aus den Transkripten.

Funktionen für Benutzersicherheit und Datenschutz

Automatische Inhaltsredaktion/PII-Redaktion

Auf Anweisung kann Amazon Transcribe Kunden helfen sensible persönlich identifizierbare Informationen (PII) aus den unterstützten Sprachtranskripten identifizieren und entfernen. Auf diese Weise können Contact Center die Abschriften leicht überprüfen und weitergeben, um Einblicke in das Kundenerlebnis und die Schulung der Kundendienstmitarbeiter zu erhalten.

Datenschutz

Schützen Sie ruhende Daten mit dem Amazon-S3-Schlüssel (SSE-S3) oder geben Sie Ihren eigenen AWS-Key-Management-Service-Schlüssel an. Amazon Transcribe verwendet TLS (Transport Layer Security) 1.2, ein kryptografisches Protokoll, das authentifizierte Verbindungen und sicheren Datentransport über das Internet über HTTP mit AWS-Zertifikaten zur Verschlüsselung von Daten während der Übertragung ermöglicht. Dies beinhaltet Streaming-Transkriptionen.

Erkennung toxischer Audioinhalte

Amazon Transcribe Toxicity Detection verwendet Machine Learning, um Audiokonversationen höflich und konstruktiv zu gestalten und so eine sichere und integrative Online-Umgebung zu fördern. Toxische Audioinhalte werden in eine von mehreren Kategorien eingestuft, damit menschliche Moderatoren sie leicht erkennen und geeignete Maßnahmen ergreifen können.

Amazon Transcribe Call Analytics

Extrahieren Sie mit Amazon Transcribe Call Analytics Gesprächseinblicke wie Anrufstimmung und Sprachlautstärke, um die Produktivität Ihrer Mitarbeiter und das Kundenerlebnis zu verbessern.

Produktivität in Kontaktzentren mit generativer KI-gestützter Anrufzusammenfassung verbessern

Generieren Sie automatisch Anrufzusammenfassungen, damit sich die Mitarbeiter darauf konzentrieren können, ein hervorragendes Kundenerlebnis zu bieten, und steigern Sie die Produktivität, indem Sie die manuelle Zusammenfassung nach dem Anruf reduzieren. Diese Funktion fasst eine Interaktion mit einem Anrufer zusammen und erfasst wichtige Komponenten wie den Grund des Anrufs, Schritte zur Problemlösung und die nächsten Schritte. Contact-Center-Supervisoren können Anrufzusammenfassungen überprüfen, um den Kontext einer Interaktion schnell zu verstehen, ohne das gesamte Protokoll lesen zu müssen, während sie Anruferprobleme untersuchen.

Extrahieren Sie detaillierte Anrufanalysen und Gesprächseinblicke

Mithilfe der Möglichkeiten des Machine Learning können Sie schnell Sprache-zu-Text- und natürliche Sprachverarbeitungsfunktionen anwenden, um wertvolle Einblicke in Konversationen zu gewinnen. Sie können dann Erkenntnisse wie die Stimmung von Kunden und Kundendienstmitarbeiter, erkannte Probleme und Sprachmerkmale wie Nichtgesprächszeit, Unterbrechungen und Gesprächsgeschwindigkeit in Ihre Anwendungen für die Analyse eingehender und ausgehender Anrufe integrieren. Auf diese Weise können die Vorgesetzten potenzielle Kundenprobleme, Möglichkeiten zur Schulung von Kundendienstmitarbeitern und Trends bei Anrufen leichter erkennen.

Verbessern Sie die Compliance und die Überwachung mit automatischer Anrufkategorisierung

Überwachen Sie Ihre Anrufe in großem Umfang, um die Einhaltung von Unternehmensrichtlinien oder gesetzlichen Vorschriften zu verfolgen. Erstellen und trainieren Sie Ihre eigenen benutzerdefinierten Kategorien auf der Grundlage der von Ihnen festgelegten Kriterien (beispielsweise Wörter/Sätze oder Gesprächsmerkmale). Sie können zum Beispiel Kategoriekennzeichnungen einrichten, um zu sehen, wie viel Prozent der Anrufe Upsells oder Kontokündigungen sind.

Umfassende Gesprächsprotokolle erstellen

Geben Sie Ihren Kundendienstmitarbeitern Zugriff auf die Gesprächsdetails vergangener Interaktionen. Die detaillierten Transkripte bieten Einblicke in die Kundenstimmung, erkannte Probleme und Unterbrechungen.

Vertrauliche Kundendaten schützen

Gespräche enthalten oft vertrauliche Kundendaten, beispielsweise Namen, Adressen, Kreditkartennummern und Sozialversicherungsnummern. Mit Transcribe Call Analytics können Kunden diese Informationen aus Audioaufnahmen und Text identifizieren und redigieren.

Kontaktcenter-Integrationen

Genesys Cloud CX
Genesys Cloud CX ist eine Cloud-Kontaktcenter-Lösung, die das Erlebnis für Kunden und Kundendienstmitarbeiter über mehrere Kanäle wie Telefon, Text und Chat hinweg vereint. Sie können Ihr Anruf-Audio aus der Genesys-Cloud-Umgebung an Amazon Transcribe streamen, um die Produktivität Ihrer Mitarbeiter zu verbessern und Einblicke in die Kundeninteraktion zu gewinnen. Weitere Informationen finden Sie unter Genesys-Cloud-AudioHook-Integration. Beginnen Sie außerdem mit der Analyse Ihrer Genesys-Cloud-Anrufe mit der AWS-Live-Call-Analytics-Lösung.

Amazon Chime SDK
Die Amazon Chime SDK ist ein Satz von Echtzeit-Kommunikationskomponenten, den Entwickler nutzen können, um ihre eigenen Web-, Mobiltelefon- oder Telefon-Anwendungen schnell um Audioanruf-, Videoanruf- und Bildschirmfreigabefunktionen zu erweitern.

Amazon Chime Voice Connector
Amazon Chime Voice Conector ermöglicht die einfache Integration in SIP-basierte Kontaktzentren, um Live-Transkripte mit Benutzerattributen mit Amazon Transcribe zu erstellen. Weitere Informationen finden Sie in der Amazon-Chime-Voice-Connector-Dokumentation.

Amazon Transcribe Medical

Medizinische Fachgebiete

Mit Transcribe Medical, einem HIPAA-fähigen automatischen Spracherkennungsdienst (ASR), können Sie Ihre medizinischen Gespräche ganz einfach transkribieren.

Diktiermodus

Transkribieren Sie akkurat Audio mit einem Lautsprecher, das häufig in medizinischen Diktieranwendungen vorkommt. Weitere Informationen »

Dialogorientierter Modus

Transkribieren Sie dialogrientiertes Audio mit mehreren Lautsprechern, das sowohl von Ärzten als auch von Patienten besteht, präzise. Weitere Informationen »

Transkribieren Sie Sprache in Text in einer Vielzahl von medizinischen Fachgebieten. Weitere Informationen »

Batch-API

Transkribieren Sie aufgezeichnete medizinische Audiodateien in großem Maßstab mit hoher Parallelität. Weitere Informationen »

Streaming-API

Transkribieren Sie Audiostreams nahezu in Echtzeit über das WebSocket-Secure- oder das HTTP/2-Protokoll. Weitere Informationen »

Benutzerdefiniertes Vokabular

Erhöhen Sie die Genauigkeit der Transkription, indem Sie benutzerdefiniertes Vokabular für Terminologie verwenden, die möglicherweise aus dem Lexikon stammt. Weitere Informationen »

Kanalidentifizierung

Transkribieren Sie gleichzeitig Mehrkanal-Audio ohne Aufpreis. Besorgen Sie sich ein abschließendes kohärentes Protokoll. Weitere Informationen »

Diarisierung von Sprechern

Trennen Sie die Sprache von verschiedenen Lautsprechern innerhalb eines beliebigen Einkanal-Audios. Weitere Informationen »

Weitere Informationen über die Produktpreise

Besuchen Sie die Preisseite von Amazon Transcribe.

Weitere Informationen

Für ein kostenloses Konto registrieren

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent.

Registrieren

Beginnen Sie mit der Entwicklung in der Konsole

Starten Sie mit der Entwicklung mit Amazon Transcribe in der AWS-Managementkonsole.

Anmelden

Amazon-Transcribe-Funktionen

Audioeingänge

Streaming und Batch-Transkription

Domain-spezifische Modelle

Automatische Spracherkennung

Leicht zu lesende Transkripte

Normalisierung von Interpunktion und Zahlen

Generierung von Zeitstempeln

Mehrere Sprecher erkennen

Kanalidentifizierung

Anpassen Ihrer Ausgabe

Benutzerdefiniertes Vokabular

Benutzerdefinierte Sprachmodelle

Funktionen für Benutzersicherheit und Datenschutz

Vokabularfilter

Automatische Inhaltsredaktion/PII-Redaktion

Datenschutz

Erkennung toxischer Audioinhalte

Amazon Transcribe Call Analytics

Produktivität in Kontaktzentren mit generativer KI-gestützter Anrufzusammenfassung verbessern

Extrahieren Sie detaillierte Anrufanalysen und Gesprächseinblicke

Verbessern Sie die Compliance und die Überwachung mit automatischer Anrufkategorisierung

Umfassende Gesprächsprotokolle erstellen

Vertrauliche Kundendaten schützen

Kontaktcenter-Integrationen

Amazon Transcribe Medical

Medizinische Fachgebiete

Diktiermodus

Dialogorientierter Modus

Batch-API

Streaming-API

Benutzerdefiniertes Vokabular

Kanalidentifizierung

Diarisierung von Sprechern

Ende des Supports für Internet Explorer