Создание текстовой расшифровки аудиозаписи

с помощью сервиса Amazon Transcribe

В этом пошаговом руководстве вы узнаете, как использовать сервис Amazon Transcribe для создания текстовой расшифровки записанного аудиофайла с помощью консоли управления AWS. Amazon Transcribe – это сервис автоматического распознавания речи (ASR), позволяющий разработчикам без труда добавлять в свои приложения возможности преобразования речи в текст. С помощью API сервиса Amazon Transcribe можно анализировать аудиофайлы, хранящиеся в Amazon Simple Storage Service (S3), и получать текстовые файлы с расшифровкой речи.

Создание расшифровки звонков клиентов в службу поддержки или субтитров к аудио- и видеозаписям — это типичные применения функции преобразования речи в текст. Эту задачу можно решить путем создания собственных моделей машинного обучения с нулевого уровня. Однако этот вариант требует больших затрат времени и денег, а также специальных навыков в области машинного обучения. Гораздо удобнее использовать сервис Amazon Transcribe. Это предварительно обученный и полностью управляемый сервис, обеспечивающий быструю и качественную расшифровку.

На этом занятии вы скачаете образец аудиофайла, а затем загрузите его в корзину S3, которую создадите. Далее вы создадите расшифровку образца аудиофайла с помощью сервиса Amazon Transcribe, используя консоль управления AWS.

В учебном пособии демонстрируются возможности, доступные при использовании интерфейса командной строки AWS или Transcribe API. Для производственных задач или экспериментальных вариантов рекомендуется использовать не консоль Amazon Transcribe, а именно эти программные интерфейсы.

Для работы с этим руководством нужен аккаунт AWS

Уровень бесплатного пользования Amazon Transcribe позволяет сразу начать работу. В течение первых 12 месяцев с момента создания аккаунта AWS можно бесплатно расшифровывать до 60 минут аудиозаписей ежемесячно.

Подробнее об уровне бесплатного пользования >>


Шаг 1. Создание корзины S3 и загрузка образца аудиофайла

В этом шаге выполняется скачивание образца аудиофайла, создание корзины S3 и загрузка в нее образца аудиофайла. Сервис Transcribe для расшифровки может брать аудио- и видеофайлы только из корзин S3.


а)  Щелкните здесь, чтобы скачать образец аудиофайла для последующей расшифровки в ходе занятия. Имя файла — transcribe-sample.mp3.


б)  Щелкните здесь, и в новом окне браузера откроется консоль управления AWS. При этом пошаговое руководство останется открытым. Когда стартовый экран загрузится, введите имя пользователя и пароль, чтобы начать работу. В раскрывающемся списке выберите регион, в котором доступен сервис Amazon Transcribe.

В настоящее время сервис Amazon Transcribe доступен в регионах Восток США (Сев. Вирджиния), Восток США (Огайо), Запад США (Орегон), Азия и Тихий океан (Сидней), Канада (Центр) и ЕС (Ирландия).

create-audio-transcript-transcribe-step-1b
create-audio-transcript-transcribe-step-1b

(Нажмите для увеличения)


в) Введите S3 в строке поиска и выберите S3, чтобы открыть консоль.

create-audio-transcript-transcribe-step-1c
create-audio-transcript-transcribe-step-1c

(Нажмите для увеличения)


г)  На панели инструментов S3 выберите команду Create bucket.

Если вы создаете корзину впервые, откроется экран, показанный на следующем изображении.

Если ранее вы уже создавали корзины S3, в панели управления S3 будут показаны все имеющиеся корзины.

create-audio-transcript-transcribe-step-1d
create-audio-transcript-transcribe-step-1d

(Нажмите для увеличения)


д)  Введите уникальное имя корзины. Все корзины в Amazon S3 должны иметь уникальные имена. Существует и ряд других ограничений для имен корзин S3. Выберите регион, в котором требуется создать корзину.

Нажмите Next.

create-audio-transcript-transcribe-step-1e
create-audio-transcript-transcribe-step-1e

(Нажмите для увеличения)


е)  Для корзины S3 доступны многие полезные функции, в том числе управление версиями, ведение журнала доступа к серверу, теги, ведение журнала на уровне объектов и шифрование по умолчанию. Но в этом руководстве они использоваться не будут.

Нажмите Next.

create-audio-transcript-transcribe-step-1f
create-audio-transcript-transcribe-step-1f

(Нажмите для увеличения)


ж)  В этом шаге можно настроить разрешения для корзины S3 во время ее создания.

Оставьте значения по умолчанию и нажмите кнопку Next.

create-audio-transcript-transcribe-step-1g
create-audio-transcript-transcribe-step-1g

(Нажмите для увеличения)


з)  Проверьте параметры конфигурации и нажмите кнопку Create bucket.

create-audio-transcript-transcribe-step-1h
create-audio-transcript-transcribe-step-1h

(Нажмите для увеличения)


и)  Созданная корзина появится в консоли S3. Чтобы перейти к этой корзине, щелкните ее название. Имя корзины будет отличаться от имени, показанного на снимке экрана справа.

create-audio-transcript-transcribe-step-1i
create-audio-transcript-transcribe-step-1i

(Нажмите для увеличения)


к) Откроется главная страница корзины.

Нажмите Upload.

create-audio-transcript-transcribe-step-1j
create-audio-transcript-transcribe-step-1j

(Нажмите для увеличения)


л)  Загрузите файл transcribe-sample.mp3. Для этого нажмите кнопку Add files и выберите файл ИЛИ перетащите файл transcribe-sample.mp3 в область загрузки.

Нажмите Upload.

create-audio-transcript-transcribe-step-1k
create-audio-transcript-transcribe-step-1k

(Нажмите для увеличения)


м)  Установите флажок рядом с файлом transcribe-sample.mp3 в корзине. Отобразится панель со сведениями о файле transcribe-sample.mp3. Скопируйте ссылку на файл и сохраните ее для дальнейшего использования в процессе обучения.

create-audio-transcript-transcribe-step-1l
create-audio-transcript-transcribe-step-1l

(Нажмите для увеличения)


Шаг 2. Создание задания для расшифровки

В этом шаге с помощью консоли Amazon Transcribe создается и запускается задание для расшифровки.


а)  В главном меню выберите пункт Services, начните вводить Transcribe в строке поиска и выберите пункт Amazon Transcribe, чтобы открыть консоль сервиса.

create-audio-transcript-transcribe-step-2a
create-audio-transcript-transcribe-step-2a

(Нажмите для увеличения)


б)  На главной странице консоли Amazon Transcribe откройте панель навигации и щелкните Transcription jobs.

в) На странице Transcription jobs щелкните Create job.

create-audio-transcript-transcribe-step-2b
create-audio-transcript-transcribe-step-2b

(Нажмите для увеличения)


г)  На странице Create transcription job в поле Name введите sample-transcription-job.

Сохраните для параметра Language значение по умолчанию English.

В поле Input file location on S3 вставьте ссылку на образец файла в корзине S3. Ссылка на образец файла будет отличаться от ссылки, показанной на снимке экрана справа.  

Для поля Format сохраните значение по умолчанию mp3.

С помощью функции Настраиваемый словарь сервис Amazon Translate сможет распознавать слова и фразы, характерные для вашего приложения, например не характерные для английского языка имена. Вам не нужно использовать эту функцию в данном учебном пособии.

create-audio-transcript-transcribe-step-2c
create-audio-transcript-transcribe-step-2c

(Нажмите для увеличения)


д)  Оставьте для параметра Data location значение по умолчанию Amazon default.

Если включена функция определения каналов, сервис Amazon Transcribe может обрабатывать аудио- и видеозаписи, в которых каждый источник речи записан на отдельном канале, и создавать единую расшифровку с метками каналов.

Если включена функция определения источников речи, сервис Amazon Transcribe может распознавать смену источника речи и вносить в текст соответствующие метки.

В данном учебном пособии ни одна из этих функций использоваться не будет.

Чтобы начать расшифровку, выберите Create.  

create-audio-transcript-transcribe-step-2d
create-audio-transcript-transcribe-step-2d

(Нажмите для увеличения)


Шаг 3. Проверка результатов расшифровки

В этом шаге описано, как следить за процессом выполнения задания по расшифровке и проверять результаты.


а)  Нажмите кнопку Create, чтобы перейти на экран Transcription jobs. На этом экране показан статус для задания sample-transcription-job. Возможные значения статуса: In progress (В процессе), Complete (Завершено) или Failed (Не выполнено).

Если статус имеет значение Complete, щелкните ссылку sample-transcription-job в столбце Name, чтобы просмотреть результаты расшифровки.

create-audio-transcript-transcribe-step-3a
create-audio-transcript-transcribe-step-3a

(Нажмите для увеличения)


б)   Далее вы увидите подробные сведения о задании sample-transcription-job. Прокрутите страницу вниз до панели Transcription, чтобы просмотреть результат выполнения задания расшифровки. На панели JSON представлены результаты расшифровки в том виде, в котором они будут возвращаться из Transcribe API или интерфейса командной строки AWS.

create-audio-transcript-transcribe-step-3b
create-audio-transcript-transcribe-step-3b

(Нажмите для увеличения)


Шаг 4. Удаление ресурсов

В этом шаге выполняется удаление образца файла из корзины S3, чтобы избежать ненужных затрат.


а)  В верхнем меню навигации щелкните пункт Services, начните вводить S3 в строке поиска и выберите пункт S3, чтобы открыть консоль.

create-audio-transcript-transcribe-step-4a
create-audio-transcript-transcribe-step-4a

(Нажмите для увеличения)


б)  Просмотрите свои корзины S3 и найдите ту, которая была создана ранее для этого учебного пособия. Щелкните имя этой корзины, чтобы просмотреть ее содержимое. Имя корзины будет отличаться от показанного на снимке экрана справа.

create-audio-transcript-transcribe-step-4b
create-audio-transcript-transcribe-step-4b

(Нажмите для увеличения)


в)  Выберите в корзине файл transcribe-sample.mp3, затем в меню Actions нажмите пункт Delete. Подтвердите удаление.

create-audio-transcript-transcribe-step-4c
create-audio-transcript-transcribe-step-4c

(Нажмите для увеличения)


Поздравляем!

В этом учебном пособии вы узнали, что сервис Amazon Transcribe позволяет преобразовывать голос в текст в больших объемах. Используйте сервис Amazon Transcribe для обработки самых разных аудио- и видеофайлов, таких как звонки клиентов в службу поддержки, записи совещаний, трансляции телепередач и видеозаписи по запросу.

 

Научитесь переводить текст в больших объемах

В этом 10-минутном учебном пособии рассказывается, как можно перевести расшифрованный текст на другие языки, используя сервис Amazon Translate.

Начните работу с Transcribe API и интерфейсом командной строки

В этом учебном пособии из пакета документации рассказывается, как правильно использовать Amazon Transcribe API и интерфейс командной строки.

Познакомьтесь с сервисом Amazon Comprehend

В этом 10-минутном учебном пособии рассказывается, как анализировать эмоции в тексте с помощью Amazon Comprehend.

 


Была ли полезной информация, представленная в этом учебном пособии?