O blog da AWS
20 mil horas de vídeo legendadas do Gran Cursos Online com mais de 92% de precisão
Por Felipe Santos, Research and Development Manager da BRLink
A produção e a utilização de vídeos são uma tendência inquestionável no mundo todo: está mais do que provado que se trata de uma importante ferramenta de comunicação e informação.
Com o crescimento dos vídeos, cresce também a necessidade de um serviço de legendagem realmente qualificado e assertivo.
Os objetivos são diversos. Além de ampliar a abrangência do vídeo para outros idiomas, a legendagem permite mais acessibilidade: torna o conteúdo disponível para pessoas que podem ter algum problema auditivo.
Neste post, vou contar como a BRLink criou uma estrutura de legendagem de vídeos para um grande volume de conteúdo e com alta precisão, tudo feito em um dia.
INTRODUÇÃO
Com centenas de milhares de alunos em todo o Brasil, a EdTech Gran Cursos Online é uma plataforma de cursos online para interessados em concursos públicos e Exame de Ordem. Um dos principais mecanismos da plataforma são as videoaulas. Os alunos assistem às aulas ministradas por mais de 400 professores das mais diversas disciplinas. No projeto, estamos falando de uma produção de mais de 10 mil horas de vídeos por ano.
O DESAFIO
O Gran Cursos Online buscava um método assertivo que pudesse ajudar tanto os deficientes auditivos quanto aqueles alunos que assistem aos vídeos em transportes públicos ou quem nem sempre consegue ouvir o seu conteúdo enquanto assiste às aulas.
Além disso, segundo o cofundador e CTO do Gran Cursos Online, Rodrigo Calado, até mesmo os alunos que não possuem deficiência auditiva, ao assistir às videoaulas e ler as legendas ao mesmo tempo, gerariam um estímulo a mais no cérebro, aumentando a retenção do conteúdo. Mas nada se compara a um dos objetivos principais da EdTech, que é o de democratizar a educação no Brasil, haja vista que o país possui mais de 10,7 milhões de brasileiros com algum nível de deficiência auditiva, afirma Calado.
Nos dois últimos anos, gerou-se um volume superior a 20 mil horas de vídeo. O objetivo era legendá-las em um tempo realmente curto. Além disso, buscando sempre entregar as melhores soluções tecnológicas para seus alunos, o Gran Cursos Online buscava uma legendagem com um índice de confiança alto.
A SOLUÇÃO
O time da BRLink analisou as necessidades do projeto e elaborou uma estrutura completamente serverless na AWS. Essa arquitetura permite alta escalabilidade, disponibilidade e baixo custo para o cliente.
A estrutura de pipeline envolve serviços como Amazon S3, AWS Lambda, Amazon Simple Queue Service, Amazon DynamoDB, Amazon CloudWatch, Amazon Athena, Amazon QuickSight e Amazon Transcribe.
Além da legendagem em si, cuidados foram tomados no que diz respeito à monitoração de todo o ambiente, ao tratamento de erros, ao armazenamento de logs e aos metadados.
A solução é capaz de processar uma quantidade muito grande e escalável de vídeos em paralelo. O limite aqui está associado à capacidade de processamentos simultâneos do Amazon Transcribe, o qual pode ser ajustado por meio de uma solicitação ao time de suporte da AWS. Dessa forma, a quantidade de processamento em paralelo é configurável na plataforma.
RESULTADOS
O projeto está operacional até hoje. Nos primeiros cinco dias de processamento, a estrutura foi capaz de legendar mais de 20 mil horas de videoaulas do Gran Cursos Online, volume referente aos últimos dois anos de produções da empresa.
A média de confiança para as legendas automatizadas dos vídeos é alta: 92,948%. Esse número é importante para garantir a qualidade do conteúdo para os alunos. Quanto mais próximo a 100%, melhor a precisão.
Além da monitoração de todo o pipeline, foi construída uma curadoria das palavras e das expressões com menores índices de confiança, para que sejam tratadas por outros modelos de machine learning, de acordo com o conteúdo da videoaula.
Esse projeto abriu espaço para infinitas possibilidades de técnicas de analytics e machine learning, por meio da utilização das informações das legendas de metadados gerados. Com isso, foi possível iniciar um novo projeto, de similaridade de conteúdo entre os vídeos, utilizando o Amazon SageMaker.
A BRLink é um Parceiro AWS, de nível Premier (mais alto nível da AWS Partner Network), tem diversas Competências AWS, como DevOps, Migration e Education, e faz parte também dos programas AWS MSP, Well-Architected Partner Program e APN Immersion Days.