O blog da AWS
Como a Codebit criou um sistema para transcrição em braille para a Fundação Dorina usando IA na AWS
Este post foi escrito por Heitor Cunha, CEO Codebit; Rafael Martins, Fundação Dorina Nowill para Cegos; Carla De Maria, Fundação Dorina Nowill para Cegos; Letícia Dornelles, arquiteta Soluções AWS; Laura de Souza, arquiteta Soluções AWS e Vanessa Fernandes, arquiteta de soluções AWS.
Introdução
O Braille é um sistema de leitura e escrita para pessoas com deficiência visual. Ele usa pontos em relevo dispostos em células de seis pontos que permitem a formação de 63 caracteres diferentes, proporcionando acesso à comunicação escrita e alfabetização para pessoas cegas.
A Fundação Dorina Nowill para Cegos, tem se dedicado à inclusão social de pessoas cegas e com baixa visão há mais de sete décadas. Uma das formas como realizam esse trabalho é por meio da produção e distribuição gratuita de livros em braille, incluindo o envio sem custos para milhares de escolas, bibliotecas e organizações de todo o Brasil.
Seu propósito é “promover a inclusão e acessibilidade às pessoas cegas e com baixa visão, para juntos transformar vidas e a sociedade” , o que os levou a alcançar números expressivos. Apenas em 2023, foi realizada, no Editorial Braille, a produção de 250 mil páginas editoradas, além da impressão de mais de 14 milhões de páginas em braille na gráfica.
Desafio e Cenário da Deficiência Visual no Brasil
O Instituto Brasileiro de Geografia e Estatística (IBGE) aponta que existem mais de 6,5 milhões de pessoas com deficiência visual no Brasil, sendo 500 mil pessoas cegas e cerca de 6 milhões com baixa visão.
Segundo a Organização Mundial da Saúde, pelo menos 2,2 bilhões de pessoas em todo o mundo, têm uma deficiência visual ou cegueira, das quais pelo menos 1 bilhão delas tem uma deficiência visual que poderia ter sido evitada ou que ainda não foi tratada.
Segundo o IBGE, no Brasil a taxa de analfabetismo para as pessoas com algum tipo de deficiência foi de 19,5%, enquanto para as pessoas sem deficiência foi de 4,1%. Outros dados alarmantes são que:
- 17,5 milhões de pessoas com deficiência estão em idade apta a trabalhar;
- apenas 29,2% estão no mercado de trabalho;
- contra 66,4% das pessoas que não possuem algum tipo de deficiência;
- dessas 17,5 milhões de pessoas, 30,9% possuem alguma dificuldade para enxergar, mesmo usando óculos ou lentes de contato.
Diante desse contexto, o braille é a ferramenta fundamental para o acesso à educação e à independência de pessoas cegas e com baixa visão, proporcionando maior acesso à informação, capacitação, independência e liberdade.
Com isso em mente, um dos principais produtos da Fundação Dorina são os livros em braille. O processo de transcrição para o braille é composto das seguintes fases:
- Importação: livro convencional em PDF é importado no sistema, o texto e imagens são extraídos.
- Linearização: os textos são catalogados, corrigidos e organizados na plataforma.
- Descrição de imagens: as imagens são transcritas para texto e então a Fundação Dorina utiliza uma solução de inteligência artificial desenvolvida internamente, que proporciona um aumento significativo de eficiência no processo de geração das descrições das imagens. Essas descrições iniciais são, posteriormente, revisadas manualmente por profissionais especializados, que fazem os ajustes necessários para garantir que as descrições estejam alinhadas com as especificidades das obras.
- Diagramação: essa é a última etapa onde o conteúdo é convertido para Braille. Diversos ajustes são necessários para que o conteúdo fique adequado para a impressão neste sistema de escrita tátil. Este processo está em constante fase de aprimoramento.
- Impressão: nessa etapa o livro é impresso, pronto para consumo de pessoas com deficiência visual.
O processo de transcrição manual já era feito há anos pela Fundação, porém o desafio do negócio era escalar esse mecanismo, visto que manualmente a capacidade produtiva era bem limitada, algo em torno de 30 páginas por dia.
Solução
A Fundação Dorina confiou na Codebit, parceira AWS, para o desenvolvimento da sua Plataforma Braille. O principal objetivo da plataforma era escalar a transcrição e adaptação de livros para o formato braille, visando aumentar a produtividade da equipe editorial e, consequentemente, a quantidade de títulos disponibilizados pela Fundação.
Durante o desenvolvimento da plataforma, o time da Codebit enfrentou alguns desafios técnicos. Os livros didáticos comuns contêm diversas ilustrações, cores, diagramas e estruturas que buscam facilitar o lúdico para crianças que enxergam, mas dificultam consideravelmente uma adaptação para crianças com deficiência visual. Por isso, foi preciso criar uma plataforma capaz de linearizar e estruturar os dados para então convertê-los para braille.
Figura 1: Arquitetura construída na AWS
Durante o projeto foram necessárias várias versões do sistema de conversão. Então para automatizar o deploy a Codebit utilizou os serviços de code da AWS como:
- AWS CodeCommit – É um serviço totalmente gerenciado de controle de código-fonte que hospeda repositórios seguros baseados em Git.
- AWS CodeBuild – É um serviço de integração contínua totalmente gerenciado na nuvem, que compila seu código-fonte, executa testes de unidade e produz artefatos prontos para serem implantados.
- AWS CodePipeline – É um serviço gerenciado de entrega contínua que ajuda a automatizar pipelines de liberação para oferecer atualizações rápidas e confiáveis de aplicativos e infraestrutura.
- AWS CodeDeploy – É um serviço totalmente gerenciado que automatiza implantações de software em diversos serviços de computação como Amazon EC2, AWS Fargate, AWS Lambda e servidores locais.
Para um monitoramento adequado do funcionamento do sistema e alertas, a Codebit utilizou:
- Amazon CloudWatch – É um serviço que monitora aplicações, responde às mudanças de desempenho, otimiza o uso de recursos e fornece insights sobre a integridade operacional.
- Amazon CloudTrail – É um serviço que possibilita governança, conformidade, auditoria operacional e de riscos na sua conta da AWS.
- Amazon SNS – É um serviço que facilita a configuração, a operação e o envio de notificações da nuvem.
A arquitetura consiste em:
- Uma VPC com duas subredes (uma pública e uma privada);
- As requisições chegam no Amazon Route 53 que resolve o DNS e encaminha para o Amazon Elastic Load Balancer;
- O ELB distribui a carga entre as instâncias EC2;
- Nas instâncias EC2 está hospedada a aplicação;
- A aplicação se conecta a um banco de dados Amazon RDS.
O processo começa quando o usuário sobe um arquivo PDF para a plataforma. A aplicação então faz uma chamada para o Amazon Textract, um serviço de machine learning (ML) que extrai automaticamente textos impressos ou manuscritos, elementos de layout e dados de documentos digitalizados.
A fase seguinte é a edição por um especialista da Fundação Dorina. Na sequência, o arquivo editado é novamente submetido à Plataforma Braille. “O arquivo gerado é compatível com o Braille Fácil – editor de textos para a transcrição e a impressão em braille – e precisa ser avaliado em razão de exigências do contratante”, ressalta Ítalo Martins, gerente de projetos de TI e sócio da CodeBit. Quando o arquivo estiver em conformidade, ele é salvo em um bucket do Amazon S3 e então enviado para impressão.
Em resumo, o trabalho que era feito de maneira separada foi unificado na Plataforma Braille e eliminou a necessidade de copiar e colar o PDF no Braille Fácil, fazer a descrição de cada foto, gráfico, ícone e outras imagens.
Livros didáticos, por exemplo, têm várias nuances, cores, ilustrações, diagramas e estruturas que facilitam o aprendizado para crianças que enxergam, mas não para estudantes cegos. Então, com a Plataforma Braille, essa transposição se tornou muito mais ágil.
Através da Plataforma Ecossistema Braille, é possível realizar a linearização de textos em PDF e em seguida sua transcrição para braille. Como resultado, a plataforma conseguiu escalar o processo de linearização, ultrapassando as 30 páginas por dia, que eram produzidas manualmente, para 90 páginas de maneira automatizada, triplicando sua produção.
Próximos passos
A Plataforma Ecossistema Braille mostrou-se um sucesso, conseguindo escalar a linearização de PDFs, apoiando na otimização da produção de materiais em braille. Dessa forma, os times da Codebit e Fundação Dorina visam entregar novas funcionalidades na plataforma, como ferramentas para apoio na descrição de imagens e a automatização do processo de diagramação, possibilitando a visão do braille em tempo real.
O objetivo é obter uma maior automatização das etapas de transcrição para o braille para assim reduzir os erros e conseguir escalar todo o processo. Através do trabalho da Codebit, a fundação espera aumentar essa produtividade de 90 páginas por pessoa, elevando em média a capacidade de produção de 20 mil para 60 mil páginas por mês.
Confira uma reportagem sobre a previsão da Fundação Dorina em triplicar sua produção em braille em 2024.
Sobre os autores
Heitor Cunha é CEO e um dos fundadores da Codebit, empresa de desenvolvimento de soluções sob medida e gestão de infraestrutura em nuvem AWS. Engenheiro de computação e mestre em física médica, ambos pela USP, trabalhando com processamento de imagens de ressonância magnética. Atua com tecnologia desde os 9 anos, foi desenvolvedor, docente universitário, gestor de projetos e hoje dedica-se a tornar a Codebit uma referência em termos de crescimento e sustentabilidade. Acredita que nossa sociedade será melhor somente se utilizarmos o poder da tecnologia para melhorar a vida das pessoas. Tecnologia precisa ter uma causa e as causas precisam das melhores tecnologias. | |
Carla De Maria possui formação em Marketing, especialista em Gestão Comercial. Atualmente, é Gerente da área soluções em acessibilidade na Fundação Dorina Nowill para Cegos, onde atua há 12 anos. Responsável pelas áreas comercial, editorial, revisão e gráfica braille, audiovisual e central de formações. | |
Rafael Martins é gerente de TI e DPO (Data Protection Officer) da Fundação Dorina Nowill para Cegos. Formado em Administração de empresas e especialista em desenvolvimento Web, banco de dados e proteção de dados. | |
Letícia Dornelas, Arquiteta de Soluções da AWS, com foco em parceiros do setor público. Trabalha com desenvolvimento de sistemas há mais de 8 anos, atuando em projetos com arquiteturas distribuídas, escaláveis e resilientes. Formada pelo IFSP, tem um interesse especial em Machine Learning, Databases, Serverless e por livros. |
Laura Zitelli de Souza é Arquiteta de Soluções na AWS. Apoia parceiros do setor público em sua jornada para a nuvem AWS há 3 anos. Tem foco em projetos que envolvam arquiteturas distribuídas e escaláveis, além de grande interesse pelas áreas de inteligência artificial e aprendizado de máquina, serverless e infraestrutura como código. | |
Vanessa Rodrigues Fernandes é Arquiteta de Soluções do setor público na AWS. Com formação técnica em Redes de Computadores pela UFRGS, graduação em Segurança da Informação pela Universidade do Vale do Rio dos Sinos (RS) e Pós Graduação em Gestão Estratégica em TI pela PUCRS. Com mais de 20 anos de experiência na área de infraestrutura, redes, segurança da informação, trabalhou em diferentes nichos de mercado, ajudando empresas a suportar e construir soluções tecnológicas e estratégicas para seus negócios. É apaixonada por tecnologia, segurança da informação, inteligência artificial e viagens. |