O que é machine translation?

Machine translation é o processo de usar inteligência artificial para traduzir um texto automaticamente de um idioma para outro sem o envolvimento humano. A machine translation moderna vai além de uma simples tradução palavra por palavra para comunicar o real significado do texto no idioma original no idioma alvo. Ela analisa todos os elementos do texto e reconhece como as palavras influenciam umas às outras.

Quais são os benefícios da machine translation?

Os tradutores humanos usam os serviços de tradução automática para traduzir de maneira mais rápida e eficiente. Daremos alguns benefícios da machine translation abaixo:

Assistência de tradução automatizada

Machine translation fornece um ótimo ponto de partida para tradutores humanos profissionais. Muitos sistemas de gerenciamento de tradução integram um ou mais modelos de machine translation em seus fluxos de trabalho. Eles têm configurações que permitem executar as traduções automaticamente para depois enviá-las aos tradutores humanos pós-editarem.

Velocidade e volume

Machine translation funciona muito rápido, traduzindo milhões de palavras quase instantaneamente. Ela pode traduzir grandes quantidades de dados, como bate-papos em tempo real ou casos jurídicos em grande escala. Ela também pode processar documentos em um idioma estrangeiro, buscar termos relevantes e lembrar esses termos para aplicações futuras.

Grande seleção de idiomas

Muitos dos grandes fornecedores de machine translation oferecem suportes para 50-100 idiomas ou mais. As traduções também acontecem simultaneamente em vários idiomas, o que é útil para implantações de produtos globais e atualizações de documentos.

Tradução econômica

A machine translation aumenta a produtividade e a habilidade de entregar traduções rapidamente, reduzindo o tempo para comercialização. Há menos envolvimento humano no processo já que a machine translation fornece uma tradução básica, mas de valor, reduzindo tanto o custo quanto o tempo de entrega. Por exemplo, em projetos de grande volume, você pode integrar a machine translation com seus sistemas de gerenciamento de conteúdo para automaticamente marcar e organizar o conteúdo antes de traduzi-lo em diferentes idiomas.

Episódio 1: Introdução ao Amazon Translate e à tradução automática neural

Quais são alguns casos de uso de machine translation?

Há inúmeros casos de uso de machine translation, como os mostrados abaixo:

Comunicação interna

Para uma empresa que opera em diferentes países do mundo, a comunicação pode ser algo difícil de gerenciar. As habilidades linguísticas podem variar de funcionário para funcionário, e alguns podem não entender muito bem o idioma oficial da empresa. A machine translation ajuda a diminuir ou eliminar a barreira do idioma na comunicação. Indivíduos conseguem obter a tradução de um texto e entender o conteúdo principal da mensagem rapidamente. Você pode usar para traduzir apresentações, informativos da empresa e outros documentos de comunicação comuns.

Comunicação externa

As empresas usam machine translation para comunicar mais eficiência com as partes interessadas e clientes. Por exemplo, você pode traduzir documentos importantes em diversos idiomas para parceiros e clientes globais. Se uma loja online opera em diferentes países, a machine translation pode traduzir avaliações de produtos para que os clientes possam ler em seu próprio idioma.

Análise de dados

Alguns tipos de machine translation podem processas milhões de comentários gerados por usuário e entregar resultados altamente precisos em um curto espaço de tempo. Empresas traduzem uma grande quantidade de conteúdos postados em mídias sociais e sites todos os dias, e os traduzem para análise. Por exemplo, elas podem analisar as opiniões de clientes escritas em vários idiomas automaticamente.

Atendimento ao cliente online

Com a machine translation, marcas podem interagir com clientes do mundo todo, sem se preocupar com o idioma que eles falam. Por exemplo, elas podem usar a machine translation para:

  • Traduzir solicitações de clientes de todo o mundo de maneira precisa
  • Aumentar a escala do bate-papo ao vivo e automatizar os e-mails de atendimento ao cliente
  • Melhorar a experiência do cliente sem contratar mais funcionários

O departamento jurídico usa machine translation para preparar documentos jurídicos em diferentes países. Com a machine translation, uma grande quantidade de conteúdo que seria difícil de processar em diferentes idiomas fica disponível para análise.

Qual é a história da machine translation?

A ideia de usar computadores para traduzir os idiomas humanos automaticamente surgiu pela primeira vez no início dos anos 50. No entanto, naquele tempo, a complexidade da tradução era muito maior do que as estimativas iniciais dos cientistas da computação. Era necessário um enorme poder de processamento de dados e armazenamento, que estava além da capacidade das primeiras máquinas.

No inícios dos anos 2000, hardwares, dados e softwares de computadores se tornaram capazes de fazer o básico de machine translation. Os primeiros desenvolvedores usaram banco de dados estatísticos de idiomas para treinar computadores para traduzir textos. Isso demanda muito tempo e trabalho manual. Era necessário começar o desenvolvimento do zero para cada idioma adicionado. Desde então, a machine translation evoluiu tanto em velocidade quanto em precisão, e surgiram diversas estratégias de machine translation.

Quais são as diferentes abordagens para machine translation?

Na machine translation, o texto ou idioma original é chamado de idioma de origem, e o idioma para o qual você quer traduzir é chamado de idioma de destino. A machine translation funciona seguindo um processo básico de duas etapas:

  1. Decifrar o significado do idioma de origem do texto original
  2. Codificar o significado no idioma de destino

Mostraremos algumas abordagens comuns sobre como a tecnologia de tradução de idiomas implementa esse processo de machine translation.

Machine translation baseada em regras

Especialistas em idiomas desenvolvem regras linguísticas e dicionários bilíngues integrados para setores ou assuntos específicos. A machine translation baseada em regras usa esses dicionários para traduzir um conteúdo específico de maneira precisa. As etapas desse processão são:

  1. O software da machine translation analisa o texto de entrada e cria uma representação transitória
  2. Ele converte a representação para o idioma de destino usando regras gramaticais e dicionários como referência

Prós e contras

A machine translation baseada em regras pode ser personalizada para um setor ou assunto específico. É previsível e fornece tradução de qualidade. No entanto, produz resultados pobres se o texto de origem tiver erros e usar palavras que não estão nos dicionários integrados. A única maneira de melhorar isso é atualizando os dicionários manualmente com frequência.

Machine translation estatística

Em vez de depender de regras linguísticas, a machine translation estatística usa machine learning para traduzir textos. Os algoritmos de machine learning analisam grandes quantidades de traduções humanas que já existem e procuram padrões estatísticos. O software então faz um palpite inteligente quando precisa traduzir um novo texto de origem. Ele faz predições baseadas na probabilidade estatística de uma frase ou palavra específica aparecer com outra palavra ou frase no idioma de destino.

Machine translation baseada em sintaxe

A machine translation baseada em sintaxe é uma subcategoria da machine translation estatística. Ela usa regras gramaticais para traduzir unidades sintáticas. Ela analisa sentenças para incorporar regras sintáticas nos modelos de tradução estatísticos.

Prós e contras

Os métodos estatísticos requerem treinamento para milhões de palavras para cada par de idiomas. No entanto, com dados suficientes, a machine translation é precisa.

Machine translation neural

A machine translation neural usa inteligência artificial para aprender idiomas e melhorar continuamente esse conhecimento usando um método de machine learning específico chamado rede neural. Geralmente atua em conjunto com métodos de tradução estatística.

Rede neural

Uma rede neural é um conjunto de nós interconectados inspirados no cérebro humano. É um sistema de informação em que os dados de entrada passam por inúmeros nós interconectados para gerar um resultado. O software de machine translation neural usa redes neurais para trabalhar com conjuntos de dados imensos. Cada nó faz uma mudança atribuída do texto de origem para o texto de destino até que o nó de saída dê o resultado final.

Machine translation neural x outros métodos de tradução

Redes neurais consideram toda a sentença de entrada a cada etapa ao produzir a sentença de saída. Outros modelos de machine translation quebram a sentença de entrada em conjuntos de palavras e frases, mapeando-as em uma palavra ou sentença no idioma de destino. Os sistemas de machine translation neural podem lidar com várias limitações dos outros métodos e, geralmente, produzem traduções de melhor qualidade.

Machine translation híbrida

As ferramentas de machine translation híbrida usam dois ou mais modelos de machine translation em uma peça de software. Você pode usar a abordagem híbrida para melhorar a eficiência de um único modelos de tradução. Esse processo de machine translation geralmente usa subsistemas de machine translation estatística e baseada em regras. A tradução final de saída é uma combinação de um resultado de todos os subsistemas.

Prós e contras

Os modelos de machine translation híbrida melhoram a qualidade da tradução satisfatoriamente ao superar os problemas ligados a métodos de tradução únicos.

O que é uma ferramenta de tradução assistida por computador?

As ferramentas de tradução assistida por computador (CAT tools) trabalham junto com softwares de tradução para auxiliar na tradução de textos. As CAT tools automatizam tarefas relacionadas à tradução, como edição, gerenciamento e armazenamento de traduções. O texto é inserido no software CAT e dividido em fragmentos, como frases, sentenças e parágrafos. O software salva cada segmento e sua tradução em um banco de dados, agilizando o processo de tradução e garantindo consistência com traduções anteriores.
 
Muitas empresas multinacionais usam ferramentas de software CAT para automatizar projetos que precisam de tradução.

Tradução automatizada

Tradução automatizada se refere a qualquer automação integrada à CAT tool para fazer tarefas repetitivas relacionadas à tradução. A tradução automatizada funciona com gatilhos embutidos no texto que dizem ao sistema para usar a automação. Por exemplo, você pode usá-la para inserir textos usados frequentemente em documentos a partir de um banco de dados.

Qual é a tecnologia de machine translation mais precisa?

A machine translation neural é aceita unanimemente como a abordagem de machine translation mais precisa, versátil e fluente. Desde sua invenção na metade dos anos 2010, a machine translation neural se tornou a tecnologia de machine translation mais avançada. É mais precisa do que a machine translation estatística, da fluência à organização. Agora é considerada o padrão no desenvolvimento de machine translation.

A performance de um tradutor automático depende de vários fatores, incluindo:

  • A tecnologia ou mecanismo de machine translation
  • O par de idiomas
  • Os dados de treinamento disponíveis
  • Os tipos de texto para tradução. Conforme o software faz mais traduções para um idioma ou domínio específico, mais resultados de qualidade ele irá produzir. Uma vez treinada, a machine translation neural se torna mais precisa, rápida e fácil de adicionar idiomas

A machine translation pode substituir a tradução humana?

A machine translation pode substituir a tradução humana em alguns casos em que faça sentido e é necessária em grandes volumes. Por exemplo, muitas empresas de serviço usam machine translation para ajudar clientes em um bate-papo instantâneo ou para responder e-mails rapidamente. No entanto, se você traduz um conteúdo mais profundo, como páginas de sites ou aplicativos de celular, a tradução pode não ser precisa. É importante ter um tradutor humano para editar o conteúdo antes do uso.

Qual é a tecnologia de machine translation mais precisa?

O Amazon Translate é um serviço de machine translation neural que fornece traduções de idiomas com rapidez, de alta qualidade, acessíveis e personalizáveis. Com o Amazon Translate, você pode localizar conteúdos como sites e aplicativos para seus usuários diversificados, traduzir facilmente grandes volumes de dados para análise e habilitar de forma eficiente a comunicação em idiomas diferentes entre os usuários. Com o Amazon Translate, você pode:

  • Integrar facilmente nas suas aplicações com uma chamada de API
  • Personalizar seus resultados de machine translation com terminologia personalizada para definir como nomes de marca, nomes de modelo e outros termos exclusivos são traduzidos
  • Dimensionar para atender às suas necessidades de tradução com traduções mais rápidas e confiáveis

Para começar a usar o Amazon Translate, crie uma conta AWS hoje.

Próximas etapas da machine translation AWS

Standard Product Icons (Features) Squid Ink
Confira outros recursos relacionados a produtos
Saiba mais sobre o Amazon Translate 
Sign up for a free account
Veja o nível gratuito da AWS

Obtenha acesso instantâneo a serviços gratuitos com o nível gratuito da AWS.

Veja o nível gratuito da AWS 
Standard Product Icons (Start Building) Squid Ink
Comece a criar no console

Comece a criar com o SageMaker no Console de Gerenciamento da AWS.

Cadastrar-se