Meta usou Bíblia para fazer com que modelos de IA reconheçam 1,1 mil idiomas

Novos modelos “entendem” 11 vezes mais idiomas que os rivais. Meta abriu a tecnologia a todos os interessados, sem custo.

A Meta divulgou nesta segunda-feira (22.mai) novos modelos de inteligência artificial (IA) capazes de lidar com 1,1 mil idiomas.

O número é 11 vezes maior que os modelos mais avançados disponíveis até então, como o Whisper, da OpenAI.

O QUE HOUVE? Os novos modelos conseguem reconhecer falas e textos em 1,1 mil idiomas e converter entre esses formatos.

É grande salto em relação aos modelos vigentes, capazes de lidar com cerca de 100 idiomas.

UTILIZAÇÃO. Segundo a Meta, há inúmeras aplicações possíveis, como em aplicativos de realidade virtual e de trocas de mensagens. O objetivo é que mais pessoas consigam interagir com interfaces e outras pessoas em seus idiomas nativos.

“Nosso objetivo é facilitar às pessoas o acesso à informação e o uso de seus dispositivos em seus idiomas preferidos”, diz a empresa.

A Meta abriu os modelos sob uma licença de uso comum. Eles podem ser baixados no GitHub.

COMO? A grande dificuldade para o reconhecimento de idiomas é a ausência gravações em áudio, devidamente rotuladas, nos idiomas menos falados.

Para superar essa lacuna, os engenheiros da Meta reduziram a amostragem a textos do Novo Testamento da Bíblia, pela ampla disponibilidade e porque “suas traduções foram amplamente estudadas para a pesquisa de traduções de idiomas baseados em texto”.

Em média, cada gravação da Bíblia produziu 32 horas de dados por idioma. Essas gravações também foram transcritas.

Em seguida, a empresa usou um algoritmo para alinhar a versão rotulada do áudio da Bíblia a uma não rotulada. Por fim, outros algoritmos de alinhamento de texto e áudio foram usados para “ensinar” os idiomas ao modelo.

Apesar do treino baseado em textos bíblicos, a Meta afirma que “isso não gerou vieses no modelo para produzir mais linguagem religiosa”.

E AGORA? Os materiais disponibilizados no GitHub não são usáveis por qualquer um. São voltados a desenvolvedores, que poderão implementá-los em aplicações comerciais.

Via Meta, MIT Technology Review (ambos em inglês).

Receba nossas newsletters e traga felicidade para sua vida.

Não perca nada: você vai receber as newsletters Garimpo (memes e atualidades), Polígono (curadoria de ciência nas redes sociais) e Prensadão (resumo semanal de tudo o que o Núcleo fez). É fácil de receber e fácil de gerenciar!
Show de bola! Verifique sua caixa de entrada e clique no link para confirmar sua inscrição.
Erro! Por favor, insira um endereço de email válido!