Projeto de inteligência artificial pretende fortalecer línguas indígenas no Brasil

Muito antes dos portugueses chegarem ao Brasil, em 1500, os povos indígenas já habitavam nossas terras. Os europeus, além de explorarem as áreas brasileiras, também interferiram nos costumes e hábitos de quem já residia por aqui, incluindo a linguagem, e vários idiomas falados foram se perdendo. Agora, cientistas usam a Inteligência Artificial para restaurar e fortalecer as línguas originárias do Brasil.

Publicado por
Isabella Caminoto

Em meio a tantas mudanças culturais, mais de dois terços das línguas indígenas foram se perdendo ao longo do caminho, ao passo que nos dias de hoje muitas delas estão cada vez mais enfraquecidas.

Para ajudar a mudar esse cenário, um projeto conjunto da USP, por meio do Centro de Inteligência Artificial (C4AI) e da IBM Research, tem como objetivo empregar as tecnologias de Inteligência Artificial (IA) no fortalecimento de línguas indígenas brasileiras.

A iniciativa pretende criar e desenvolver ferramentas que auxiliem a documentação, preservação, vitalização e uso desses idiomas, sempre em parceria com as comunidades de povos indígenas.

De acordo com os pesquisadores envolvidos, os primeiros protótipos de pesquisa poderão ser testados no segundo semestre de 2023.

Por meio da área de Processamento de Linguagem Natural (PLN), a IA poderá ajudar, por exemplo, na construção de sistemas de conversão de fala para texto e vice-versa, no desenvolvimento de ferramentas de tradução e expansão de vocabulário, na melhoria de programas de coleta e análise linguística, além de outros avanços tecnológicos que podem ser aplicados para a preservação das línguas nativas.

A criação de teclados e completadores de texto para línguas indígenas, bem como o uso de computadores e robôs na educação de crianças e jovens das comunidades, também serão explorados no projeto.

“Nós vamos atuar, principalmente, em duas frentes. Uma delas é a de vitalizar, ou seja, aumentar a quantidade de jovens que falam e escrevem essas línguas. Já a segunda é voltada para fortalecer as línguas indígenas que já se encontram em um processo de desaparecimento, por isso estamos buscando formas de documentá-las para que elas sejam mantidas para a posteridade. Há línguas, por exemplo, que possuem apenas três únicos falantes, de 70 anos de idade. Mas o fundamental é estar sempre trabalhando com as comunidades indígenas e com especialistas no assunto”, explica o vice-diretor do C4AI, Claudio Pinhanez, um dos líderes do projeto junto com a professora Luciana Storto, da Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH) da USP.

Adaptar tecnologias

O trabalho em desenvolvimento no Centro de Inteligência Artificial da USP é dividido por áreas de interesse. Em cada uma delas, a IA é empregada de uma maneira específica, sempre visando ao fortalecimento e ao uso das línguas indígenas.

Os pesquisadores buscam adaptar as tecnologias de IA para estas línguas, criar ferramentas de apoio ao trabalho linguístico – por exemplo, sistemas de transcrição fonética, tradução automática, análise gramatical e criação de dicionários digitais –, além de utilizar essas línguas nas redes sociais e em conjunto com chatbots voltados para a educação dos povos indígenas – um esforço pioneiro.

Pinhanez explica que, hoje, não existem tradutores de línguas indígenas para o português brasileiro.

“Se você colocar no ChatGPT, por exemplo, ele inventa do nada uma língua. Ele apresenta diversas palavras que parecem, mas que não são indígenas. O que estamos elaborando é uma construção conjunta, mostrando aos povos indígenas o que podemos fazer e ouvindo o que eles querem e precisam. Dentro de tantas dificuldades, foram eles que nos procuraram e trouxeram as demandas existentes. Segundo os líderes das comunidades, a maior preocupação são os jovens, que estão crescendo sem sequer saber a própria língua, incluindo a capacidade de escrever. Mostramos o que pode ser tentado e o que podemos criar. Se isso irá resolver, aí é outra questão. O que já vimos até aqui é um retorno muito bom da comunidade com que estamos trabalhando, eles estão gostando do que está sendo proposto e direcionando o trabalho de acordo com suas necessidades. É um processo. A tecnologia tem que se adaptar ao mundo deles e eles têm que aprender sobre a tecnologia”, afirmou.

Parceria com escolas indígenas

Atualmente, o projeto tem uma parceria com escolas da Terra Indígena Tenonde Porã, no sul da cidade de São Paulo. Embora as crianças e jovens da comunidade falem fluentemente a língua guarani mbya, eles ainda apresentam dificuldades em aplicar sua parte escrita. Nesse sentido, o projeto prevê oficinas semanais com os estudantes e professores do ensino médio para que ferramentas de escrita e de documentação linguística sejam exploradas e desenvolvidas de forma conjunta.

“Estamos felizes com as oficinas que vêm sendo desenvolvidas. Esses momentos têm sido importantes para pensarmos como as ferramentas tecnológicas podem nos ajudar a valorizar nossa língua materna, por meio do apoio ao desenvolvimento da escrita, nossos conhecimentos e práticas. Além disso, temos refletido sobre os processos de tradução e a importância dos usos dessas ferramentas como instrumento político de fortalecimento dos nossos modos de viver”, afirma a liderança da Terra Indígena Tenonde Porã.

As ferramentas estão sendo codesenvolvidas com os alunos e professores da escola e usadas em aula de uma forma experimental.

Outro objetivo do projeto é viabilizar a formação e o desenvolvimento contínuos das comunidades pelos seus próprios membros, permitindo que eles aprendam e ensinem conteúdos de informática, programação, IA e linguística, além de atuarem em rede com profissionais interessados em contribuir para a vitalidade das línguas indígenas.

A iniciativa do C4AI e IBM é importante porque a maioria das línguas indígenas no Brasil e no mundo está ameaçada de desaparecer até o final do século 21. Além de enfrentar a invasão territorial, a disseminação de doenças e a destruição de ecossistemas, os povos indígenas sofrem com a imposição de línguas europeias, a educação não diferenciada e a intensificação das relações com o mundo dos não indígenas. A transformação digital com a internet, celulares, jogos on-line e mídias sociais tem desestimulado muitos indígenas, especialmente crianças e jovens, a falar e conhecer suas línguas originárias no cotidiano.

Nesse sentido, a IA pode ser vista como uma aliada desses povos na preservação e continuidade de suas culturas. Com o uso das novas tecnologias, é possível confrontar os desafios e ameaças que as línguas indígenas enfrentam e garantir sua continuidade para as gerações futuras.

A equipe envolvida no projeto é formada atualmente por cerca de 20 pessoas, sendo elas pesquisadores, professores, alunos bolsistas, profissionais técnicos e estagiários. O projeto conta também com um bolsista de pós-doutorado, quatro bolsistas de graduação e um bolsista para auxílio técnico, apoiados por um projeto de pesquisa do C4AI, que conta com apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp). Além disso, por parte da IBM Research, participam um engenheiro de software, um doutorando e dois estagiários de graduação.

A iniciativa segue na busca ativa por professores, profissionais, estudantes e alunos indígenas que tenham interesse em integrar a equipe. Além disso, a ideia é que o projeto conte com indígenas que atuem como professores (em todos os níveis), linguistas, programadores e profissionais de TI e tradutores. O C4AI e a IBM estão abertos a novas parcerias e demandas para ampliar a gama de atuação dessa importante frente de trabalho.

(Com Jornal da USP)

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 13:19

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024

Nvidia lança supercomputador de IA compacto e barato

A Nvidia acaba de apresentar o Jetson Orin Nano Super Developer Kit, um supercomputador de…

18 de dezembro de 2024

OpenAI libera o1 para API e novas ferramentas para desenvolvedores

A OpenAI acabou de lançar uma série de atualizações para desenvolvedores no 9º dia do…

18 de dezembro de 2024