Historiadores da Grécia Antiga ganharam uma nova ferramenta de inteligência artificial (IA) para ajudar a decifrar textos, sugere um estudo divulgado na revista Nature. Desenvolvido pela empresa DeepMind, do Google, em colaboração com colegas da Universidade de Veneza (Itália), da Universidade de Oxford (Reino Unido) e da Universidade de Economia e Negócios de Atenas (Grécia), o Ithaca, um aplicativo de aprendizado de máquina, faz suposições precisas sobre palavras ausentes e a localização e datas de textos gregos antigos.

O recurso vem a calhar para os difíceis estudos envolvendo o grego antigo. Os textos antigos incompletos têm muitos problemas, incluindo materiais degradados. O documento original pode ser feito de pedra, barro ou papiro, estar escrito em acadiano, grego antigo ou linear A, e descrever qualquer coisa, desde a conta de um merceeiro até a jornada de um herói. A característica comum entre eles, porém, é o dano acumulado ao longo de milhares de anos.

Os trechos onde o texto é desgastado ou rasgado são frequentemente chamados de lacunas. Essas lacunas podem ser tão curtas quanto uma letra perdida, tão longas quanto um capítulo, ou mesmo uma história inteira. Preenchê-las pode ser fácil ou impossível. É aqui que a nova ferramenta deve ajudar.

Ferramenta, não solução

Usado em uma enorme biblioteca de textos gregos antigos, o Ithaca (cujo nome homenageia em inglês a ilha natal de Ulisses, Ítaca) não apenas pode dizer qual é a palavra ou frase que está faltando, mas também pode dar uma olhada em quantos anos tem e onde foi escrito. Não vai preencher todo um ciclo épico por conta própria; é uma ferramenta para quem trabalha com esses textos, não uma solução.

O aplicativo foi “treinado” pelos pesquisadores a partir de 60 mil textos gregos dos anos 700 a.C. a 500 d.C. Cada um já havia sido extensivamente estudado e reconstruído quando necessário. A equipe então executou o Ithaca nos mesmos textos antes da reconstrução. A seguir, “treinaram” o aplicativo em outros 8 mil textos bem estudados para testá-lo contra o trabalho feito por especialistas humanos.

Os pesquisadores descobriram que o sistema tem 62% de precisão, um percentual melhor do que o desempenho dos historiadores. Mas os melhores resultados vieram de colaborações entre o aplicativo de IA e os historiadores: a parceria permitiu atingir uma precisão geral de 72%.

Um recurso interessante do aplicativo é a capacidade de atribuir um texto a uma hora e lugar usando pistas encontradas no texto e em outras fontes. Os pesquisadores descobriram que o sistema tem 71% de precisão na determinação da origem do escritor e podem colocar a data da escrita dentro de 30 anos, em média.

Esta inscrição restaurada (IG I3 4B) registra um decreto referente à Acrópole de Atenas e data de 485/4 a.C. Crédito: Wikimedia Commons, CC BY-SA 3.0

O estudo demonstrou sua eficácia usando como exemplo alguns decretos da época de Péricles em Atenas. Acredita-se que tenham sido escritos por volta de 445 a.C. O Ithaca sugeriu que, com base em sua análise textual, eles eram na verdade de 420 a.C., o que está de acordo com evidências mais recentes.

Quanto ao texto em si, os especialistas do estudo obtiveram cerca de 25% de precisão na primeira passagem. Não é um resultado excepcional, mas a restauração de texto é um projeto de longo prazo, na verdade.

O Ithaca data a inscrição em 413 a.C., correspondendo ao intervalo exato proposto pelos historiadores. Crédito: DeepMind, via Nature/CC BY 4.0

Embora o grego antigo seja uma área óbvia e frutífera para o trabalho do Ithaca, a equipe já está trabalhando duro em outros idiomas – acadiano, demótico, hebraico e maia – também. E mais serão adicionados ao longo do tempo.

“O Ithaca ilustra a contribuição potencial do processamento de linguagem natural e aprendizado de máquina nas humanidades”, disse Ion Androutsopoulos, professor da Universidade de Economia e Negócios de Atenas que trabalhou no projeto. “Precisamos de mais projetos como o Ithaca para mostrar ainda mais esse potencial, mas também cursos e material didático adequados para educar futuros pesquisadores que terão uma melhor compreensão conjunta das humanidades e dos métodos de IA.”