Astrônomos podem passar sua carreira inteira sem encontrar um novo objeto no céu. Mas para Lina Necib, bolsista de pós-doutorado em física teórica do Instituto de Tecnologia da Califórnia (Caltech), a descoberta de um aglomerado de estrelas na Via Láctea, mas não nascido da Via Láctea, chegou cedo – com uma pequena ajuda de supercomputadores, do observatório espacial Gaia e de novos métodos de aprendizado profundo.

Em artigo publicado na revista “Nature Astronomy”, Necib e seus colaboradores descrevem Nyx, um vasto novo fluxo estelar nas proximidades do Sol, que pode fornecer a primeira indicação de que uma galáxia anã se fundiu com o disco da Via Láctea. Pensa-se que essas correntes estelares sejam aglomerados globulares ou galáxias anãs que foram esticadas ao longo de sua órbita por forças das marés antes de serem completamente interrompidas.

A descoberta de Nyx tomou um caminho tortuoso, mas que reflete a maneira multifacetada do estudo da astronomia e da astrofísica hoje.

LEIA TAMBÉM: TESS investiga colisão da jovem Via Láctea com galáxia anã

Simulações detalhadas

Necib estuda a cinemática – ou movimentos – de estrelas e matéria escura na Via Láctea. “Se existem aglomerados estelares que estão se movendo juntos de uma maneira específica, isso geralmente nos diz que há uma razão pela qual eles estão se movendo juntos.”

Desde 2014, pesquisadores do Caltech, da Northwestern University, da Universidade da Califórnia em San Diego e Berkeley (EUA), entre outras instituições, desenvolvem simulações altamente detalhadas de galáxias realistas como parte de um projeto chamado Fire (Feedback In Realistic Environments). Essas simulações incluem tudo o que os cientistas sabem sobre como as galáxias se formam e evoluem. A partir do equivalente virtual do início dos tempos, as simulações produzem galáxias que se parecem e agem como as nossas.

Simultaneamente ao projeto Fire, o observatório espacial Gaia foi lançado em 2013 pela Agência Espacial Europeia (ESA). Seu objetivo é criar um mapa tridimensional extraordinariamente preciso de cerca de 1 bilhão de estrelas em toda a Via Láctea e além.

Análises maciças

“É o maior estudo cinemático até hoje. O observatório fornece os movimentos de 1 bilhão de estrelas”, explicou ela. “Um subconjunto dele, 7 milhões de estrelas, possui velocidades 3D, o que significa que podemos saber exatamente onde uma estrela está e seu movimento. Passamos de conjuntos de dados muito pequenos para fazer análises maciças que não podíamos fazer antes para entender a estrutura da Via Láctea.”

A descoberta de Nyx envolveu a combinação desses dois grandes projetos astrofísicos e a análise deles usando métodos de aprendizado profundo.

Entre as questões abordadas pelas simulações e pela pesquisa do céu está: como a Via Láctea se tornou o que é hoje?

“As galáxias se formam engolindo outras galáxias”, disse Necib. “Assumimos que a Via Láctea tinha um histórico de fusões calmo e, durante algum tempo, foi preocupante o quão calmo era porque nossas simulações mostram muitas fusões. Agora, com acesso a muitas estruturas menores, entendemos que não era calmo quanto parecia. É muito poderoso ter todos esses instrumentos, dados e simulações. Todos eles precisam ser usados ao mesmo tempo para desvendar esse problema. Estamos nos estágios iniciais de poder realmente entender a formação da Via Láctea.”

Aplicando o aprendizado profundo a Gaia

Um mapa de 1 bilhão de estrelas é uma bênção mista: muita informação, mas quase impossível de analisar pela percepção humana.

“Antes, os astrônomos tinham de procurar e marcar muito e talvez usar alguns algoritmos de agrupamento. Mas isso não é mais possível”, disse Necib. “Não podemos olhar para 7 milhões de estrelas e descobrir o que elas estão fazendo. O que fizemos nessa série de projetos foi usar os catálogos de simulação de Gaia.”

O catálogo simulado de Gaia, desenvolvido por Robyn Sanderson (Universidade da Pensilvânia), perguntou essencialmente: “Se as simulações do Fire fossem reais e observadas com o Gaia, o que veríamos?”

O colaborador de Necib, Bryan Ostdiek (anteriormente da Universidade do Oregon e agora na Universidade Harvard), que já havia se envolvido no projeto do Grande Colisor de Hádrons (LHC, na sigla em inglês), tinha experiência em lidar com grandes conjuntos de dados usando aprendizado de máquina e profundo. Transportar esses métodos para a astrofísica abriu as portas para uma nova maneira de explorar o cosmos.

Aprendizado

“No LHC, temos simulações incríveis, mas nos preocupamos que as máquinas treinadas nelas aprendam a simulação e não a física real”, disse Ostdiek. “De maneira semelhante, as galáxias do Fire proporcionam um ambiente maravilhoso para treinar nossos modelos, mas não são a Via Láctea. Tivemos de aprender não apenas o que poderia nos ajudar a identificar as estrelas interessantes na simulação, mas também como obter isso para generalizar para a nossa verdadeira galáxia.”

A equipe desenvolveu um método para rastrear os movimentos de cada estrela nas galáxias virtuais e rotulá-las como nascidas na galáxia hospedeira ou consideradas como produtos de fusões de galáxias. Os dois tipos de estrelas têm assinaturas diferentes, embora as diferenças sejam muitas vezes sutis. Essas etiquetas foram usadas para treinar o modelo de aprendizado profundo, que foi testado em outras simulações do Fire.

Depois de criar o catálogo, eles o aplicaram aos dados do Gaia. “Perguntamos à rede neural: ‘Com base no que você aprendeu, pode rotular se as estrelas foram acrescentadas ou não?’”, disse Necib.

O modelo classificou o grau de confiança de que uma estrela nasceu fora da Via Láctea em um intervalo de 0 a 1. A equipe criou um ponto de corte com tolerância a erros e começou a explorar os resultados.

Desafios

Essa abordagem de pegar um modelo treinado em um conjunto de dados e aplicá-lo a um modelo diferente, porém relacionado, é chamado de transferência de aprendizado e pode estar cheio de desafios. “Precisávamos ter certeza de que não estamos aprendendo coisas artificiais sobre a simulação, mas realmente o que está acontecendo nos dados”, disse Necib. “Para isso, tivemos de dar-lhe um pouco de ajuda e dizer-lhe para pesar novamente certos elementos conhecidos a fim de lhe fornecer uma âncora.”

Eles primeiramente checaram para ver se o modelo conseguia identificar características conhecidas da galáxia. Essas incluem “a Salsicha Gaia” – os restos de uma galáxia anã que se fundiu com a Via Láctea cerca de 6 bilhões a 10 bilhões de anos atrás e que tem uma forma orbital distinta semelhante à de uma salsicha.

“Ela tem uma assinatura muito específica”, explicou Necib. “Se a rede neural funcionou como deveria, deveríamos ver essa enorme estrutura que já sabemos que existe.”

A Salsicha Gaia estava lá, assim como o halo estelar – estrelas de fundo que dão à Via Láctea sua forma reveladora – e a corrente Helmi, outra galáxia anã conhecida que se fundiu com a Via Láctea no passado distante e foi descoberta em 1999.

Primeira vista: Nyx

O modelo identificou outra estrutura na análise: um aglomerado de 250 estrelas, girando com o disco da Via Láctea, mas também indo em direção ao centro da galáxia.

“Seu primeiro instinto é que você tem um erro”, contou Necib. “E você fica tipo, ‘Oh não!’ Assim, não contei a nenhum dos meus colaboradores por três semanas. Então, comecei a perceber que não é um erro, é realmente real e é novo.”

Mas e se já tivesse sido descoberto? “Você começa a ler a literatura, certificando-se de que ninguém o tinha visto e, felizmente, para mim, ninguém tinha visto mesmo. Então, eu pude nomeá-lo, que é a coisa mais empolgante da astrofísica. Chamei-o Nyx, a deusa grega da noite. Essa estrutura em particular é muito interessante porque teria sido muito difícil vê-la sem o aprendizado de máquina.”

O projeto exigia computação avançada em muitos estágios diferentes. As simulações Fire e Fire-2 atualizada estão entre os maiores modelos computacionais de galáxias já tentados. Cada uma das nove principais simulações – três formações de galáxias separadas, cada uma com um ponto de partida ligeiramente diferente para o Sol – levou meses para computar nos maiores e mais rápidos supercomputadores do mundo. Entre eles, o Blue Waters, no Centro Nacional de Aplicações de Supercomputação (NCSA), as instalações de computação de ponta da Nasa e, mais recentemente, o Stampede2 no Texas Advanced Computing Center (TACC).

Os pesquisadores usaram aglomerados da Universidade do Oregon (EUA) para treinar o modelo de aprendizado profundo e aplicá-lo ao maciço conjunto de dados de Gaia. Atualmente, eles estão usando o Frontera, o sistema mais rápido de qualquer universidade do mundo, para continuar o trabalho.

“Tudo sobre esse projeto é computacionalmente muito intensivo e ele não seria possível sem a computação em larga escala”, disse Necib.

Passos futuros

Necib e sua equipe planejam explorar Nyx ainda mais usando telescópios terrestres. Isso fornecerá informações sobre a composição química do fluxo e outros detalhes que os ajudarão a datar a chegada de Nyx à Via Láctea e possivelmente fornecerão pistas de onde ele veio.

O próximo lançamento de dados do Gaia, em 2021, conterá informações adicionais sobre 100 milhões de estrelas no catálogo, tornando mais provável a descoberta de aglomerados acumulados.

“Quando a missão do Gaia começou, os astrônomos sabiam que era um dos maiores conjuntos de dados que eles obteriam, com muito o que se entusiasmar”, disse Necib. “Mas precisávamos desenvolver nossas técnicas para se adaptar ao conjunto de dados. Se não mudássemos ou atualizássemos nossos métodos, estaríamos perdendo a física que está em nosso conjunto de dados.”

Os sucessos da abordagem da equipe do Caltech podem ter um impacto ainda maior. “Estamos desenvolvendo ferramentas computacionais que estarão disponíveis para muitas áreas de pesquisa e também para itens não relacionados à pesquisa”, disse ela. “É assim que empurramos a fronteira tecnológica em geral.”