Pesquisadores do Centro de Estudos do Genoma Humano e de Células-Tronco (CEGH-CEL), do Instituto de Biociências da Universidade de São Paulo (IB-USP), concluíram o sequenciamento do genoma completo de 1.171 idosos paulistanos.

A análise dos dados, reunidos em um repositório de acesso aberto, permitirá identificar mutações genéticas responsáveis por doenças, estimar a sua incidência na população brasileira e encontrar variantes que podem ser determinantes para o envelhecimento saudável, entre outras aplicações.

Os resultados do estudo foram publicados na plataforma bioRxiv, em artigo ainda sem revisão por pares.

LEIA TAMBÉM: Estudo reforça relação entre perfil genético e resposta à covid-19

“É o maior banco de DNA de pessoas idosas da América Latina e de uma população altamente miscigenada como a brasileira, resultado de um trabalho iniciado há mais de 10 anos”, diz à Agência Fapesp Mayana Zatz, professora do IB-USP e coordenadora do CEGH-CEL – um Centro de Pesquisa, Inovação e Difusão (Cepid) financiado pela Fapesp.

Alvo para sequenciamento

Os idosos, com média de idade de 71 anos e não aparentados, foram selecionados por pesquisadores da Faculdade de Saúde Pública da USP no âmbito do Projeto Saúde, Bem-estar e Envelhecimento (Sabe), apoiado pela Fapesp.

Iniciado em 2000, o Sabe, coordenado pela professora Yeda Duarte, tem o objetivo de traçar o perfil das condições de vida e saúde de idosos que residem na cidade de São Paulo e em outros centros urbanos da América Latina e do Caribe a partir de entrevistas domiciliares, avaliações e exames médicos.

“Esse estudo é representativo da população idosa de São Paulo porque é baseado no censo do município paulista e inclui pessoas de todos os níveis socioeconômicos”, avalia Zatz.

Os idosos foram escolhidos como população-alvo para sequenciamento do genoma por já terem passado da idade de início de manifestação de uma série de doenças que surgem na velhice, como o Alzheimer e Parkinson, entre outras, explica a pesquisadora.

População sub-representada

As primeiras análises dos dados genômicos dos idosos paulistanos, que incluem descendentes de imigrantes de diferentes continentes, permitiram identificar mais de 76 milhões de variantes genéticas, das quais 2 milhões não estão descritas em bancos de dados genômicos internacionais.

Uma das explicações para essa lacuna é que populações altamente miscigenadas, como a brasileira, estão sub-representadas nesses bancos genômicos, que guardam majoritariamente dados genéticos de populações europeias.

A falta de diversidade nos bancos genéticos internacionais pode limitar o acesso de pessoas de ascendência não europeia aos benefícios da medicina de precisão e a testes com maior acurácia, aumentando potencialmente as disparidades de saúde, ressaltam os autores do estudo.

“O número excessivo de variantes não descritas indica que nossas populações parentais não estão representadas nesses bancos e reafirma a importância de sequenciar o genoma de brasileiros, especificamente, para reduzir as assimetrias de representatividade nos bancos genômicos internacionais”, aponta Michel Naslavsky, professor do IB-USP e primeiro autor do estudo.

Variabilidade considerável

A análise da ancestralidade genética dos idosos revelou uma variabilidade considerável, que abrange desde um único ancestral a uma mistura de dois ou mais, com maior predominância, nesta ordem, de europeus, africanos, ameríndios e do leste asiático.

Essa diversidade genética é oposta à de países como os Estados Unidos, onde, apesar da existência de grupos populacionais descendentes de africanos e de caucasianos, pessoas que possuem duas ou mais ancestralidades são incomuns, compara Naslavsky.

“Os americanos que apresentam essa rara miscigenação são classificados nos bancos genômicos dos Estados Unidos como latinos, quando, na realidade, são majoritariamente mexicanos, que não apresentam o mesmo perfil de ancestralidade genética das populações do Brasil e de outros países da América Latina”, avalia.

História da origem

Também foram identificados quase 2 mil elementos genéticos móveis – partes genômicas que podem se deslocar para diferentes partes do genoma –, mais de 140 novos alelos de genes HLA – que se diversificam na forma e com vários alelos diferentes – e segmentos genômicos, totalizando entre 60 e 70 milhões de pares de bases que não haviam sido referidos em sequenciamentos do genoma humano realizados até o momento.

Esse número equivale a 2% das sequências do genoma humano completo, composto por 3 bilhões de pares de bases. Apesar de parecer pequeno, esse montante de regiões genômicas sem referência representa uma parte expressiva do genoma humano de brasileiros que ainda não está nas bases genômicas internacionais e pode explicar as diferenças genéticas e o surgimento de doenças e ainda contar a história da origem dessa população, avalia Naslavsky.

“Estamos enriquecendo os genomas de referência globais com os dados da população brasileira. A partir de agora, ao sequenciar o genoma de brasileiros será possível alinhar com o genoma de referência global e com o do nosso projeto”, afirma o pesquisador.

Estimativa de doenças

Para demonstrar a utilidade clínica do trabalho, foram comparadas quase 400 mutações gênicas identificadas nos idosos com as apontadas como causadoras de doenças (patogênicas) nos bancos genômicos públicos para verificar se correspondiam a essa classificação.

“As análises comparativas permitiram reclassificar mais de 40% de mutações e apontar que algumas delas podem ter efeito menor do que o previsto anteriormente”, diz Naslavsky.

Os pesquisadores também selecionaram mutações associadas a doenças autossômicas recessivas – causadas pela herança de duas cópias alteradas de um mesmo gene, sendo uma proveniente do pai e outra da mãe – identificadas nos idosos para estimar a incidência delas na população brasileira. Entre as doenças estão a fibrose cística – mais comum entre os europeus –, a anemia falciforme – mais prevalente entre os africanos –, surdez relacionada ao gene GJB2 e a febre familiar mediterrânea.

Contribuição genética

No caso da fibrose cística, por exemplo, a frequência é de um caso em cada 2 mil nascidos na Europa, enquanto no Brasil a incidência estimada é de um caso em cada 10 mil.

“A incidência dessa doença é maior na Europa porque a mutação causadora é mais comum em caucasoides. Como a população brasileira é muito mais miscigenada, ela é mais rara no país”, explica Zatz.

A surdez relacionada ao gene GJB2 e a febre familiar mediterrânea são as doenças autossômicas recessivas que aparecem com mais frequência em brasileiros, indica o estudo. Isso se deve, provavelmente, à contribuição genética ibérica, mediterrânea e do Oriente Médio, estimam os pesquisadores.

“Além da importância na medicina de precisão, esses resultados demonstram que o sequenciamento de genomas completos pode auxiliar na elaboração de políticas de saúde pública ao ajudar a estimar quantas pessoas podem nascer com doenças genéticas em uma determinada população”, avalia Naslavsky.