.
Cientistas da UC Santa Cruz, juntamente com um consórcio de pesquisadores, lançaram um rascunho do primeiro pangenoma humano – uma nova referência utilizável para genômica que combina o material genético de 47 indivíduos de diferentes origens ancestrais para permitir uma análise mais profunda e precisa compreensão da diversidade genômica mundial.
Ao adicionar 119 milhões de bases – as “letras” nas sequências de DNA – à referência genômica existente, o pangenoma fornece uma representação da diversidade genética humana que não era possível com um único genoma de referência. É altamente preciso, mais completo e aumenta dramaticamente a detecção de variantes no genoma humano, como mostrado em uma coleção de artigos inovadores publicados hoje nas revistas Natureza, Pesquisa Genômica, Natureza Biotecnologiae Métodos da Natureza.
O pangenoma foi produzido pelo Consórcio de Referência do Pangenoma Humano (HPRC), que é co-liderado pelo Professor Associado de Engenharia Biomolecular da UCSC, Benedict Paten, e pela Professora Assistente de Engenharia Biomolecular, Karen Miga, e agora está disponível para uso em um hub de montagem no Genoma da UCSC. Navegador. Mais de uma dúzia de pesquisadores e estudantes da UCSC contribuíram para este projeto, que continuará em 2024, quando os pesquisadores planejam liberar um pangenoma final com informações genômicas de 350 indivíduos.
“Estamos introduzindo mais diversidade e equidade na referência ao amostrar diversos seres humanos e incluí-los nesta estrutura que todos podem usar”, disse Paten, que é o autor sênior do papel marcador principal. “Um genoma não é suficiente para representar todo mundo – o pangenoma acabará sendo algo inclusivo e representativo”.
Entendendo a variação genômica
O genoma de cada pessoa varia ligeiramente – em cerca de 0,4 por cento em comparação com a próxima pessoa, em média – e entender essas diferenças pode fornecer informações sobre sua saúde, ajudar a diagnosticar doenças, prever resultados médicos e orientar tratamentos. O uso da referência do pangenoma melhorará a capacidade dos cientistas de detectar e entender a variação em estudos futuros.
Normalmente, quando cientistas e médicos estudam o genoma de um indivíduo para procurar variação, eles comparam o DNA desse indivíduo com o de uma referência padrão para determinar onde há diferenças de um ou mais pares de bases. Até agora, o genoma de referência foi representado principalmente por uma única sequência para cada cromossomo humano, principalmente proveniente de um indivíduo. Mas, esta referência tem quase 20 anos e é fundamentalmente limitada na medida em que não pode representar a riqueza de variações genéticas presentes na população humana. Isso introduz um problema chamado viés de referência na análise do genoma.
Em contraste, o novo pangenoma é uma referência que combina os genomas de 47 indivíduos de várias origens ancestrais. O pangenoma parece uma referência linear nas áreas onde as sequências têm as mesmas bases, e se expande para mostrar as áreas onde há diferenças. Ele representa muitas versões diferentes da sequência do genoma humano ao mesmo tempo e fornece aos cientistas um ponto de comparação mais preciso para a variação que está presente em algumas populações, mas não em outras.
“Um genoma não pode representar toda a rica variação que sabemos que pode ser observada e estudada em todo o mundo”, disse Miga, diretor do Centro de Produção HPRC da UCSC. “O objetivo número 1 da referência do pangenoma humano é tentar ampliar a representação de um recurso de referência para ser mais inclusivo e mais equitativo para o estudo da espécie humana, como uma coleção de referências e não apenas uma.”
A variação genômica pode ser pequena, consistindo em diferenças de apenas uma ou poucas bases de DNA, ou pode ser grandes variantes estruturais, classificadas como variantes com 50 pares de bases ou maiores. Essas variantes estruturais maiores podem ter implicações importantes para a saúde. Até agora, os pesquisadores não conseguiram identificar mais de 70% das variantes estruturais existentes nos genomas humanos devido a tecnologias limitadas e ao viés de usar uma única sequência de referência.
Dos 119 milhões de novas bases adicionadas à referência com o pangenoma, cerca de 90 milhões delas derivam de variação estrutural. As variantes estruturais são complexas e podem ser inversões de sequências, inserções, deleções ou repetições em tandem – um segmento de duas ou mais bases repetidas inúmeras vezes. Essas novas bases ajudarão os pesquisadores a estudar regiões do genoma para as quais não havia referência anteriormente e, potencialmente, poderão associar variantes estruturais a doenças em estudos futuros.
“Agora, podemos mapear para mais variantes estruturais, então estamos encontrando características e áreas no genoma que simplesmente não existiam antes”, disse Miga. “Isso é empolgante porque nos permite olhar para a regulação genética de uma maneira única que não poderíamos estudar antes, porque essas áreas provavelmente teriam sido mapeadas de forma inadequada ou simplesmente ignoradas”.
O uso da referência do pangenoma para análise genômica aumenta a detecção de variantes estruturais em 104 por cento em comparação com a detecção usando a referência padrão. A referência do pangenoma também aumenta a precisão de chamar pequenas variantes, aquelas com apenas algumas bases de comprimento, em cerca de 34% devido ao aumento da quantidade de dados presentes no pangenoma.
Cada ser humano carrega um par de cromossomos – um conjunto herdado da mãe e outro do pai. Os genomas individuais presentes na referência do pangenoma contêm informações resolvidas por haplótipos, o que significa que podem distinguir com confiança os dois conjuntos parentais de cromossomos – um grande feito científico. Ter essa informação ajudará os cientistas a entender melhor como vários genes e doenças são herdados.
Isso também significa que a referência atual realmente inclui 94 sequências genômicas distintas, com o objetivo de chegar a 700 até 2024.
Criando o pangenoma
O pangenoma tornou-se possível através do desenvolvimento de técnicas computacionais avançadas para alinhar as múltiplas sequê
.png)
.png)
.png)
.png)