Em formação

17.3: Sequenciamento do genoma completo - Biologia

17.3: Sequenciamento do genoma completo - Biologia



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Habilidades para desenvolver

  • Descreva três tipos de sequenciamento
  • Definir sequenciamento do genoma completo

Embora tenha havido avanços significativos nas ciências médicas nos últimos anos, os médicos ainda estão confusos com algumas doenças e estão usando o sequenciamento do genoma inteiro para chegar ao fundo do problema. O sequenciamento do genoma completo é um processo que determina a sequência de DNA de um genoma inteiro. O sequenciamento do genoma completo é uma abordagem de força bruta para a solução de problemas quando há uma base genética no cerne de uma doença. Vários laboratórios agora fornecem serviços para sequenciar, analisar e interpretar genomas inteiros.

Por exemplo, o sequenciamento do exoma completo é uma alternativa de baixo custo ao sequenciamento do genoma completo. No sequenciamento de exoma, apenas as regiões codificadoras e produtoras de exon do DNA são sequenciadas. Em 2010, o sequenciamento do exoma total foi usado para salvar um menino cujos intestinos apresentavam vários abcessos misteriosos. A criança passou por várias operações de cólon sem alívio. Finalmente, foi realizado o sequenciamento de todo o exoma, que revelou um defeito em uma via que controla a apoptose (morte celular programada). Um transplante de medula óssea foi usado para superar essa doença genética, levando à cura do menino. Ele foi a primeira pessoa a ser tratada com sucesso com base em um diagnóstico feito por sequenciamento de todo o exoma. Hoje, o sequenciamento do genoma humano está mais facilmente disponível e pode ser concluído em um ou dois dias por cerca de US $ 1.000.

Estratégias usadas em projetos de sequenciamento

A técnica básica de sequenciamento usada em todos os projetos de sequenciamento modernos é o método de terminação de cadeia (também conhecido como método didesoxi), que foi desenvolvido por Fred Sanger na década de 1970. O método de terminação de cadeia envolve a replicação do DNA de um molde de fita simples com o uso de um primer e um desoxinucleotídeo regular (dNTP), que é um monômero, ou uma unidade única, do DNA. O primer e o dNTP são misturados com uma pequena proporção de didesoxinucleotídeos marcados com fluorescência (ddNTPs). Os ddNTPs são monômeros aos quais falta um grupo hidroxila (–OH) no local em que outro nucleotídeo geralmente se liga para formar uma cadeia (Figura ( PageIndex {1} )).

Cada ddNTP é rotulado com uma cor diferente de fluoróforo. Cada vez que um ddNTP é incorporado na fita complementar em crescimento, ele termina o processo de replicação do DNA, que resulta em várias fitas curtas de DNA replicado, cada uma terminada em um ponto diferente durante a replicação. Quando a mistura de reação é processada por eletroforese em gel após ser separada em fitas simples, as várias fitas de DNA recém-replicadas formam uma escada devido aos tamanhos diferentes. Como os ddNTPs são marcados com fluorescência, cada banda no gel reflete o tamanho da fita de DNA e o ddNTP que encerrou a reação. As diferentes cores dos ddNTPs marcados com fluoróforo ajudam a identificar o ddNTP incorporado naquela posição. A leitura do gel com base na cor de cada faixa da escada produz a sequência da fita do molde (Figura ( PageIndex {2} )).

Estratégias iniciais: sequenciamento de espingarda e sequenciamento de extremidade par-sábio

No método de sequenciamento de espingarda, várias cópias de um fragmento de DNA são cortadas aleatoriamente em muitos pedaços menores (algo como o que acontece com um cartucho de espingarda quando disparado de uma espingarda). Todos os segmentos são então sequenciados usando o método de sequenciação em cadeia. Em seguida, com a ajuda de um computador, os fragmentos são analisados ​​para ver onde suas sequências se sobrepõem. Combinando sequências sobrepostas no final de cada fragmento, toda a sequência de DNA pode ser reformada. Uma sequência maior que é montada a partir de sequências mais curtas sobrepostas é chamada de contig. Como analogia, considere que alguém tem quatro cópias de uma fotografia de paisagem que você nunca viu antes e não sabe nada sobre como ela deveria aparecer. A pessoa então rasga cada fotografia com as mãos, de forma que pedaços de tamanhos diferentes estejam presentes em cada cópia. A pessoa então mistura todas as peças e pede que você reconstrua a fotografia. Em uma das peças menores, você vê uma montanha. Em uma parte maior, você vê que a mesma montanha está atrás de um lago. Um terceiro fragmento mostra apenas o lago, mas revela que há uma cabana na margem do lago. Portanto, ao observar as informações sobrepostas nesses três fragmentos, você sabe que a imagem contém uma montanha atrás de um lago que tem uma cabana em sua margem. Este é o princípio por trás da reconstrução de sequências inteiras de DNA usando o sequenciamento shotgun.

Originalmente, o sequenciamento shotgun analisava apenas uma extremidade de cada fragmento quanto a sobreposições. Isso foi suficiente para sequenciar pequenos genomas. No entanto, o desejo de sequenciar genomas maiores, como o de um humano, levou ao desenvolvimento do sequenciamento de espingarda de cano duplo, mais formalmente conhecido como sequenciamento de extremidade pareada. No sequenciamento de extremidade pareada, ambas as extremidades de cada fragmento são analisadas quanto à sobreposição. O sequenciamento em pares é, portanto, mais complicado do que o sequenciamento shotgun, mas é mais fácil reconstruir a sequência porque há mais informações disponíveis.

Sequenciamento de próxima geração

Desde 2005, as técnicas de sequenciamento automatizado usadas por laboratórios estão sob a égide do sequenciamento de última geração, que é um grupo de técnicas automatizadas usadas para sequenciamento rápido de DNA. Esses sequenciadores automatizados de baixo custo podem gerar sequências de centenas de milhares ou milhões de fragmentos curtos (25 a 500 pares de bases) no período de um dia. Esses sequenciadores usam software sofisticado para passar pelo complicado processo de colocar todos os fragmentos em ordem.

Conexão Evolution: Comparando Sequências

Um alinhamento de sequência é um arranjo de proteínas, DNA ou RNA; é usado para identificar regiões de semelhança entre tipos de células ou espécies, o que pode indicar conservação de função ou estruturas. Os alinhamentos de sequência podem ser usados ​​para construir árvores filogenéticas. O seguinte website usa um programa de software chamado BLAST (ferramenta básica de pesquisa de alinhamento local).

Em “Basic Blast”, clique em “Nucleotide Blast”. Insira a seguinte sequência na caixa grande "sequência de consulta": ATTGCTTCGATTGCA. Abaixo da caixa, localize o campo "Espécies" e digite "humano" ou "Homo sapiens". Em seguida, clique em “BLAST” para comparar a sequência inserida com as sequências conhecidas do genoma humano. O resultado é que essa sequência ocorre em mais de cem lugares no genoma humano. Role para baixo do gráfico com as barras horizontais e você verá uma breve descrição de cada um dos resultados correspondentes. Escolha um dos hits no topo da lista e clique em "Gráficos". Isso o levará a uma página que mostra onde a sequência é encontrada em todo o genoma humano. Você pode mover o controle deslizante que se parece com uma bandeira verde para frente e para trás para visualizar as sequências imediatamente ao redor do gene selecionado. Você pode então retornar à sequência selecionada clicando no botão "ATG".

Uso de sequências de genoma inteiro de organismos modelo

O primeiro genoma a ser completamente sequenciado foi o de um vírus bacteriano, o bacteriófago fx174 (5368 pares de bases); isso foi realizado por Fred Sanger usando sequenciamento de espingarda. Vários outros genomas de organela e virais foram posteriormente sequenciados. O primeiro organismo cujo genoma foi sequenciado foi a bactéria Haemophilus influenzae; isso foi realizado por Craig Venter na década de 1980. Aproximadamente 74 laboratórios diferentes colaboraram no sequenciamento do genoma da levedura Saccharomyces cerevisiae, que começou em 1989 e foi concluído em 1996, porque era 60 vezes maior do que qualquer outro genoma sequenciado. Em 1997, as sequências do genoma de dois organismos modelo importantes estavam disponíveis: a bactéria Escherichia coli K12 e o fermento Saccharomyces cerevisiae. Genomas de outros organismos modelo, como o rato Mus musculus, a mosca da fruta Drosophila melanogaster, o nematóide Caenorhabditis. Eleganse humanos Homo sapiens agora são conhecidos. Muitas pesquisas básicas são realizadas em organismos modelo porque as informações podem ser aplicadas a organismos geneticamente semelhantes. Um organismo modelo é uma espécie que é estudada como modelo para compreender os processos biológicos em outras espécies representadas pelo organismo modelo. Ter genomas inteiros sequenciados ajuda nos esforços de pesquisa nesses organismos modelo. O processo de anexar informações biológicas às sequências de genes é chamado de anotação do genoma. A anotação de sequências de genes ajuda em experimentos básicos em biologia molecular, como a criação de primers de PCR e alvos de RNA.

Os microarranjos de DNA são métodos usados ​​para detectar a expressão gênica por meio da análise de um array de fragmentos de DNA que são fixados em uma lâmina de vidro ou um chip de silício para identificar genes ativos e identificar sequências. Quase um milhão de anormalidades genotípicas podem ser descobertas usando microarrays, enquanto o sequenciamento do genoma inteiro pode fornecer informações sobre todos os seis bilhões de pares de bases no genoma humano. Embora o estudo das aplicações médicas do sequenciamento do genoma seja interessante, essa disciplina tende a se concentrar na função anormal do gene. O conhecimento de todo o genoma permitirá que doenças futuras e outros distúrbios genéticos sejam descobertos precocemente, o que permitirá que decisões mais informadas sejam tomadas sobre estilo de vida, medicamentos e filhos. A genômica ainda está em sua infância, embora algum dia possa se tornar rotina usar o sequenciamento do genoma completo para examinar todos os recém-nascidos para detectar anormalidades genéticas.

Além de doenças e medicamentos, a genômica pode contribuir para o desenvolvimento de novas enzimas que convertem biomassa em biocombustível, o que resulta em maior safra e produção de combustível e menor custo para o consumidor. Esse conhecimento deve permitir melhores métodos de controle sobre os micróbios que são usados ​​na produção de biocombustíveis. A genômica também pode melhorar os métodos usados ​​para monitorar o impacto dos poluentes nos ecossistemas e ajudar a limpar os contaminantes ambientais. A genômica permitiu o desenvolvimento de agroquímicos e farmacêuticos que poderiam beneficiar a ciência médica e a agricultura.

Parece ótimo ter todo o conhecimento que podemos obter do sequenciamento de todo o genoma; entretanto, os humanos têm a responsabilidade de usar esse conhecimento com sabedoria. Do contrário, pode ser fácil fazer mau uso do poder de tal conhecimento, levando à discriminação com base na genética de uma pessoa, na engenharia genética humana e em outras questões éticas. Essas informações também podem levar a questões legais relacionadas à saúde e privacidade.

Resumo

O sequenciamento do genoma completo é o mais recente recurso disponível para o tratamento de doenças genéticas. Alguns médicos estão usando o sequenciamento do genoma completo para salvar vidas. A genômica tem muitas aplicações industriais, incluindo desenvolvimento de biocombustíveis, agricultura, produtos farmacêuticos e controle de poluição. O princípio básico de todas as estratégias de sequenciamento dos dias modernos envolve o método de finalização da cadeia de sequenciamento.

Embora as sequências do genoma humano forneçam percepções importantes para os profissionais médicos, os pesquisadores usam sequências do genoma completo de organismos modelo para entender melhor o genoma das espécies. A automação e o custo reduzido do sequenciamento do genoma completo podem levar à medicina personalizada no futuro.

método de terminação de cadeia
método de sequenciação de DNA usando didesoxinucleotídeos marcados para terminar a replicação de DNA; também é chamado de método didesoxi ou método Sanger
contig
sequência maior de DNA montada a partir de sequências mais curtas sobrepostas
desoxinucleotídeo
monômero individual (unidade única) de DNA
didesoxinucleotídeo
monômero individual de DNA sem um grupo hidroxila (–OH)
Microarray de DNA
método usado para detectar a expressão do gene analisando uma matriz de fragmentos de DNA que são fixados em uma lâmina de vidro ou um chip de silício para identificar genes ativos e identificar sequências
anotação de genoma
processo de anexar informações biológicas a sequências de genes
organismo modelo
espécie que é estudada e usada como modelo para compreender os processos biológicos em outras espécies representadas pelo organismo modelo
sequenciamento de última geração
grupo de técnicas automatizadas usadas para sequenciamento rápido de DNA
sequenciamento de espingarda
método usado para sequenciar vários fragmentos de DNA para gerar a sequência de um grande pedaço de DNA
sequenciamento do genoma completo
processo que determina a sequência de DNA de um genoma inteiro

Resequenciamento do genoma inteiro revela adaptação antes da divergência das subespécies de búfalo

A aplicação de genotipagem de alto rendimento ou dados de sequenciamento nos ajuda a entender a resposta genômica à seleção natural e artificial. Neste estudo, nós digitalizamos os genomas de cinco populações indígenas de búfalos pertencentes a três raças reconhecidas, adaptadas a diferentes zonas geográficas e agroecológicas no Irã, para desvendar a extensão da diversidade genômica e para localizar regiões genômicas e genes submetidos à seleção anterior. Um total de 46 genomas inteiros de búfalos de rio, das províncias do Azerbaijão Ocidental e Oriental, Gilan, Mazandaran e Khuzistão, foram sequenciados. Nossos dados de sequenciamento alcançaram uma cobertura acima de 99% do genoma de referência do búfalo do rio e uma profundidade de leitura média em torno de 9,2 × por amostra. Identificamos 20,55 milhões de SNPs, incluindo 63.097 missense, 707 stop-gain e 159 mutações stop-loss que podem ter consequências funcionais. As análises de diversidade genômica mostraram uma estruturação modesta entre as populações de búfalos iranianos, seguindo o fluxo ou mistura de genes frequentes no passado recente. A evidência de seleção positiva foi investigada usando as métricas de diferenciação (Fst) e fixação (Pi). A análise da fixação revelou três regiões genômicas em todas as três raças com conteúdo de polimorfismo aberrante em BBU2, 20 e 21. O sinal de fixação em BBU2 se sobrepôs aos genes OCA2-HERC2, sugerindo adaptação à exposição aos raios ultravioleta através do mecanismo de pigmentação. Validação adicional usando dados de ressequenciamento de outras cinco espécies bovinas, bem como os dados de 90K da Matriz de Genotipagem de Búfalos Axiom de búfalos de rio e pântano indicaram que esses sinais de fixação persistiram em búfalos de rio e pântano e se estendeu a gado taurino, implicando que um antigo evento evolutivo ocorreu antes do especiação de bovinos bubalinos e taurinos. Esses resultados contribuíram para a nossa compreensão das principais mudanças genéticas que ocorreram durante a evolução dos búfalos modernos.

Palavras-chave: Assinatura de seleção de diversidade de nucleotídeos de índice de diferenciação de mistura de búfalos indígenas iranianos.

© The Author (s) 2020. Publicado pela Oxford University Press em nome da Society for Molecular Biology and Evolution.


Estratégias iniciais: sequenciamento de espingarda e sequenciamento de extremidade par-sábio

No método de sequenciamento de espingarda, várias cópias de um fragmento de DNA são cortadas aleatoriamente em muitos pedaços menores (algo como o que acontece com um cartucho de espingarda quando disparado de uma espingarda). Todos os segmentos são então sequenciados usando o método de sequenciação em cadeia. Em seguida, com a ajuda de um computador, os fragmentos são analisados ​​para ver onde suas sequências se sobrepõem. Combinando sequências sobrepostas no final de cada fragmento, toda a sequência de DNA pode ser reformada. Uma sequência maior que é montada a partir de sequências mais curtas sobrepostas é chamada de contig. Como analogia, considere que alguém tem quatro cópias de uma fotografia de paisagem que você nunca viu antes e não sabe nada sobre como ela deveria aparecer. A pessoa então rasga cada fotografia com as mãos, de modo que pedaços de tamanhos diferentes estejam presentes em cada cópia. A pessoa então mistura todas as peças e pede que você reconstrua a fotografia. Em uma das peças menores, você vê uma montanha. Em uma parte maior, você vê que a mesma montanha está atrás de um lago. Um terceiro fragmento mostra apenas o lago, mas revela que há uma cabana na margem do lago. Portanto, ao observar as informações sobrepostas nesses três fragmentos, você sabe que a imagem contém uma montanha atrás de um lago que tem uma cabana em sua margem. Este é o princípio por trás da reconstrução de sequências inteiras de DNA usando o sequenciamento shotgun.

Originalmente, o sequenciamento shotgun analisava apenas uma extremidade de cada fragmento quanto a sobreposições. Isso foi suficiente para sequenciar pequenos genomas. No entanto, o desejo de sequenciar genomas maiores, como o de um humano, levou ao desenvolvimento do sequenciamento de espingarda de cano duplo, mais formalmente conhecido como sequenciamento de extremidade pareada. No sequenciamento de extremidade pareada, ambas as extremidades de cada fragmento são analisadas quanto à sobreposição. O sequenciamento em pares é, portanto, mais complicado do que o sequenciamento shotgun, mas é mais fácil reconstruir a sequência porque há mais informações disponíveis.


Abordagens de sequenciamento do genoma completo para biologia da conservação: vantagens, limitações e recomendações práticas

O resequenciamento do genoma inteiro (WGR) é um método poderoso para abordar questões fundamentais da biologia evolutiva que não foram totalmente resolvidas usando métodos tradicionais. O WGR inclui quatro abordagens: o sequenciamento de indivíduos para uma alta profundidade de cobertura com haplótipos não resolvidos ou resolvidos, o sequenciamento de genomas populacionais para uma alta profundidade por meio da mistura de quantidades equimolares de DNA individual não marcado (Pool-seq) e o sequenciamento de múltiplos indivíduos de uma população a uma profundidade baixa (lcWGR). Essas técnicas requerem a disponibilidade de um genoma de referência. Isso, junto com o ainda alto custo do sequenciamento shotgun e a grande demanda por recursos de computação e armazenamento, limitou sua implementação em espécies não-modelo com recursos genômicos escassos e em campos como a biologia da conservação. Nosso objetivo aqui é descrever os vários métodos WGR, seus prós e contras e aplicações potenciais em biologia da conservação. WGR oferece uma densidade de marcador sem precedentes e pesquisa uma ampla diversidade de variações genéticas não limitadas a polimorfismos de nucleotídeo único (por exemplo, variantes estruturais e mutações em elementos reguladores), aumentando seu poder para a detecção de assinaturas de seleção e adaptação local, bem como para o identificação da base genética de características fenotípicas e doenças. Atualmente, porém, nenhuma abordagem WGR única atende a todos os requisitos da genética da conservação, e cada método tem suas próprias limitações e fontes de viés potencial. Discutimos formas propostas para minimizar tais vieses. Imaginamos um futuro não distante, onde a análise de genomas inteiros se torna uma tarefa de rotina em muitas espécies e campos não-modelo, incluindo a biologia da conservação.

Palavras-chave: Pool-seq conservação biologia gerenciamento de sequenciamento de baixa cobertura população genômica sequenciamento do genoma completo.


Uso de sequências de genoma inteiro de organismos modelo

O bioquímico britânico e vencedor do Prêmio Nobel Fred Sanger usou um vírus bacteriano, o bacteriófago fx174 (5368 pares de bases), para sequenciar completamente o primeiro genoma. Outros cientistas sequenciaram mais tarde vários outros genomas de organela e virais. O biotecnologista, bioquímico, geneticista e empresário americano Craig Venter sequenciou a bactéria Haemophilus influenzae nos anos 1980. Aproximadamente 74 laboratórios diferentes colaboraram no sequenciamento do genoma da levedura Saccharomyces cerevisiae, que começou em 1989 e foi concluído em 1996, porque era 60 vezes maior do que qualquer outro sequenciamento do genoma. Em 1997, as sequências do genoma de dois organismos modelo importantes estavam disponíveis: a bactéria Escherichia coli K12 e o fermento Saccharomyces cerevisiae. Agora conhecemos os genomas de outros organismos modelo, como o rato Mus musculus, a mosca da fruta Drosophila melanogaster, o nematóide Caenorhabditis. Eleganse humanos Homo sapiens. Os pesquisadores realizam uma extensa pesquisa básica em organismos modelo porque podem aplicar as informações a organismos geneticamente semelhantes. Um organismo modelo é uma espécie que os pesquisadores usam como modelo para compreender os processos biológicos em outras espécies que o organismo modelo representa. Ter genomas inteiros sequenciados ajuda nos esforços de pesquisa nesses organismos modelo. O processo de anexar informações biológicas às sequências de genes é a anotação do genoma. A anotação de sequências de genes ajuda em experimentos básicos em biologia molecular, como a criação de primers de PCR e alvos de RNA.


Biologia 171

Ao final desta seção, você será capaz de fazer o seguinte:

Embora tenha havido avanços significativos nas ciências médicas nos últimos anos, os médicos ainda estão confusos com algumas doenças e estão usando o sequenciamento do genoma completo para descobrir a raiz do problema. O sequenciamento do genoma completo é um processo que determina a sequência de DNA de um genoma inteiro. O sequenciamento do genoma completo é uma abordagem de força bruta para a solução de problemas quando há uma base genética no cerne de uma doença. Vários laboratórios agora fornecem serviços para sequenciar, analisar e interpretar genomas inteiros.

Por exemplo, o sequenciamento do exoma completo é uma alternativa de baixo custo ao sequenciamento do genoma completo. No sequenciamento de exoma, o médico sequencia apenas as regiões produtoras de exon que codificam o DNA. Em 2010, os médicos usaram o sequenciamento do exoma total para salvar um menino cujos intestinos apresentavam vários abcessos misteriosos. A criança passou por várias operações de cólon sem alívio. Finalmente, eles realizaram o sequenciamento de todo o exoma, que revelou um defeito em uma via que controla a apoptose (morte celular programada). Os médicos usaram um transplante de medula óssea para superar essa doença genética, levando à cura do menino. Ele foi a primeira pessoa a receber um tratamento bem-sucedido com base em um diagnóstico de sequenciamento de todo o exoma. Hoje, o sequenciamento do genoma humano está mais prontamente disponível e os resultados estão disponíveis em dois dias por cerca de US $ 1.000.

Estratégias usadas em projetos de sequenciamento

A técnica básica de sequenciamento usada em todos os projetos de sequenciamento modernos é o método de terminação de cadeia (também conhecido como método didesoxi), que Fred Sanger desenvolveu na década de 1970. O método de terminação de cadeia envolve a replicação do DNA de um molde de fita simples usando um primer e um desoxinucleotídeo regular (dNTP), que é um monômero, ou uma única unidade de DNA. O primer e o dNTP se misturam com uma pequena proporção de didesoxinucleotídeos marcados com fluorescência (ddNTPs). Os ddNTPs são monômeros aos quais falta um grupo hidroxila (–OH) no local em que outro nucleotídeo geralmente se liga para formar uma cadeia ((Figura)). Os cientistas rotulam cada ddNTP com uma cor diferente de fluoróforo. Cada vez que um ddNTP se incorpora na fita complementar em crescimento, ele termina o processo de replicação do DNA, que resulta em várias fitas curtas de DNA replicado, cada uma terminando em um ponto diferente durante a replicação. Quando a eletroforese em gel processa a mistura de reação após a separação em fitas simples, as várias fitas de DNA recém-replicadas formam uma escada devido aos tamanhos diferentes. Como os ddNTPs são marcados com fluorescência, cada banda no gel reflete o tamanho da fita de DNA e o ddNTP que encerrou a reação. As diferentes cores dos ddNTPs marcados com fluoróforo ajudam a identificar o ddNTP incorporado naquela posição. A leitura do gel com base na cor de cada banda na escada produz a sequência da fita modelo ((Figura)).



Estratégias iniciais: sequenciamento de espingarda e sequenciamento de extremidade par-sábio

No método de sequenciamento de espingarda, várias cópias de fragmentos de DNA cortados aleatoriamente em muitos pedaços menores (algo como o que acontece com um cartucho de espingarda quando disparado de uma espingarda). Todos os segmentos sequenciam usando o método de sequenciamento em cadeia. Então, com a ajuda do computador de sequência, os cientistas podem analisar os fragmentos para ver onde suas sequências se sobrepõem. Ao combinar sequências sobrepostas na extremidade de cada fragmento, os cientistas podem reformar toda a sequência de DNA. Uma sequência maior que é montada a partir de sequências mais curtas sobrepostas é chamada de contig. Como analogia, considere que alguém tem quatro cópias de uma fotografia de paisagem que você nunca viu antes e não sabe nada sobre como ela deveria aparecer. A pessoa então rasga cada fotografia com as mãos, de forma que pedaços de tamanhos diferentes estejam presentes em cada cópia. A pessoa então mistura todas as peças e pede que você reconstrua a fotografia. Em uma das peças menores, você vê uma montanha. Em uma parte maior, você vê que a mesma montanha está atrás de um lago. Um terceiro fragmento mostra apenas o lago, mas revela que há uma cabana na margem do lago. Portanto, ao observar as informações sobrepostas nesses três fragmentos, você sabe que a imagem contém uma montanha atrás de um lago que tem uma cabana em sua margem. Este é o princípio por trás da reconstrução de sequências inteiras de DNA usando o sequenciamento shotgun.

Originalmente, o sequenciamento shotgun analisava apenas uma extremidade de cada fragmento quanto a sobreposições. Isso foi suficiente para sequenciar pequenos genomas. No entanto, o desejo de sequenciar genomas maiores, como o de um ser humano, levou ao desenvolvimento do sequenciamento shotgun de cano duplo, ou sequenciamento em pares. No sequenciamento de extremidade pareada, os cientistas analisam a extremidade de cada fragmento quanto à sobreposição. O sequenciamento em pares é, portanto, mais complicado do que o sequenciamento shotgun, mas é mais fácil reconstruir a sequência porque há mais informações disponíveis.

Sequenciamento de próxima geração

Desde 2005, as técnicas de sequenciamento automatizado usadas por laboratórios estão sob a égide do sequenciamento de última geração, que é um grupo de técnicas automatizadas usadas para sequenciamento rápido de DNA. Esses sequenciadores automatizados de baixo custo podem gerar sequências de centenas de milhares ou milhões de fragmentos curtos (25 a 500 pares de bases) no período de um dia. Esses sequenciadores usam software sofisticado para passar pelo complicado processo de colocar todos os fragmentos em ordem.

Comparando sequências Um alinhamento de sequência é um arranjo de proteínas, DNA ou RNA. Os cientistas usam-no para identificar regiões semelhantes entre tipos de células ou espécies, o que pode indicar conservação de função ou estrutura. Podemos usar alinhamentos de sequência para construir árvores filogenéticas. O seguinte website usa um programa de software chamado BLAST (ferramenta básica de pesquisa de alinhamento local).

Em “Basic Blast”, clique em “Nucleotide Blast”. Insira a seguinte sequência na caixa grande & # 8220query sequence & # 8221: ATTGCTTCGATTGCA. Abaixo da caixa, localize o campo & # 8220Species & # 8221 e digite & # 8220human & # 8221 ou & # 8220Homo sapiens & # 8221. Em seguida, clique em “BLAST” para
compare a sequência inserida com as sequências conhecidas do genoma humano. O resultado é que essa sequência ocorre em mais de cem lugares no genoma humano. Role para baixo do gráfico com as barras horizontais e você verá uma breve descrição de cada um dos resultados correspondentes. Escolha um dos resultados próximos ao topo da lista e clique em & # 8220Graphics & # 8221. Isso o levará a uma página que mostra a localização da sequência em todo o genoma humano. Você pode mover o controle deslizante que se parece com uma bandeira verde para frente e para trás para visualizar as sequências imediatamente ao redor do gene selecionado. Você pode então retornar à sequência selecionada clicando no botão & # 8220ATG & # 8221.

Uso de sequências de genoma inteiro de organismos modelo

O bioquímico britânico e vencedor do Prêmio Nobel Fred Sanger usou um vírus bacteriano, o bacteriófago fx174 (5368 pares de bases), para sequenciar completamente o primeiro genoma. Outros cientistas sequenciaram mais tarde vários outros genomas de organela e virais. O biotecnologista, bioquímico, geneticista e empresário americano Craig Venter sequenciou a bactéria Haemophilus influenzae nos anos 1980. Aproximadamente 74 laboratórios diferentes colaboraram no sequenciamento do genoma da levedura Saccharomyces cerevisiae, que começou em 1989 e foi concluído em 1996, porque era 60 vezes maior do que qualquer outro sequenciamento do genoma. Em 1997, as sequências do genoma de dois organismos modelo importantes estavam disponíveis: a bactéria Escherichia coli K12 e o fermento Saccharomyces cerevisiae. Agora conhecemos os genomas de outros organismos modelo, como o rato Mus musculus, a mosca da fruta Drosophila melanogaster, o nematóide Caenorhabditis. Eleganse humanos Homo sapiens. Os pesquisadores realizam uma extensa pesquisa básica em organismos modelo porque podem aplicar as informações a organismos geneticamente semelhantes. Um organismo modelo é uma espécie que os pesquisadores usam como modelo para compreender os processos biológicos em outras espécies que o organismo modelo representa. Ter genomas inteiros sequenciados ajuda nos esforços de pesquisa nesses organismos modelo. O processo de anexar informações biológicas às sequências de genes é a anotação do genoma. A anotação de sequências de genes ajuda em experimentos básicos em biologia molecular, como a criação de primers de PCR e alvos de RNA.

Passe por cada etapa da sequência do genoma em Montagem da sequência de DNA (página da web, interativo).

Usos da sequência do genoma

Os microarranjos de DNA são métodos que os cientistas usam para detectar a expressão gênica analisando diferentes fragmentos de DNA que são fixados em uma lâmina de vidro ou em um chip de silício para identificar sequências e genes ativos. Podemos descobrir quase um milhão de anormalidades genotípicas usando microarrays, enquanto o sequenciamento do genoma completo pode fornecer informações sobre todos os seis bilhões de pares de bases do genoma humano. Embora estudar as aplicações médicas do sequenciamento do genoma seja interessante, essa disciplina se concentra na função anormal do gene. Saber sobre todo o genoma permitirá que os pesquisadores descubram precocemente doenças de aparecimento futuro e outros distúrbios genéticos. Isso permitirá decisões mais informadas sobre estilo de vida, medicamentos e ter filhos. A genômica ainda está em sua infância, embora algum dia possa se tornar rotina usar o sequenciamento do genoma completo para examinar todos os recém-nascidos para detectar anormalidades genéticas.

Além de doenças e medicamentos, a genômica pode contribuir para o desenvolvimento de novas enzimas que convertem biomassa em biocombustível, o que resulta em maior safra e produção de combustível e menor custo para o consumidor. Esse conhecimento deve permitir melhores métodos de controle sobre os micróbios que a indústria usa para produzir biocombustíveis. A genômica também pode melhorar os métodos de monitoramento que medem o impacto dos poluentes nos ecossistemas e ajudam a limpar os contaminantes ambientais. A genômica tem ajudado no desenvolvimento de agroquímicos e farmacêuticos que podem beneficiar a ciência médica e a agricultura.

Parece ótimo ter todo o conhecimento que podemos obter do sequenciamento de todo o genoma, no entanto, os humanos têm a responsabilidade de usar esse conhecimento com sabedoria. Caso contrário, pode ser fácil fazer mau uso do poder de tal conhecimento, levando à discriminação com base na genética de uma pessoa, na engenharia genética humana e em outras questões éticas. Essas informações também podem levar a questões legais relacionadas à saúde e privacidade.

Resumo da Seção

O sequenciamento do genoma completo é o mais recente recurso disponível para o tratamento de doenças genéticas. Alguns médicos estão usando o sequenciamento do genoma completo para salvar vidas. A genômica tem muitas aplicações industriais, incluindo desenvolvimento de biocombustíveis, agricultura, produtos farmacêuticos e controle de poluição. O princípio básico de todas as estratégias de sequenciamento dos dias modernos envolve o método de finalização da cadeia de sequenciamento.

Embora as sequências do genoma humano forneçam informações importantes para os profissionais médicos, os pesquisadores usam sequências do genoma completo de organismos modelo para compreender melhor o genoma da espécie & # 8217. A automação e o custo reduzido do sequenciamento do genoma completo podem levar à medicina personalizada no futuro.

Glossário


Sequenciamento do genoma completo

Por ⁠Dr. Brandon Colby MD, um médico especialista nas áreas de Genômica e Medicina Preventiva Personalizada.

Você pode ter ouvido termos como sequenciamento do genoma completo e genômica e pensei que eles soavam como se tivessem saído direto do roteiro de um filme futurista. Mas, na realidade, as tecnologias de sequenciamento estão prontamente disponíveis em muitas partes do mundo e podem ser muito úteis para entender mais sobre a genética humana e nossa própria saúde.

O genoma humano contém muitas informações sobre cada um de nós, desde nossa ancestralidade até o risco de desenvolver certas doenças genéticas ou transmiti-las aos nossos filhos. As a result, it’s no wonder DNA sequencing is becoming a widely used tool in both research and healthcare.

What Is Whole Genome Sequencing?

Put simply, whole genome sequencing (WGS) is a genetic testing technology that allows us to determine how our DNA is confirmed. In order to understand this testing procedure better, let’s take a look at what DNA is, how it’s formed, and what it does.

Deoxyribonucleic acid, more commonly known as DNA, is the molecule that contains all living organisms’ genetic codes. All the living beings that have been identified and examined contain DNA, from complex mammals such as humans to simple organisms like bacteria.

DNA is made up of molecules called nucleotides. These nucleotides act as the basic building blocks of our DNA and are composed of three distinct parts:

The nitrogenous base portion of each nucleotide can be adenine (A), cytosine (C), guanine (G), and thymine (T). These bases are “strung together” during DNA replication. Practically all the cells that exist in our bodies contain DNA, with only a few known exceptions — such as mature hair cells.

The nitrogenous bases are replicated in a specific order, and they form base pairs by binding to a base from a parallel strand — A always binds to T, while C always binds to G —, forming the familiar double helix DNA image that we all know. One of the key features of DNA is that it can replicate itself constantly to create new cells that are identical to their parental cell.

Understanding the Science of DNA

While DNA is formed by two strands of nucleotides that are bound together, a simpler molecule called RNA is formed by a single strand. In humans, RNA molecules act as a messenger and transfer molecules that carry genetic information during the DNA transcription process.

Nitrogenous bases are the portion of our DNA that contains genetic information, and the “patterns” created by these bases in our DNA determine our genetic makeup - specific DNA sequences form genes. Each gene has coding regions that function almost like a blueprint for cells since they contain “instructions” that tell cells in our body how to synthesize amino acids to form different proteins.

There are only 20 amino acids, but they can be combined in different ways to create thousands of different proteins, each with its own structure and function. Proteins carry out a wide range of processes inside our bodies, depending on their type. If there are abnormal variations in our DNA sequence, these instructions could be faulty and lead to various health issues.

However, not all of our DNA is conformed by protein-coding genes — in fact, nearly 99 percent of all our DNA is made up of non-coding DNA, meaning that it doesn’t contain instructions for protein-coding. For a long time, scientists thought that non-coding DNA didn’t have a specific function however, we’re learning more about the purpose of non-coding DNA every day.

Some parts of our non-coding DNA act as regulatory agents that activate or repress DNA transcription, whereas others contain instructions for the synthesis of RNA, among other functions. Therefore, sequencing our non-coding DNA and RNA can also tell us a lot about human health, since it also plays an important role in genetics.

Chromosomes are long strands of DNA that contain our genes — humans normally have 23 pairs of chromosomes. We each receive two versions of the same gene — one from each of our biological parents. The different versions of a gene are called alleles, and they determine the biological traits that we will express, such as eye or hair color.

Some alleles are dominant (meaning that you only need one copy of the same allele to express its associated characteristic), whereas others are recessive (meaning that you need to inherit two copies of the same allele to express that characteristic). This explains why DNA testing results will be different for everyone, even for full siblings.

The human genome is the compilation of all the genetic information that each person contains, regardless of whether it’s coding or non-coding.

What Is a Whole Genome Sequencing DNA Test

A ⁠whole genome sequencing DNA test is a type of genetic test used to determine the order of the nucleotides that form our entire genome — both coding and non-coding —, allowing scientists and physicians to ascertain whether an individual’s DNA sequence contains any abnormalities.

Genetic testing offers a wide array of benefits for scientific research, genetic counseling, individualized medical care, and even public health initiatives.

The original technology used for whole genome sequencing was called Sanger sequencing or chain termination method, and it was invented in 1977. Although this method was revolutionary for its time, it was also very slow and expensive.

When DNA testing was first used, the data analysis required to sequence just one person’s DNA could take years to complete.

The Sanger method was later automated to make the process faster the automated version of this method was used to complete portions of the Human Sequencing Project, which was a wide-scale, international project that sequenced the base pairs that make up human DNA for the first time.

The Sanger method is still used today to sequence shorter DNA fragments, but newer sequencing methods have made the turnaround time of DNA tests faster while reducing sequencing costs.

These methods also called high-throughput or next-generation sequencing methods have made large-scale DNA testing accessible to a wider audience since they only require a few days to analyze a genome test while still producing high-quality results.

There are several types of DNA tests, and each process genetic information differently and for different purposes. Some types of DNA testing include:

  • Whole genome sequencing (WGS)
    • ​As stated above, WGS sequences the entirety of our genome data, including both coding and non-coding DNA. As its name suggests, this type of genetic testing can identify variations in any part of your genome.
    • Available from Sequencing.com, Illumina, and Oxford Nanopore.
    • Rather than sequencing an individual’s entire genome, this test only sequences the parts of their DNA and RNA that contain coding instructions, which are also known as exons. Many of the genetic mutations that lead to genetic disorders happen in the exome (which is the combination of all our exons), which is why this test can still be very useful despite the fact that it doesn’t analyze your entire genome.
    • Available from Illumina, GeneDx, and Ambry Genetics.
    • ​This method isolates specific regions of DNA to analyze them for mutations. This technique can identify variations in specific genes, which can be very useful if you only need to diagnose or rule out distinct variations — for example, when screening for a particular genetic disease.
    • Available from Illumina, GeneDx, and Ambry Genetics.
    • This test measures the variations of single nucleotide polymorphisms (SNPs) against reference genome fragments from members of the same species. SNPs are variations that occur in a single base pair of your DNA. SNPs are the most common type of genetic variation, and SNP genotyping can determine the set of variants that are present in a person’s DNA. Single SNP annotations can also be used in conjunction with WGS to assess the frequency of rare genetic variants and their consequences.
    • Available from Sequencing.com, 23andMe, Ancestry.com, MyHeritage, and FamilyTreeDNA.

    Whole genome sequencing and other sequencing methods shouldn’t be confused with DNA profiling, which is simply used to determine the likelihood of a DNA sample coming from a specific source. DNA profiling is widely used to help solve criminal investigations, but it doesn’t provide any further genomic data.

    Purpose of Whole Genome Sequencing

    For most of known history, human genetics and the role that genes play in our health were a mystery. In fact, DNA and genes are a relatively modern concept — the molecular structure of DNA was only identified in the 1950s. But thanks to the advent of DNA sequencing, scientists can now analyze raw DNA data to understand human health, how certain diseases work, and what we can do to prevent or treat illnesses more efficiently.

    The main objective behind DNA tests, in general, is to identify whether there are any mutations in your DNA that could cause health problems. These tests can also provide information about your genealogy, which can be fascinating on a personal level but also helpful when it comes to determining your risk for certain diseases.

    The information provided by genetic testing is also important for public health since it can be used to guide interventions and individualize them according to the genetic characteristics of different population groups.

    Genome Sequencing and Personalized Medicine

    Whole genome sequencing will play a very big role in the future of personalized medicine. For example, whole genome sequencing provides enough data to personalize therapeutic approaches and treatments to diseases so you’re most likely to receive a treatment that will provide the most benefit with the least risk of side effects.

    Instead of using the same treatment on all patients who suffer from the same condition, physicians could use sequencing data to individualize each patient’s management.

    These advancements wouldn’t just potentially improve patients’ outcomes — they could also help create a more comfortable patient experience since patients won’t have to test different treatments in order to find the right fit for them. Additionally, it could help lower healthcare costs and improve the workflow at medical facilities by providing a straightforward way to decide between different treatment options.

    DNA testing is also used in prenatal genetic counseling, especially for future parents who have a family history of genetic diseases or pregnancy loss. In some cases, genetic testing may be necessary to understand the cause of a patient’s fertility issues. WGS could also be used to detect illnesses and genetic abnormalities in unborn fetuses.

    Whole genome sequencing hasn’t been exclusively applied to humans. Sequencing the DNA of bacterial organisms and other pathogens can help scientists understand the disease better, determine the origin of new mutations, synthesize new medications and vaccines, combat drug-resistant pathogens, and even contain outbreaks of contagious diseases around the world.

    What Can Whole Genome Sequencing Reveal?

    One of the main reasons why whole genome sequencing tests have become so popular is because they help ascertain your predisposition to certain diseases. Specific variations in your DNA sequence can cause genetic disorders some of these mutations are inherited from one or both parents, whereas other variations occur de novo — meaning that this is the first time that this variation is present in a member of a family.

    But DNA sequencing can also tell us a lot about non-genetic disorders. When we think of genetic testing, our mind immediately goes to inherited rare diseases, but DNA testing can tell you whether you’re at risk of developing more common health conditions, such as high blood pressure or diabetes.

    This information can also inform other family members of possible health risks, even if they’re not the ones who took the DNA test.

    Some patients may be advised by their physician to take a DNA sequencing test to provide an accurate diagnosis for their symptoms after failing to discover their cause through other methods — WGS has been successfully used to diagnose genetic disorders in gravely-ill children and to modify the therapeutic management they received.

    Others may simply choose to take a DNA test to learn more about their ancestry. Since WGS analyzes your entire genome, it may reveal unexpected variations that aren’t currently related to any physical symptoms. These variations are often called “secondary findings”.

    Keep in mind that not all genetic variations will automatically generate a disease. Certain genetic changes increase a person’s risk of developing a health condition, such as breast cancer. Depending on the disease, this predisposition can be mitigated through medical treatment or lifestyle changes.

    Other genetic variants are benign and don’t affect our health at all. And in other cases, the exact implications of a genetic variant are still unknown — these variants are also known as “variants of uncertain significance”. It’s always important to discuss the results of your sequencing test with a specialist, such as a geneticist.

    WGS can also reveal your ancestry with a significant degree of accuracy. To do so, a sequencing service will compare the SNPs in your DNA against reference sequences from specific ethnic populations.

    SNPs have been found to be inherited through generations, which is why they’re reliable indicators that can be used to compare your DNA against different populations around the world, thus determining your most likely DNA ancestry. For this reason, SNP sequencing is also valuable in the field of evolutionary biology.

    How Is Whole Genome Sequencing Done

    In the past, genotyping human DNA was a long and expensive process — in fact, the Human Genome Project lasted 13 years —, but now, you can use a DNA kit from the comfort of your own home and get results in a few weeks.

    There are several modern DNA sequencing methods, including:

    • Illumina dye sequencing
    • Pyrosequencing
    • Single-molecule real-time (SMRT) sequencing
    • Nanopore sequencing

    In most cases, once you purchase a commercial direct-to-consumer sequencing test, you’ll receive a collection kit that you’ll be able to use at home. You’ll be instructed to swab the inside of your cheek and place the swab inside a labeled container before shipping it back to the provider.

    Collecting samples using these DNA testing kits is safe, quick, and painless. In other cases, the sample may be collected at a doctor’s office or lab.

    Since the human genome contains so much information, DNA tests can’t analyze it all at once. Instead, these methods use different techniques to break DNA into smaller pieces, and a sequencer is used to determine the order of the nucleotides in each of these DNA fragments. Then, bioinformatic technology is used to put all the pieces back together correctly so that they can be analyzed.

    Whole Genome Sequencing Results

    Depending on the type of DNA test that you’ve purchased, you’ll receive your results in a few days or weeks. Whole genome sequencing provides the most comprehensive type of genomic characterization that is currently available. Each whole genome sequencing test generates a colossal amount of data — after all, the human genome contains approximately 3 billion base pairs.

    But you won’t be receiving the sequencing results of 3 billion base pairs after mailing your DNA test kit back to the provider, of course. This amount of information would be practically impossible to process, even for a healthcare provider or scientist.

    Instead, your results will detail pertinent information regarding your health and genetic makeup. WGS can identify many types of variations in your DNA, such as single nucleotide variants, insertion/deletion (indel) polymorphisms in a specific nucleotide sequence, structural variants, copy number variants, among others.

    The results of a DNA testing kit can provide a wide range of information, including:

    • Single-gene or Mendelian disorders: as their name suggests, these disorders affect a single gene.
      • Your WGS will determine whether you suffer from one of these disorders or are at risk of developing one later on or passing one down to your children.
      • Single-gene disorders include sickle cell anemia, Huntington’s disease, cystic fibrosis, or muscular dystrophy.
      • As we mentioned earlier, this also means that your risk of developing these diseases can often be mitigated through medical intervention or a healthier lifestyle.
      • Some of these conditions include obesity, hypertension, and diabetes.
      • This data can be used to provide individualized medical care, decrease drug toxicity, and adjust medication dosages.

      Additionally, whole genome sequencing can also provide information regarding your ethnicity, ancestry, overall health and wellbeing, nutrition and fitness insights, and much more.

      Whole Genome Sequencing Cost

      Once upon a time — or really, just a few short decades ago — it would have been practically impossible for a private individual to cover the costs of having their DNA sequenced.

      But newer high-throughput sequencing methods can handle whole genomes quickly. In fact, certain modern sequencer machines (also called sequencing “platforms”) can even provide same-day results for small DNA fragments.

      As the processes involved in DNA sequencing have become faster and easier to access, the costs associated with testing have also gone down.

      As recently as 2009, genomic testing could cost approximately $50,000 per individual genome. Now, several companies offer whole genome sequencing for anywhere between $400 to $600, although some companies do charge higher prices.

      Whole Genome Sequencing Service

      In recent years, more and more biotechnology companies have started to offer genetic tests. Illumina is one of the biggest stakeholders in the field of genomics, having patented several different sequencer machines and DNA tests. They offer various sequencing platforms to fit different needs, from traditional whole-genome sequencing platforms used in clinics and research labs, to sequencers that can identify specific diseases.

      Other major genomics companies include Thermo Fisher Scientific and Oxford Nanopore Technologies — the latter of which created an innovative USB sequencer that can be attached to a desktop computer, opening the possibility of portable and convenient DNA sequencing tests.

      Pacific Biosciences is another important biotechnology company. They have introduced a type of real-time sequencing technology that is able to provide the longest DNA reads to date — 10,000 base pairs at once, compared to approximately 150 base pairs at once through other sequencing platforms. If perfected, this new approach could make DNA testing even faster and more accessible than ever before.

      Other companies that provide DNA sequencing include Knome, Sequenom, 454 Life Sciences, Life Sciences, BGI, Helicos Biosciences, Veritas Genetics, Complete Genomics, Affymetrix, and IBM, among others. Not surprisingly, the advent of new whole genomic sequencing technologies has generated public discussion surrounding their ethical implications, and the need to ensure the privacy of individuals who choose to take one of these DNA tests.

      We can’t stress how important it is to research your chosen provider before taking a genome test in order to understand their privacy and data protection policies.

      If you want to learn more about whole genome sequencing, head over to our education center to discover more in-depth articles on this innovative technique.

      1. Rui Yin, Chee Keong Kwoh, Jie Zheng. ⁠Whole Genome Sequencing Analysis. Encyclopedia of Bioinformatics and Computational Biology, Academic Press, 2019, Pages 176-183. ISBN 9780128114322.
      2. University of Leicester. ⁠Gene Expression and Regulation. Retrieved 2021 March 9.
      3. ⁠What are whole exome sequencing and whole genome sequencing? Medline Plus. Retrieved 2021 March 9.
      4. Razvan Cojocaru, Peter J Unrau. ⁠Origin of life: Transitioning to DNA genomes in an RNA world. Simon Fraser University, Canada. Nov 1, 2017. eLife 20176:e32330 DOI: 10.7554/eLife.32330.
      5. Center for Genomics and Global Health. ⁠Why genomics? Retrieved 2021 March 9.
      6. Steinberg, K. M., Okou, D. T., & Zwick, M. E. (2008). ⁠Applying rapid genome sequencing technologies to characterize pathogen genomes. Analytical Chemistry, 80(3), 520–528.
      7. Lewis, T. (2013, April 14). ⁠Human genome project marks 10th anniversary. In LiveScience. Retrieved 2021 March 9.
      8. National Human Genome Research Institute. (2016, January 15). ⁠DNA sequencing costs. In Large-scale genome sequencing and analysis centers (LSAC). Retrieved 2021 March 9.
      9. Fermín J. González-Melado, Chapter 12 - ⁠Whole-Genome Sequencing as a Method of Prenatal Genetic Diagnosis. Clinical Ethics At the Crossroads of Genetic and Reproductive Technologies, Academic Press, 2018, Pages 263-291, ISBN 9780128137642.
      10. Thermo Fisher Scientific. (2016). ⁠Sanger sequencing method. In Sanger Sequencing. Retrieved 2021 March 9.
      11. Thomas PE, Klinger R, Furlong LI, Hofmann-Apitius M, Friedrich CM (2011). ⁠Challenges in the association of human single nucleotide polymorphism mentions with unique database identifiers. BMC Bioinformatics. 12 Suppl 4: S4. DOI:10.1186/1471-2105-12-S4-S4.
      12. Mizzi C, Peters B, Mitropoulou C, Mitropoulos K, Katsila T, Agarwal MR, van Schaik RH, Drmanac R, Borg J, Patrinos GP. ⁠Personalized pharmacogenomics profiling using whole-genome sequencing. Pharmacogenomics. 2014 Jun15(9):1223-34.

      ⁠Dr. Brandon Colby MD is a US physician specializing in the personalized prevention of disease through the use of genomic technologies. He’s an expert in genetic testing, genetic analysis, and precision medicine. Dr. Colby is also the Founder of Sequencing.com and the author of ⁠Outsmart Your Genes.

      Dr. Colby holds an MD from the Mount Sinai School of Medicine, an MBA from Stanford University’s Graduate School of Business, and a degree in Genetics with Honors from the University of Michigan. He is an Affiliate Specialist of the American College of Medical Genetics and Genomics (⁠ACMG), an Associate of the American College of Preventive Medicine (⁠ACPM), and a member of the National Society of Genetic Counselors (⁠NSGC)


      Sequencing breakthroughs for genomic ecology and evolutionary biology

      Techniques involving whole-genome sequencing and whole-population sequencing (metagenomics) are beginning to revolutionize the study of ecology and evolution. This revolution is furthest advanced in the Bacteria and Archaea, and more sequence data are required for genomic ecology to be fully applied to the majority of eukaryotes. Recently developed next-generation sequencing technologies provide practical, massively parallel sequencing at lower cost and without the requirement for large, automated facilities, making genome and transcriptome sequencing and resequencing possible for more projects and more species. These sequencing methods include the 454 implementation of pyrosequencing, Solexa/Illumina reversible terminator technologies, polony sequencing and AB SOLiD. All of these methods use nanotechnology to generate hundreds of thousands of small sequence reads at one time. These technologies have the potential to bring the genomics revolution to whole populations, and to organisms such as endangered species or species of ecological and evolutionary interest. A future is now foreseeable where ecologists may resequence entire genomes from wild populations and perform population genetic studies at a genome, rather than gene, level. The new technologies for high throughput sequencing, their limitations and their applicability to evolutionary and environmental studies, are discussed in this review.


      Informação sobre o autor

      These authors contributed equally: Wenyan Nong, Zhe Qu, Yiqian Li, Tom Barton-Owen, Annette Y. P. Wong.

      Afiliações

      School of Life Sciences, Simon F.S. Li Marine Science Laboratory, State Key Laboratory of Agrobiotechnology, The Chinese University of Hong Kong, Hong Kong, China

      Wenyan Nong, Zhe Qu, Yiqian Li, Tom Barton-Owen, Annette Y. P. Wong, Ho Yin Yip, Hoi Ting Lee, Satya Narayana, Jianquan Cao & Jerome H. L. Hui

      Centre for Ecology and Conservation, University of Exeter, Penryn, UK

      Tobias Baril & Alexander Hayward

      Dovetail Genomics, Scotts Valley, CA, USA

      State Key Laboratory of Agrobiotechnology, School of Life Sciences, The Chinese University of Hong Kong, Hong Kong, China

      Ting Fung Chan & Sai Ming Ngai

      School of Life Sciences, The Chinese University of Hong Kong, Hong Kong, China

      School of Biological Sciences, The University of Hong Kong, Hong Kong, China

      Leibniz Institute of Natural Product Research and Infection Biology – Hans Knöll Institute, Jena, Germany

      Department of Ocean Science and Hong Kong Branch of Southern Marine Science and Engineering Guangdong Laboratory (Guangzhou), Hong Kong University of Science and Technology, Hong Kong, China

      Department of Biology, Hong Kong Baptist University, Hong Kong, China

      Department of Computer Science and Engineering, The Chinese University of Hong Kong, Hong Kong, China

      Institute of Marine Biotechnology, Universiti Malaysia Terengganu, Terengganu, Malaysia

      Department of Bioscience and Biotechnology, Fakir Mohan University, Balasore, India

      Institute of Tropical Biodiversity and Sustainable Development, University Malaysia Terengganu, 20130, Kuala Nerus, Terengganu, Malaysia

      Research Division, Association for Biodiversity Conservation and Research (ABC), Odisha, 756003, India

      Institute of Oceanography and Maritime Studies (INOCEM), Kulliyyah of Science, International Islamic University, Kuantan, Malaysia

      Department of Cell and Systems Biology, University of Toronto, Toronto, Canada

      Department of Biology, Queen’s University, Toronto, Canada

      Department of Chemistry, City University of Hong Kong, Hong Kong, China

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Você também pode pesquisar este autor no PubMed Google Scholar

      Contribuições

      J.H.L.H. conceived and supervised the study. W.N. carried out the genome assemblies and analyses, gene model predictions, microRNA mapping, and synteny analyses. Z.Q. carried out the microRNA annotation, final checking microRNA copies and arm switching analyses. Y.L. carried out the homeobox gene analyses, synteny analyses, and the SNP analyses in populations. T.B.O. carried out the homeobox gene identifications and tree construction. A.Y.P.W. carried out the gene and microRNA copies analyses and arm switching analyses. H.Y.Y. provided animal husbandry and logistics. H.T.L. carried out novel microRNA analyses. S.N. carried out the population structure analyses. T.B. and A.H. performed the T.E. análises. T.S. involved in the final version of genome assembly, and J.C. involved in earlier version of genome assembly. T.F.C., H.S.K., S.M.N., G.P., P.Y.Q., J.W.Q., K.Y.Y., S.S.T., W.G.B., S.G.C., J.H.L.H. applied and obtained the funding. N.I., S.P., A.J., S.G.C. collected and provided samples in field. S.S.T., W.G.C., S.G.C., A.H., J.H.L.H. drafted the first version of the manuscript. All authors provided comments and approved the manuscript.

      Autor correspondente


      Assista o vídeo: Deel 2 Het maken van polypeptideketens (Agosto 2022).