Em formação

Epistasia em cromossomos e indivíduos 'homozigotos para interações'

Epistasia em cromossomos e indivíduos 'homozigotos para interações'



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Desculpas por quaisquer falhas na nomenclatura. Sou um matemático que está fazendo uma incursão na genética para uma tese de mestrado. Especificamente, estou gerando dados de sequência genética diplóide artificial e dados de fenótipo com base em interações epistáticas conhecidas.

Questão Primária

Estou familiarizado com o conceito de que ter várias cópias de um único alelo (por exemplo, um de cada progenitor) pode realmente aumentar a expressão e, assim, alterar o fenótipo quantitativo (pelo menos em alguns casos?). Isso também pode acontecer com efeitos epistáticos? Por exemplo, considere o caso em que o locus 1 ($ L_1 $) e locus 2 ($ L_2 $) exibem alguma interação positiva ($ beta $) no traço ($ Y $). $$ E [Y] = mu + beta (L_1L_2) $$ Se ambos os cromossomos contêm o alelo em questão em ambos os loci, então este indivíduo exibe mais de um aumento de característica do que se ele tivesse apenas um cromossomo com os alelos epistáticos?

Questão secundária

Os alelos podem interagir epistaticamente mesmo quando estão presentes em cromossomos diferentes? por exemplo. assumir alelo UMA no locus 1 interage com o alelo B no locus 2. O indivíduo tem UMA no locus 1 e b no locus 2 no cromossomo 1. Ele também tem uma no locus 1 e B no locus 2 no cromossomo 2. Faça UMA e B dos diferentes cromossomos interagem? Minha intuição é sim, mas quero verificação.

Muito Obrigado!!!


Questão 1: Os fenômenos que você descreve nos quais importa se você tem uma ou duas cópias de um alelo (por exemplo, o fenótipo AA sendo diferente do fenótipo Aa) são conhecidos como efeitos de dominância. Os efeitos de dominância podem interagir com os efeitos epistáticos (nos quais o efeito fenotípico de um locus depende do genótipo no outro locus).

Um bom exemplo é a interação entre o Cutia locus e o Mc1R locus no rato oldfield (Peromyscus polionotus) na determinação da cor da pelagem. Homozigotos de cor escura para o Cutia locus tem casacos escuros, independentemente do alelo no Mc1R locus, enquanto a cor em Cutia heterozigotos ou homozigotos de cor clara dependem do genótipo no Mc1R locus. A figura abaixo, de Steiner et al (2007), ilustra:

Questão 2: Loci que interagem epistaticamente não precisam estar no mesmo cromossomo. Os loci discutidos acima fornecem um exemplo perfeitamente bom. Mc1R está no cromossomo 1, onde como Cutia está no cromossomo 7, mas eles interagem epistaticamente.


Epistasia extensiva para comportamento olfativo, sono e atividade de vigília em Drosophila melanogaster

A epistasia é uma característica importante da arquitetura genética de características quantitativas, mas a dinâmica das interações epistáticas em populações naturais e a relação entre epistasia e pleiotropia permanecem pouco compreendidas. Aqui, nós estudamos os efeitos dos modificadores epistáticos que segregam em um derivado selvagem Drosophila melanogaster população sobre os efeitos mutacionais de P- inserções de elemento em Semaforina-5C (Sema-5c) e Calreticulina (Crc), genes pleiotrópicos que afetam o comportamento olfativo e o comportamento de sobressalto e, no caso de Crc, fenótipos do sono. Nós introduzimos Canton-S B (CSB) terceiros cromossomos com ou sem um P- inserção de elemento no Crc ou Sema-5c locus em várias linhas consanguíneas derivadas de selvagens do Drosophila melanogaster Painel de Referência Genética (DGRP) e avaliou os efeitos da epistasia na resposta olfativa ao benzaldeído e, para Crc, também no sono. Em cada caso, encontramos epistasia substancial e variação significativa na magnitude da epistasia. A direção predominante dos efeitos epistáticos foi suprimir o fenótipo mutante. Estas observações apoiam um estudo anterior sobre o comportamento de sobressalto usando o mesmo D. melanogaster linhas de substituição de cromossomos, que concluíram que a supressão da epistasia pode tamponar os efeitos de novas mutações. No entanto, os efeitos epistáticos não são correlacionados entre os diferentes fenótipos. Assim, suprimir a epistasia parece ser uma característica geral difundida das populações naturais para proteger contra os efeitos de novas mutações, mas diferentes interações epistáticas modulam diferentes fenótipos afetados por mutações no mesmo gene pleiotrópico.


Introdução

Tem sido frequentemente proposto que a redução de aptidão causada pela presença conjunta de vários alelos deletérios em um determinado genótipo pode ser maior do que o esperado em um modelo de aptidão multiplicativo entre loci. Essa intensificação de efeitos deletérios, denotados sinérgicos, reforçadores ou epistasia negativa, fundamenta a hipótese determinística mutacional (MDH) da evolução do sexo. Essa hipótese considera que, sob epistasia sinérgica, a seleção remove preferencialmente os genótipos formados por gametas carregados de vários deletérios, e esse processo é mais eficiente se o sexo e a recombinação embaralharem os genes para que tais gametas sejam produzidos novamente a cada geração. Portanto, a reprodução sexual e a recombinação podem ter evoluído porque permitem uma redução do número de alelos deletérios segregantes no equilíbrio de seleção de mutação (por exemplo, Kondrashov, 1988 Otto & Lenormand, 2002). Foi demonstrado que, em muitas espécies com reprodução sexuada anisogâmica, a taxa de mutação deletéria é tão pequena que a vantagem do sexo contabilizada pelo MDH não cancelaria o custo duplo da anisogamia (Crow, 1970 Kondrashov, 1988 Keightley & Eyre-Walker, 2000 García-Dorado et al., 2003). No entanto, a epistasia sinérgica ainda pode ser responsável por uma vantagem substancial de sistemas de embaralhamento menos dispendiosos, como recombinação ou reprodução sexual isogâmica. A epistasia sinérgica foi testada várias vezes, mas os resultados, brevemente discutidos abaixo, geralmente não são consistentes.

O declínio acelerado da viabilidade foi encontrado em alguns experimentos de acumulação de mutação de longo prazo com Drosophila melanogaster, e foi atribuído a epistasia sinérgica (Mukai, 1969). No entanto, tal decadência acelerada não é um fenômeno geral (García-Dorado & Caballero, 2002 Fry, 2004). Da mesma forma, usando duas espécies de insetos, combinações sintéticas de mutações deletérias mostraram forte sinergia para características de aptidão, mas isso só se tornou aparente quando o número de mutações deletérias que foram reunidas era tão grande que os genótipos correspondentes deveriam ser raros na população natural (Whitlock & Bourguet, 2000 Rivero et al., 2003). Além disso, experimentos semelhantes usando combinações específicas de mutações deletérias para vírus de RNA, bactérias, leveduras e nematóides, embora ocasionalmente detectando interações entre loci, não mostraram uma tendência consistente para a sinergia (Elena & Lenski, 1997 Visser et al., 1997 Peña et al., 2000 Peters & Keightley, 2000 Wloch et al., 2001 Burch et al., 2003 ).

A sinergia reduzirá a adequação de genótipos homozigotos para vários alelos deletérios abaixo do produto da adequação homozigótica calculada separadamente para cada alelo deletério, de modo que a média dos componentes log-fitness mostrará uma decadência acelerada com o aumento do coeficiente de endogamia F. Este é o fundamento lógico para uma segunda abordagem experimental em que a epistasia sinérgica é buscada pelo ensaio da linearidade da depressão de log-fitness (ou componentes log-fitness) no coeficiente de endogamia (F) em populações segregadas. Um número considerável de experimentos foi realizado com diferentes organismos nos quais as populações com diferentes níveis de endogamia foram testadas de forma síncrona para algum traço de aptidão, e onde a depressão geralmente acabou sendo linear em F, sugerindo nenhuma sinergia. No entanto, a seleção natural poderia ter purgado genótipos homozigotos para um grande número de alelos deletérios, ocultando assim os efeitos da sinergia (ver Willis, 1993). Na verdade, as estimativas da taxa de depressão por endogamia (δ) obtidos pela prática de endogamia são comumente menores do que aqueles obtidos pela homozigosidade cromossômica forçada (Dobzhansky et al., 1963 Malogolowkin-Cohen et al., 1964). Em relação ao nosso material biológico específico, D. melanogaster, δ estimativas de viabilidade obtidas através de endogamia (δ ≈ 0,7, López-Fanjul & Villaverde, 1989 García et al., 1994) são menores do que aqueles obtidos forçando a homozigose cromossômica (δ ≈ 1, δ ≈ 2, δ ≈ 2.3, δ ≈ 2.8, δ ≈ 1.2, δ ≈ 1, em Temin et al., 1969 Mukai & Yamaguchi, 1974 Seager & Ayala, 1982 Mukai & Nagano, 1983 Kusakabe & Mukai, 1984 Kusakabe et al., 2000, respectivamente resultados ajustados para todo o genoma). Isso pode sugerir seleção purgante em experimentos de endogamia, embora deva ser observado que as estimativas correspondem a diferentes populações que podem ocultar diferentes cargas de endogamia.

Para prevenir a seleção natural, vários experimentos foram realizados com diferentes Drosófila espécies usando a metodologia proposta por Greenberg & Crow (1960). Assim, usando esquemas de cruzamento envolvendo estoques balanceadores, a taxa de depressão por endogamia foi estimada a partir de diferentes F valores obtidos forçando a homozigose para diferentes números de cromossomos inteiros. Desta forma, Spassky et al. (1965) descobriram que a viabilidade de indivíduos homozigotos para o segundo e terceiro cromossomos era, em média, menor que o produto da viabilidade de indivíduos homozigotos para cada cromossomo. No entanto, outro experimento semelhante não encontrou nenhuma evidência de sinergia (Seager & Ayala, 1982), e Temin et al. (1969) encontraram depressão de endogamia quase linear da log-viabilidade para diferentes níveis de endogamia para os cromossomos II e III, com sinergia fraca e não significativa afetando os cromossomos quasinormais (QN). Assim, a evidência de sinergia é geralmente inconsistente e a maioria dos casos detectados de epistasia sinérgica foram associados com alta F valores ou com genótipos de laboratório carregando muitas mutações deletérias.

A relevância evolutiva da sinergia negativa depende da quantidade de carga necessária para que ela ocorra. Por exemplo, se a sinergia só aparece para genótipos raros carregando muitos alelos deletérios, raramente conferirá ao sexo a vantagem necessária para compensar o custo duplo da anisogamia. Da mesma forma, a sinergia que ocorre apenas entre loci em cromossomos diferentes não pode ser invocada como uma causa para a evolução da recombinação. Nosso objetivo é investigar a generalidade e a natureza da sinergia cromossômica, avaliando a linearidade da depressão por endogamia para diferentes níveis de endogamia envolvendo o cromossomo II (FII) e representando uma consanguinidade total moderada (F) quando considerado em relação a todo o genoma. Testamos a viabilidade do cromossomo II em relação a um genótipo de marcador comum (Cy/eu 2) para genótipos: (i) carregando dois cromossomos amostrados de diferentes fêmeas (F = 0), (ii) carregando dois cromossomos amostrados dos gametas produzidos pela mesma fêmea (FII = 0,5, ou seja F ≈ 0,2 para todo o genoma), e (iii) sendo homozigoto para um cromossomo (FII = 1, ou seja, F ≈ 0,4 para todo o genoma). A fim de evitar diferenças entre os três ensaios causadas pela seleção natural, os cromossomos ausentes ou excluídos de um ensaio também foram removidos dos outros dois, de modo que os três grupos de genótipos analisados ​​(FII = 0, 0,5, 1) incluem exatamente a mesma amostra de cromossomos II. Para avaliar a conveniência de ensaio de sinergia para fecundidade, a relação genética de viabilidade e fecundidade com aptidão competitiva foi investigada em uma subamostra dos genótipos acima.


Epistasia em cromossomos e indivíduos 'homozigotos para interações' - Biologia

Nesta seção, você explorará as seguintes questões:

  • Qual é a relação entre a lei da segregação de Mendel e o sortimento independente em termos de genética e os eventos da meiose?
  • Como o método das linhas bifurcadas e as regras de probabilidade podem ser usados ​​para calcular a probabilidade de genótipos e fenótipos de cruzamentos de genes múltiplos?
  • Como ligação, cruzamento, epistasia e recombinação violam as leis de herança de Mendel?

Conexão para Cursos AP ®

Como foi descrito anteriormente, Mendel propôs que os genes são herdados como pares de alelos que se comportam em um padrão dominante e recessivo. Durante a meiose, os alelos segregam, ou se separam, de modo que cada gameta tem a mesma probabilidade de receber um dos dois alelos presentes no indivíduo diplóide. Mendel chamou esse fenômeno de lei da segregação, que pode ser demonstrada em um cruzamento monohíbrido. Além disso, os genes carregados em diferentes cromossomos se classificam em gametas independentemente uns dos outros. Esta é a lei de Mendel da classificação independente. Essa lei pode ser demonstrada em um cruzamento di-híbrido envolvendo duas características diferentes localizadas em cromossomos diferentes. Os quadrados de Punnett podem ser usados ​​para prever genótipos e fenótipos de descendentes envolvendo um ou dois genes.

Embora os cromossomos se classifiquem independentemente em gametas durante a meiose, a lei de Mendel da classificação independente se refere aos genes, não aos cromossomos. Em humanos, os cromossomos únicos podem carregar mais de 1.000 genes. Genes localizados próximos uns dos outros no mesmo cromossomo são chamados de genes ligados. Quando os genes estão localizados em estreita proximidade no mesmo cromossomo, seus alelos tendem a ser herdados juntos, a menos que ocorra recombinação. Isso resulta em proporções de descendência que violam a lei de Mendel de variedade independente. Os genes que estão localizados distantes no mesmo cromossomo provavelmente se agrupam de forma independente. As regras de probabilidade podem ajudar a resolver isso (trocadilho intencional). A lei afirma que alelos de diferentes genes se agrupam independentemente uns dos outros durante a formação de gametas.

As informações apresentadas e os exemplos destacados na seção apoiam os conceitos delineados na Grande Ideia 3 do AP ® Biology Curriculum Framework. Os Objetivos de Aprendizagem listados na Estrutura do Currículo fornecem uma base transparente para o curso AP ® Biologia, uma experiência laboratorial baseada em investigação, atividades instrucionais e questões do exame AP ®. Um objetivo de aprendizagem mescla o conteúdo necessário com uma ou mais das sete práticas científicas.

Grande Ideia 3 Os sistemas vivos armazenam, recuperam, transmitem e respondem às informações essenciais aos processos vitais.
Compreensão Duradoura 3.A As informações herdáveis ​​proporcionam a continuidade da vida.
Conhecimento Essencial 3.A.3 A base cromossômica da herança fornece uma compreensão do padrão de passagem (transmissão) de genes de pais para filhos.
Prática de Ciências 2.2 O aluno pode aplicar rotinas matemáticas a quantidades que descrevem fenômenos naturais.
Objetivo do aprendizado 3.14 O aluno é capaz de aplicar rotinas matemáticas para determinar os padrões Mendelianos de herança fornecidos pelos dados.
Conhecimento Essencial 3.A.4 O padrão de herança de muitos traços não pode ser explicado pela genética mendeliana simples.
Prática de Ciências 6.5 O aluno pode avaliar explicações científicas alternativas.
Objetivo do aprendizado 3.15 O aluno é capaz de explicar os desvios do modelo de Mendel de herança de características.
Conhecimento Essencial 3.A.4 O padrão de herança de muitos traços não pode ser explicado pela genética mendeliana simples.
Prática de Ciências 6.3 O aluno pode articular as razões pelas quais as teorias e explicações científicas são refinadas ou substituídas.
Objetivo do aprendizado 3.16 O aluno é capaz de explicar como os padrões de herança de muitas características não podem ser explicados pela genética de Mendel.
Conhecimento Essencial 3.A.4 O padrão de herança de muitos traços não pode ser explicado pela genética mendeliana simples.
Prática de Ciências 1.2 O aluno pode descrever representações e modelos de fenômenos naturais ou artificiais e sistemas no domínio.
Objetivo do aprendizado 3.17 O aluno é capaz de descrever representações de um exemplo apropriado de padrões de herança que não podem ser explicados pelo modelo de Mendel de herança de características.

As Questões do Desafio da Prática de Ciências contêm questões de teste adicionais para esta seção que o ajudarão a se preparar para o exame AP. Essas questões abordam os seguintes padrões:
[APLO 3.11] [APLO 3.15] [APLO 3.14] [APLO 3.17] [APLO 3.12]

Mendel generalizou os resultados de seus experimentos com plantas de ervilha em quatro postulados, alguns dos quais às vezes são chamados de “leis”, que descrevem a base da herança dominante e recessiva em organismos diplóides. Como você aprendeu, existem extensões mais complexas do mendelismo que não exibem o mesmo F2 razões fenotípicas (3: 1). No entanto, essas leis resumem os fundamentos da genética clássica.

Pares de fatores de unidade ou genes

Mendel propôs primeiro que os fatores de unidade pareada da hereditariedade eram transmitidos fielmente de geração a geração pela dissociação e reassociação de fatores pareados durante a gametogênese e a fertilização, respectivamente. Depois que ele cruzou ervilhas com características contrastantes e descobriu que a característica recessiva ressurgiu no F2 geração, Mendel deduziu que os fatores hereditários devem ser herdados como unidades discretas. Essa descoberta contradiz a crença da época de que os traços dos pais eram misturados na prole.

Alelos podem ser dominantes ou recessivos

A lei de dominância de Mendel afirma que, em um heterozigoto, um traço irá esconder a presença de outro traço para a mesma característica. Em vez de ambos os alelos contribuírem para um fenótipo, o alelo dominante será expresso exclusivamente. O alelo recessivo permanecerá “latente”, mas será transmitido à prole da mesma maneira que o alelo dominante é transmitido. O traço recessivo só será expresso por descendentes que tenham duas cópias desse alelo (Figura 12.15), e esses descendentes se reproduzirão verdadeiros quando se auto-cruzarem.

Desde os experimentos de Mendel com ervilhas, outros pesquisadores descobriram que a lei da dominância nem sempre é verdadeira. Em vez disso, vários padrões diferentes de herança foram encontrados.

Figura 12.15 A criança na foto expressa albinismo, um traço recessivo.

Segregação igual de alelos

Observando que ervilhas verdadeiras com características contrastantes deu origem a F1 gerações em que todas expressaram o traço dominante e F2gerações que expressavam os traços dominantes e recessivos na proporção de 3: 1, Mendel propôs a lei da segregação. Essa lei afirma que os fatores de unidade pareada (genes) devem segregar igualmente em gametas, de modo que a prole tenha uma probabilidade igual de herdar qualquer um dos fatores. Para o F2 geração de um cruzamento mono-híbrido, as seguintes três combinações possíveis de genótipos podem resultar: homozigoto dominante, heterozigoto ou homozigoto recessivo. Como os heterozigotos podem surgir de duas vias diferentes (recebendo um alelo dominante e um alelo recessivo de qualquer um dos pais), e porque os heterozigotos e os indivíduos homozigotos dominantes são fenotipicamente idênticos, a lei apóia a proporção fenotípica de 3: 1 observada por Mendel. A segregação igual de alelos é a razão pela qual podemos aplicar o quadrado de Punnett para prever com precisão a descendência de pais com genótipos conhecidos. A base física da lei da segregação de Mendel é a primeira divisão da meiose, na qual os cromossomos homólogos com suas diferentes versões de cada gene são segregados em núcleos filhos. O papel da segregação meiótica dos cromossomos na reprodução sexual não foi compreendido pela comunidade científica durante a vida de Mendel.

Sortimento independente

A lei de Mendel de classificação independente afirma que os genes não influenciam uns aos outros no que diz respeito à classificação de alelos em gametas, e todas as combinações possíveis de alelos para cada gene têm a mesma probabilidade de ocorrer. A variedade independente de genes pode ser ilustrada pelo cruzamento di-híbrido, um cruzamento entre dois pais reprodutores verdadeiros que expressam traços diferentes para duas características. Considere as características de cor e textura da semente para duas plantas de ervilha, uma que tem sementes verdes enrugadas (yyrr) e outro que tem sementes amarelas e redondas (YYRR) Como cada pai é homozigoto, a lei da segregação indica que os gametas da planta verde / enrugada são todos ano, e os gametas para a planta amarela / redonda são todos Ano. Portanto, o F1 geração de descendência, todos são YyRr (Figura 12.16).

CONEXÃO VISUAL

  1. ppYY, Ppyy, ppYY, ppyy produzindo flores brancas com ervilhas amarelas, flores roxas com ervilhas amarelas e flores brancas com ervilhas verdes. Você pode encontrar isso com um quadrado de Punnett 3 × 3.
  2. PPYY, PpYy, ppYY, ppyy produzindo flores roxas com ervilhas amarelas, flores brancas com ervilhas amarelas e flores brancas com ervilhas verdes. Você pode encontrar isso com um quadrado de Punnett 2 × 2.
  3. Ppyy, PpYy, ppYY, ppyy produzindo flores roxas com ervilhas verdes, flores roxas com ervilhas amarelas, flores brancas com ervilhas amarelas e flores brancas com ervilhas verdes. Você pode encontrar isso com um quadrado de Punnett 3 × 3.
  4. PpYY, PpYy, ppYY, ppYy produzindo flores roxas com ervilhas amarelas e flores brancas com ervilhas amarelas. Você pode encontrar isso com um quadrado de Punnett 2 × 2.

Para a geração F2, a lei da segregação exige que cada gameta receba um R alelo ou um r alelo junto com um Yalelo ou um y alelo. A lei da classificação independente afirma que um gameta no qual um r alelo classificado teria a mesma probabilidade de conter um Y alelo ou um y alelo. Assim, existem quatro gametas igualmente prováveis ​​que podem ser formados quando o YyRr heterozigoto é auto-cruzado, da seguinte forma: Ano, Ano, ano, e ano. Organizar esses gametas ao longo do topo e à esquerda de um quadrado de Punnett 4 × 4 (Figura 12.16) nos dá 16 combinações genotípicas igualmente prováveis. A partir desses genótipos, inferimos uma razão fenotípica de 9 redondo / amarelo: 3 redondo / verde: 3 enrugado / amarelo: 1 enrugado / verde (Figura 12.16). Essas são as proporções de descendência que esperaríamos, supondo que realizamos os cruzamentos com um tamanho de amostra grande o suficiente.

Por causa da classificação independente e dominância, a razão fenotípica di-híbrida 9: 3: 3: 1 pode ser reduzida em duas razões 3: 1, característica de qualquer cruzamento mono-híbrido que segue um padrão dominante e recessivo. Ignorando a cor da semente e considerando apenas a textura da semente no cruzamento di-híbrido acima, esperaríamos que três quartos do F2 a descendência da geração seria redonda e um quarto seria enrugado. Da mesma forma, isolando apenas a cor da semente, assumiríamos que três quartos do F2 a prole seria amarela e um quarto seria verde. A classificação de alelos para textura e cor são eventos independentes, portanto, podemos aplicar a regra do produto. Portanto, a proporção de F redondo e amarelo2 espera-se que a prole seja (3/4) × (3/4) = 9/16, e a proporção de prole enrugada e verde é (1/4) × (1/4) = 1/16. Essas proporções são idênticas às obtidas usando um quadrado de Punnett. A prole amarela redonda, verde e enrugada também pode ser calculada usando a regra do produto, pois cada um desses genótipos inclui um fenótipo dominante e um recessivo. Portanto, a proporção de cada um é calculada como (3/4) × (1/4) = 3/16.

A lei da variedade independente também indica que um cruzamento entre amarelo e enrugado (YYrr) e verde, redondo (yyRR) os pais produziriam o mesmo F1 e F2 descendência como no YYRR x yyrr cruzar.

A base física para a lei da classificação independente também está na meiose I, na qual os diferentes pares homólogos se alinham em orientações aleatórias. Cada gameta pode conter qualquer combinação de cromossomos paternos e maternos (e, portanto, os genes neles) porque a orientação das tétrades no plano da metáfase é aleatória.

Método de linha bifurcada

Quando mais de dois genes estão sendo considerados, o método do quadrado de Punnett torna-se difícil de controlar. Por exemplo, examinar um cruzamento envolvendo quatro genes exigiria uma grade de 16 × 16 contendo 256 caixas. Seria extremamente complicado inserir manualmente cada genótipo. Para cruzamentos mais complexos, os métodos de linha bifurcada e de probabilidade são preferidos.

Para preparar um diagrama de linha bifurcada para um cruzamento entre F1 heterozigotos resultantes de um cruzamento entre AABBCC e aabbcc pais, primeiro criamos linhas iguais ao número de genes que estão sendo considerados e, em seguida, segregamos os alelos em cada linha em linhas bifurcadas de acordo com as probabilidades de cruzamentos mono-híbridos individuais (Figura 12.17). Em seguida, multiplicamos os valores ao longo de cada caminho bifurcado para obter o F2 probabilidades de descendência. Observe que este processo é uma versão diagramática da regra do produto. Os valores ao longo de cada via bifurcada podem ser multiplicados porque cada gene se agrupa independentemente. Para um cruzamento tri-híbrido, o F2 a razão fenotípica é 27: 9: 9: 9: 3: 3: 3: 1.

Método de Probabilidade

Enquanto o método da linha bifurcada é uma abordagem diagramática para manter o controle das probabilidades em um cruzamento, o método da probabilidade dá as proporções de descendência que se espera que exibam cada fenótipo (ou genótipo) sem a ajuda visual adicional. Ambos os métodos usam a regra do produto e consideram os alelos para cada gene separadamente. Anteriormente, examinamos as proporções fenotípicas de um cruzamento tri-híbrido usando o método da linha bifurcada. Agora, usaremos o método de probabilidade para examinar as proporções genotípicas de um cruzamento com ainda mais genes.

Para uma cruz tri-híbrida, escrever o método da linha bifurcada é tedioso, embora não tão tedioso quanto usar o método do quadrado de Punnett. Para demonstrar totalmente o poder do método de probabilidade, no entanto, podemos considerar cálculos genéticos específicos. Por exemplo, para um cruzamento tetrahíbrido entre indivíduos que são heterozigotos para todos os quatro genes, e no qual todos os quatro genes são classificados de forma independente e em um padrão dominante e recessivo, qual proporção da prole será considerada homozigótica recessiva para todos os quatro alelos ? Em vez de escrever todos os genótipos possíveis, podemos usar o método da probabilidade. Sabemos que para cada gene, a fração de descendência homozigótica recessiva será de 1/4. Portanto, multiplicando esta fração para cada um dos quatro genes, (1/4) × (1/4) × (1/4) × (1/4), determinamos que 1/256 da prole será quadruplicadamente homozigoto recessivo .

Para o mesmo cruzamento tetrahíbrido, qual é a proporção esperada de descendentes que têm o fenótipo dominante em todos os quatro loci? Podemos responder a essa pergunta usando proporções fenotípicas, mas vamos fazer da maneira mais difícil - usando proporções genotípicas. A questão pergunta sobre a proporção de descendentes que são 1) homozigotos dominantes em UMA ou heterozigoto em UMA, e 2) homozigoto em B ou heterozigoto em B, e assim por diante. Observar o “ou” e “e” em cada circunstância deixa claro onde aplicar as regras de soma e produto. A probabilidade de um homozigoto dominante em UMA é 1/4 e a probabilidade de um heterozigoto em UMA é 1/2. A probabilidade do homozigoto ou heterozigoto é 1/4 + 1/2 = 3/4 usando a regra da soma. A mesma probabilidade pode ser obtida da mesma forma para cada um dos outros genes, de modo que a probabilidade de um fenótipo dominante em UMA e B e C e D é, usando a regra do produto, igual a 3/4 × 3/4 × 3/4 × 3/4 ou 27/64. Se você não tiver certeza sobre como combinar probabilidades, retornar ao método da linha bifurcada deve deixar isso claro.

Regras para fertilização multihíbrida

Prever os genótipos e fenótipos de descendentes de determinados cruzamentos é a melhor maneira de testar seu conhecimento da genética mendeliana. Dado um cruzamento multihíbrido que obedece a uma classificação independente e segue um padrão dominante e recessivo, existem várias regras generalizadas que você pode usar para verificar seus resultados enquanto trabalha com os cálculos genéticos (Tabela 12.5). Para aplicar essas regras, primeiro você deve determinar n, o número de pares de genes heterozigotos (o número de genes que segregam dois alelos cada). Por exemplo, um cruzamento entre AaBb e AaBb heterozigotos tem um n de 2. Em contraste, um cruzamento entre AABb e AABb tem um n de 1 porque UMA não é heterozigoto.

Regras gerais para cruzamentos multihíbridos
Regra geralNúmero de pares de genes heterozigotos
Número de diferentes F1 gametas 2 n
Número de diferentes F2 genótipos 3 n
Dada a herança dominante e recessiva, o número de diferentes F2 fenótipos 2 n

Os genes vinculados violam a lei do sortimento independente

Embora todas as características da ervilha de Mendel tenham se comportado de acordo com a lei do sortimento independente, agora sabemos que algumas combinações de alelos não são herdadas independentemente umas das outras. Os genes localizados em cromossomos não homólogos separados sempre serão classificados independentemente. No entanto, cada cromossomo contém centenas ou milhares de genes, organizados linearmente em cromossomos como contas em um fio. A segregação de alelos em gametas pode ser influenciada pela ligação, na qual os genes que estão localizados fisicamente próximos uns dos outros no mesmo cromossomo têm maior probabilidade de serem herdados como um par. No entanto, por causa do processo de recombinação, ou “crossover”, é possível que dois genes no mesmo cromossomo se comportem de forma independente ou como se não estivessem ligados. Para entender isso, vamos considerar a base biológica da ligação e recombinação gênica.

Os cromossomos homólogos possuem os mesmos genes na mesma ordem linear. Os alelos podem diferir em pares de cromossomos homólogos, mas os genes aos quais eles correspondem não. Em preparação para a primeira divisão da meiose, os cromossomos homólogos se replicam e fazem sinapses. Genes semelhantes nos homólogos se alinham uns com os outros. Nesse estágio, segmentos de cromossomos homólogos trocam segmentos lineares de material genético (Figura 12.18). Esse processo é chamado de recombinação, ou cruzamento, e é um processo genético comum. Como os genes estão alinhados durante a recombinação, a ordem dos genes não é alterada. Em vez disso, o resultado da recombinação é que os alelos maternos e paternos são combinados no mesmo cromossomo. Em um determinado cromossomo, vários eventos de recombinação podem ocorrer, causando um grande embaralhamento de alelos.

Quando dois genes estão localizados em estreita proximidade no mesmo cromossomo, eles são considerados ligados e seus alelos tendem a ser transmitidos através da meiose juntos. Para exemplificar isso, imagine um cruzamento di-híbrido envolvendo a cor da flor e a altura da planta em que os genes estão próximos uns dos outros no cromossomo. Se um cromossomo homólogo tem alelos para plantas altas e flores vermelhas, e o outro cromossomo tem genes para plantas baixas e flores amarelas, então quando os gametas são formados, os alelos altos e vermelhos irão juntos em um gameta e os alelos curto e amarelo irá para outros gametas. Eles são chamados de genótipos parentais porque foram herdados intactos dos pais dos gametas produtores individuais. Mas, ao contrário de se os genes estivessem em cromossomos diferentes, não haverá gametas com alelos altos e amarelos e nem gametas com alelos curtos e vermelhos. Se você criar o quadrado de Punnett com esses gametas, verá que a previsão mendeliana clássica de um resultado 9: 3: 3: 1 de um cruzamento di-híbrido não se aplica. À medida que a distância entre dois genes aumenta, a probabilidade de um ou mais cruzamentos entre eles aumenta e os genes se comportam mais como se estivessem em cromossomos separados. Os geneticistas usaram a proporção de gametas recombinantes (os que não são como os pais) como uma medida de quão distantes os genes estão em um cromossomo. Usando essas informações, eles construíram mapas elaborados de genes em cromossomos para organismos bem estudados, incluindo humanos.

A publicação seminal de Mendel não faz menção ao vínculo, e muitos pesquisadores questionaram se ele encontrou vínculo, mas optou por não publicar esses cruzamentos por preocupação de que invalidassem seu postulado de sortimento independente. A ervilha tem sete cromossomos, e alguns sugeriram que sua escolha de sete características não foi uma coincidência. No entanto, mesmo que os genes que ele examinou não estivessem localizados em cromossomos separados, é possível que ele simplesmente não tenha observado a ligação por causa dos extensos efeitos de embaralhamento da recombinação.

CONEXÃO DE MÉTODO CIENTÍFICO

Testando a hipótese de sortimento independente

Para avaliar melhor a quantidade de trabalho e engenhosidade que foi usada nos experimentos de Mendel, faça um dos cruzamentos di-híbridos de Mendel.

Pergunta: Qual será a descendência de um cruzamento di-híbrido?

Fundo: Considere que as plantas de ervilha amadurecem em uma estação de cultivo e você tem acesso a um grande jardim no qual pode cultivar milhares de plantas de ervilha. Existem várias plantas reprodutoras verdadeiras com os seguintes pares de características: plantas altas com vagens infladas e plantas anãs com vagens contraídas. Antes que as plantas amadureçam, você remove os órgãos produtores de pólen das plantas altas / infladas em seus cruzamentos para evitar a autofecundação. Após a maturação da planta, as plantas são cruzadas manualmente pela transferência de pólen das plantas anãs / contraídas para os estigmas das plantas altas / infladas.

Hipótese: Ambos os pares de características serão classificados independentemente de acordo com as leis de Mendel. Quando os pais verdadeiros são cruzados, todos os F1 a prole é alta e tem vagens infladas, o que indica que as características alto e inflado são dominantes sobre as características anãs e contraídas, respectivamente. Uma auto-cruzada do F1 heterozigotos resulta em 2.000 F2 progênie.

Teste a hipótese: Como cada par de características é classificado de forma independente, espera-se que as proporções de alto: anão e inflado: contraído sejam de 3: 1. O par de características alto / anão é chamado T / t, e o par de características inflado / restrito é designado Eu / eu. Cada membro do F1 geração, portanto, tem um genótipo de TtIi. Construa uma grade análoga à Figura 12.16, na qual você cruza dois TtIiindivíduos. Cada indivíduo pode doar quatro combinações de duas características: TI, Ti, tI, ou ti, o que significa que há 16 possibilidades de genótipos descendentes. Porque o T e eu alelos são dominantes, qualquer indivíduo com um ou dois desses alelos expressará os fenótipos altos ou inflados, respectivamente, independentemente de também terem um t ou eu alelo. Apenas indivíduos que são tt ou ii irá expressar os alelos anão e constrito, respectivamente. Conforme mostrado na Figura 12.19, você prevê que observará as seguintes proporções de descendência: alto / inflado: alto / contraído: anão / inflado: anão / contraído em uma proporção de 9: 3: 3: 1. Observe na grade que, ao considerar os pares de características alto / anão e inflado / contraído isoladamente, cada um deles é herdado em proporções de 3: 1.

Teste a hipótese: Você cruza as plantas anãs e altas e, em seguida, auto-cruza a prole. Para obter melhores resultados, isso é repetido com centenas ou mesmo milhares de pés de ervilha. Que cuidados especiais devem ser tomados nos cruzamentos e no cultivo das plantas?

Analise seus dados: Você observa os seguintes fenótipos de plantas no F2 geração: 2.706 de altura / inflado, 930 de altura / contraído, 888 anão / inflado e 300 anão / contraído. Reduza esses resultados a uma proporção e determine se eles são consistentes com as leis de Mendel.

Faça uma conclusão: Os resultados foram próximos da proporção fenotípica esperada de 9: 3: 3: 1? Os resultados apóiam a previsão? O que poderia ser observado se muito menos plantas fossem usadas, visto que os alelos segregam aleatoriamente em gametas? Tente imaginar o cultivo de tantas plantas de ervilha e considere o potencial de erro experimental. Por exemplo, o que aconteceria se um dia ventasse muito?

CONEXÃO DE PRÁTICAS CIENTÍFICAS PARA CURSOS AP®

PENSE NISSO

Na planta bolsa-pastor (Capsella bursa-pastoris), a forma da semente é controlada por dois genes, UMA e B. Quando ambos UMA e B loci são homozigotos recessivos (aabb), as sementes são ovóides. No entanto, se o alelo dominante para um ou ambos os genes estiver presente, as sementes serão triangulares. Com base nessas informações, quais são as razões fenotípicas esperadas para um cruzamento entre plantas heterozigotas para ambas as características?

Qual é a proporção esperada de fenótipos de um cruzamento di-híbrido? Como você explica a diferença entre a proporção cruzada di-híbrida esperada e a proporção observada na planta bolsa-pastor?

Epistasia

Os estudos de Mendel em ervilhas implicavam que a soma do fenótipo de um indivíduo era controlada por genes (ou como ele os chamava, fatores unitários), de modo que cada característica era distinta e completamente controlada por um único gene. Na verdade, características únicas observáveis ​​estão quase sempre sob a influência de vários genes (cada um com dois ou mais alelos) agindo em uníssono. Por exemplo, pelo menos oito genes contribuem para a cor dos olhos em humanos.

LINK PARA APRENDIZAGEM

A cor dos olhos em humanos é determinada por vários genes. Use a Calculadora da Cor dos Olhos para prever a cor dos olhos das crianças a partir da cor dos olhos dos pais.

  1. Ambos os pais são homozigotos para o traço dominante de olhos castanhos.
  2. Ambos os pais são heterozigotos, tendo o traço verde no gene do olho verde-azul.
  3. Ambos os pais são heterozigotos com o traço recessivo de olhos castanhos.
  4. Ambos os pais são homozigotos com o traço verde no gene do olho verde-azul.

Em alguns casos, vários genes podem contribuir para aspectos de um fenótipo comum sem que seus produtos gênicos jamais interajam diretamente. No caso do desenvolvimento de órgãos, por exemplo, os genes podem ser expressos sequencialmente, com cada gene aumentando a complexidade e especificidade do órgão. Os genes podem funcionar de forma complementar ou sinérgica, de modo que dois ou mais genes precisam ser expressos simultaneamente para afetar um fenótipo. Os genes também podem se opor, com um gene modificando a expressão de outro.

Na epistasia, a interação entre os genes é antagônica, de modo que um gene mascara ou interfere na expressão de outro. “Epistasia” é uma palavra composta de raízes gregas que significam “pisar em cima”. Os alelos que estão sendo mascarados ou silenciados são considerados hipostáticos aos alelos epistáticos que estão mascarando. Freqüentemente, a base bioquímica da epistasia é uma via gênica na qual a expressão de um gene depende da função de um gene que o precede ou segue na via.

Um exemplo de epistasia é a pigmentação em camundongos. A cor da pelagem de tipo selvagem, agouti (AA), é dominante para a pele de cor sólida (aa) No entanto, um gene separado (C) é necessário para a produção de pigmentos. Um mouse com um recessivo c alelo neste locus é incapaz de produzir pigmento e é albino, independentemente do alelo presente no locus UMA (Figura 12.20). Portanto, os genótipos AAcc, Aacc, e aacc todos produzem o mesmo fenótipo albino. Um cruzamento entre heterozigotos para ambos os genes (AaCc x AaCc) geraria descendentes com uma proporção fenotípica de 9 agouti: 3 cor sólida: 4 albino (Figura 12.20). Neste caso, o C gene é epistático para o UMA gene.

A epistasia também pode ocorrer quando um alelo dominante mascara a expressão em um gene separado. A cor da fruta na abóbora é expressa desta forma. Expressão homozigótica recessiva do C gene (ww), juntamente com a expressão homozigótica dominante ou heterozigótica do Y gene (AA ou Yy) gera frutos amarelos, e o wwyy genótipo produz frutos verdes. No entanto, se uma cópia dominante do C gene está presente na forma homozigótica ou heterozigótica, a abóbora irá produzir frutas brancas, independentemente do Y alelos. Um cruzamento entre heterozigotos brancos para ambos os genes (WwYy × WwYy) produziria descendentes com uma proporção fenotípica de 12 brancos: 3 amarelos: 1 verdes.

Finalmente, a epistasia pode ser recíproca de forma que qualquer um dos genes, quando presente na forma dominante (ou recessiva), expressa o mesmo fenótipo. Na planta bolsa do pastor (Capsella bursa-pastoris), a característica da forma da semente é controlada por dois genes em uma relação epistática dominante. Quando os genes UMA e B são ambos homozigotos recessivos (aabb), as sementes são ovóides. Se o alelo dominante para qualquer um desses genes estiver presente, o resultado são sementes triangulares. Ou seja, todos os genótipos possíveis, exceto aabb resulta em sementes triangulares e um cruzamento entre heterozigotos para ambos os genes (AaBb x AaBb) produziria descendentes com uma proporção fenotípica de 15 triangular: 1 ovoide.

Ao trabalhar com os problemas genéticos, lembre-se de que qualquer característica única que resulte em uma proporção fenotípica de 16 é típica de uma interação de dois genes. Lembre-se do padrão de herança fenotípica para o cruzamento di-híbrido de Mendel, que considerou dois genes não interagentes - 9: 3: 3: 1. Da mesma forma, esperaríamos que os pares de genes interagindo também exibissem proporções expressas como 16 partes. Observe que estamos assumindo que os genes interagentes não estão ligados, eles ainda estão se organizando independentemente em gametas.

LINK PARA APRENDIZAGEM

Para uma excelente revisão dos experimentos de Mendel e para realizar seus próprios cruzamentos e identificar padrões de herança, visite o laboratório web Mendel’s Peas.


Discussão

Estamos descobrindo grandes quantidades de variação nos genes 45S rRNA em todos os níveis. No nível bruto do número total de cópias, a variação no número de cópias do gene 45S rRNA é amplamente responsável por uma variação de mais de 10% no tamanho do genoma entre A. thaliana acessos [35] e o tamanho relativo dos dois grupos de rDNA varia muito entre os acessos [36]. No nível da sequência, há variação nas próprias subunidades catalíticas conservadas dentro e entre os acessos. Além disso, essas variantes do gene de rRNA expressam prontamente e formam um conjunto de rRNA heterogêneo na célula, cujo significado funcional é completamente desconhecido. A heterogeneidade do ribossomo tem sido estudada principalmente no contexto da regulação das proteínas ribossômicas, a diversidade e atividade de outros fatores associados ao ribossomo e, embora não totalmente compreendido, as modificações que as subunidades de rRNA sofrem após a transcrição [56, 57]. Em eucariotos, tem havido poucas tentativas de estudar a heterogeneidade no nível de sequência das subunidades de rRNA: no parasita Plasmodium dois rRNAs 18S estruturalmente distintos são expressos diferencialmente durante seu ciclo de vida [58, 59] em humanos, os rRNAs 28S mostraram ser heterogêneos em ambas as frações monossomáticas [26, 60] de forma semelhante, em ambos os ouriços-do-mar Paracentrotus lividus [61] e A. thaliana várias variantes transcritas de rRNA 5S são prontamente incorporadas em ribossomos funcionais [62]. Nosso estudo fornece o catálogo mais abrangente de variantes do gene rRNA até o momento e, esperançosamente, será útil para investigar seu possível papel adaptativo, seja no nível de regulação da transcrição, estabilidade do rRNA ou eficiência translacional.

Independentemente de seu significado funcional, essas variantes, embora raramente homogeneizadas em todo um agrupamento de rDNA, podem ser usadas como marcadores da expressão de um agrupamento de rDNA particular. Nossos resultados deixam claro que o fenômeno de silenciamento conhecido como dominância nucleolar ocorre tanto dentro de [32] quanto entre as linhas naturais de A. thaliana [51]. Além disso, demonstramos que a dominância não é uma propriedade nem da cepa parental nem da posição cromossômica (ou seja, cromossomo 2 versus 4), mas sim do conteúdo "alélico" específico de cada agrupamento de genes de rRNA - incluindo, talvez, o DNA de flanco. De fato, um estudo recente implica sequências centrômero-proximais nesta regulação [63].

No entanto, a base molecular das interações epistáticas e alélicas entre os agrupamentos de rDNA permanece desconhecida. Curiosamente, os rDNAs derivados de diferentes espécies do gênero Brassica seguem uma relação de dominância hierárquica [13] semelhante àquela entre os muitos alelos no locus de auto-incompatibilidade (S-locus) em Brassicaceae [64]. No Arabidopsis halleri, domínio no S-locus é amplamente controlado por um conjunto de pequenos RNAs não codificantes produzidos por dominantes S-alelos que visam um repertório de mais recessivo S-alelos resultando em seu silenciamento epigenético [65, 66]. Uma vez que o silenciamento do gene rRNA uniparental envolve proteínas da via de metilação do DNA (RdDM) direcionadas por RNAs de interferência curtos (siRNAs) na planta híbrida Arabidopsis suecica [67, 68] e há evidências de que RNAs não codificantes podem agir em trans para silenciar outras repetições de genes de rRNAs em camundongos [69-71], é tentador especular que um mecanismo semelhante ao descrito para o S-locus pode explicar como os clusters de rDNA “conversam” uns com os outros. Surpreendentemente, em A. thaliana Mutantes da via Col-0 RdDM RNA polimerase IV (nrpd1), Dicer-like-3 (dcl2 / 3/4), e metiltransferases de DNA DRM1 e 2 (drm1 / 2) têm, se houver, um efeito insignificante em interromper o silenciamento de rDNA-2 (arquivo adicional 5: Figura S5 [11]). Em contraste, a metiltransferase de manutenção do DNA MET1 (o ortólogo do mamífero DNMT1), que é responsável pela metilação da citosina no contexto do CG, independentemente dos siRNAs, é necessária para silenciar o rDNA-2 [11]. No entanto, esses resultados não excluem necessariamente o envolvimento da via RdDM no silenciamento de clusters de rDNA em A. thaliana. No A. suecica, por exemplo, o restabelecimento da dominância nucleolar foi observado na progênie T2 de uma das três RNA polimerase dependente de RNA RDR2Linhas -RNAi [67]. Como parece ser o caso para elementos transponíveis, o estabelecimento do silenciamento pode muito bem ser distinto de sua manutenção e muitos mecanismos semi-redundantes podem estar envolvidos [72].


Atividades adicionais que você pode desejar incorporar nesta simulação

Análise de dados de classe

  • Você pode usar a tabela mostrada abaixo para coletar informações sobre o fenótipo de todos os bebês dragões produzidos pelos pares de alunos em uma classe e, em seguida, usar esses dados para uma discussão em classe de questões como:
  • É observado algum traço fenotípico em todos os bebês dessa mãe e pai? Em caso afirmativo, qual é a explicação genética para isso? (Para responder a esta última pergunta, os alunos podem querer usar quadrados de Punnett para descobrir possíveis genótipos e fenótipos dos bebês dragões.)
  • Existem dois bebês dragões produzidos por esses dragões parentais fenotipicamente idênticos? (Para a discussão desta questão, você pode querer calcular o grande número de combinações possíveis de características fenotípicas (mais de 500), e você pode querer relacionar os resultados da simulação às diferenças fenotípicas entre irmãos humanos.)
  • Os bebês dragões do sexo masculino são mais propensos a não ter chifres, conforme previsto (ver pergunta 6 na Folha de Apoio do Aluno)?

Comparação com Herança Humana

Você pode querer que os alunos identifiquem exemplos de características em humanos que têm o mesmo padrão de herança que características específicas nesta simulação.


Resultados

Epistasia poligênica coordenada.

Ao longo do artigo, assumimos um modelo poligênico de epistasia par a par: yi = ∑ j = 1 MG ij β j + ∑ j ≤ j 'G ij G ij' Ω jj '+ ε i, [1] onde yi é o fenótipo para o indivíduo i, e G ij é o genótipo para o indivíduo i no marcador j, e ε é o erro residual e é assumido como independente e distribuído de forma idêntica (iid) Gaussiano. O vetor β contém os efeitos poligênicos marginais. Ω jj 'é o efeito de interação de pares de SNPs j diferente de j', então Ω é a matriz de todos os efeitos de epistasia de SNP de pares no genoma.

O modelo aditivo padrão não assume epistasia, ou seja, Ω = 0. Nesse modelo, o SNP j sempre tem o mesmo efeito β j no fenótipo, independentemente da origem genética ou do ambiente. No cenário poligênico, onde há muito mais SNPs do que indivíduos (M & gt N), a herdabilidade total ainda pode ser estimada de forma confiável pelo modelo de efeito aleatório de máxima verossimilhança restrita baseada em genoma (GREML), que modela βj como i.i.d. Gaussiano (40).

Os modelos epistáticos vão além, permitindo Ω diferente de zero. Até o momento, os testes epistáticos têm se concentrado em SNPs candidatos ou em telas de todo o genoma para pares de SNP, que reduzem M & lt N e facilitam modelos de efeito fixo simples (21). Mais recentemente, modelos de efeito aleatório semelhantes ao GREML tornaram-se populares para estimar o tamanho total de Ω (ou seja, a herdabilidade de epistasia par a par) (25 ⇓ ⇓ -28). Outra abordagem recente testa a interação entre um único SNP e uma matriz de parentesco de todo o genoma, um compromisso útil que fornece resolução em nível de SNP e também agrega sinal de todo o genoma (22).

Embora esses métodos sejam úteis para caracterizar a existência e o impacto da epistasia, todos são limitados pela suposição de que β e Ω são independentes. Estamos interessados ​​em uma questão ortogonal: quando β e Ω estão profundamente entrelaçados por vias de interação latentes? Conceitualmente, β e Ω codificam todas as informações relevantes, então o objetivo é decodificar a presença de vias de interação a partir desses parâmetros. Concretamente, provamos que essas vias existem se, e somente se, o CE γ for diferente de zero, onde γ é definido como: γ = Cov j & lt j 'β j β j', Ω jj '. [2] Intuitivamente, γ & lt0 inclina negativamente o efeito poligênico total em relação à aditividade. Isso equivale a atenuar os efeitos fenotípicos marginais positivos no agregado, ou seja, o antagonismo entre os efeitos principais positivos. Por outro lado, γ & gt0 inclina positivamente a população, aumentando a probabilidade de fenótipos extremamente altos. Observe que γ = 0 não implica que a epistasia esteja ausente, em vez disso, implica que os efeitos da epistasia não necessariamente se alinham sistematicamente com os efeitos principais, como foi implicitamente assumido por modelos poligênicos anteriores de epistasia (25 ⇓ ⇓ –28).

Como um exemplo estilístico, imagine que existem duas vias geneticamente independentes que são suficientes para T2D, uma baseada no índice de massa corporal (IMC) e outra baseada na função do pâncreas. Então, γ & lt0 é esperado, porque os casos de IMC alto provavelmente não apresentam risco de pâncreas alto, o que é raro. Por outro lado, se uma doença requer alto risco em sistemas distintos, então γ & gt0 é esperado. Como outro exemplo estilístico, se a asma requer componentes imunológicos e exposições ao tabaco, então o impacto de um SNP de risco de fumar na asma é maior na presença de fatores de risco imunológico.

Oferecemos uma exploração mais rigorosa da coordenação em Apêndice SI. Em particular, provamos que vários modelos de epistasia biologicamente plausíveis induzem CE, incluindo um modelo de regulação genética trans (32) (Apêndice SI, seção 4.1), uma generalização poligênica de tampões moleculares (16) (Apêndice SI, seção 4.2), e interação gene-ambiente com ambiente hereditário (41) (Apêndice SI, seção 4.3 e Fig. S1). Também mostramos que a coordenação dentro da via contribui para CE e pode causar γ ≠ 0 (Apêndice SI, Exemplo 3 e Fig. S2). Também estudamos CE como uma função do número de vias latentes em particular, γ = 0 resulta no limite de muitas vias matematicamente natural, portanto, CE normalmente indica a existência de um conjunto parcimonioso de vias de interação (Apêndice SI, Exemplo 4).

O Estimador EO para CE.

Definimos nosso alvo, o CE γ, em função dos verdadeiros efeitos genéticos β e Ω. No entanto, esses parâmetros não são ainda piores, são altamente dimensionais e não podem ser estimados com precisão. No entanto, desenvolvemos um método simples e poderoso para testar γ diferente de zero.

A ideia principal do teste EO é que os caminhos definidos aleatoriamente podem atuar como proxies para os verdadeiros caminhos. Essas vias aleatórias terão uma interação significativa se, e somente se, realmente houver vias latentes que interagem. Intuitivamente, essa abordagem aleatória tem poder para detectar sinais verdadeiros porque muitos pares SNP interagentes são atribuídos apropriadamente na partição aleatória - a probabilidade de atribuir incorretamente todos os pares interagentes é insignificante. Além disso, o teste EO é calibrado porque os pares SNP atribuídos incorretamente não interagem e, portanto, não causam polarização. Em outras palavras, pares SNP atribuídos corretamente existirão e serão suficientes para conduzir as interações entre os caminhos de proxy pares e ímpares. Embora os SNPs atribuídos incorretamente causem perda de energia e polarização para baixo para | γ | , esse viés pode ser corrigido post hoc se assumirmos um modelo epistático infinitesimal (Apêndice SI, Proposição 1). Nesse caso, exatamente metade de todos os pares de SNPs interagindo serão capturados pela partição SNP aleatória, o que nos permite estimar perfeitamente a contribuição agregada de SNPs cujas interações em pares não são capturadas pela partição EO. Matematicamente, esses fatos estão relacionados a outras abordagens aleatórias para estimativa de alta dimensão, incluindo GREML, álgebra linear aleatória e sensoriamento comprimido (42 ⇓ ⇓ ⇓ –46).

Propomos estimar γ regredindo na interação entre PRS construído especificamente a partir de cromossomos indexados pares e ímpares (PRS e e PRS o, respectivamente): y ∼ α o PRS o + α e PRS e + γ e PRS o * PRS e. [3] A estimativa de mínimos quadrados ordinários γ ^ e o é o estimador EO da coordenação γ. Provamos que γ e o = 0 se, e somente se, γ = 0 assumindo o modelo da Eq. 1 e que existem muitos SNPs causais (Apêndice SI, seção 3). Portanto, podemos simplesmente usar um teste de regressão para γ ^ e o para testar a existência de CE. Além disso, provamos que a estimativa EO é imparcial e consistente quando SNPs causais estão em equilíbrio de ligação (Apêndice SI, Proposição 1). Todos os detalhes, suposições e garantias do teste EO são fornecidos em Apêndice SI.

Nossa escolha de cromossomos pares e ímpares é claramente arbitrária. Crucialmente, provamos que qualquer partição de cromossomos em dois grupos sem desequilíbrio de ligação (LD) dá resultados idênticos em um modelo perfeitamente infinitesimal (Apêndice SI, seção 3.2). Portanto, para concretude, simplicidade e para enfatizar a arbitrariedade e flexibilidade do teste EO, escolhemos defini-lo pelo caso em que um PRS é construído especificamente a partir de SNPs em cromossomos pares e o outro é construído especificamente a partir de SNPs em cromossomos ímpares .

Com genomas finitos, no entanto, os resultados podem depender muito da escolha precisa dos cromossomos usados ​​para construir PRS o e PRS e. No entanto, é importante que os SNPs sejam independentes nas divisões para evitar falsos positivos de efeitos de variante única não lineares, ou seja, variantes dominantes ou recessivas. Portanto, sempre avaliamos as partições do genoma no nível do cromossomo. Isso é análogo à nossa escolha de excluir os termos Ω jj de CE em ambos os casos, CE implica efeitos não lineares de cada SNP individual e do PRS agregado, mas o inverso não é verdadeiro. Na prática, usamos uma forma mais flexível para o teste EO, em que ajustamos e testamos conjuntamente as interações entre todos os (22 escolhem 2) PRS específicos do cromossomo, o que simultaneamente elimina as preocupações com LD e a arbitrariedade da atribuição de cromossomos com base em seus índices canônicos . No entanto, nosso método não assume que as verdadeiras vias causais estão localizadas em regiões genômicas contíguas ou independentes; esta é uma condição em nossa partição escolhida do genoma que é usado no teste EO. Em particular, tanto CE quanto EO permanecem válidos quando SNPs causais para cada via são distribuídos ao longo do genoma aleatoriamente, e / ou quando SNPs contribuem para múltiplas vias (Apêndice SI, seção 3.3).

O teste EO pode distinguir CE de estrutura populacional e epistasia descoordenada.

Para examinar as propriedades do teste EO, simulamos dados sob três arquiteturas genéticas biologicamente plausíveis: aditividade, epistasia isotrópica (ou seja, descoordenada) e CE. Para cada arquitetura, também testamos o impacto da estrutura da população, acasalamento sortido e ajuste com os componentes principais (ver Materiais e métodos)Em cada caso, realizamos um GWAS e, em seguida, construímos PRS comum, bem como PRS, com base apenas em variantes de cromossomos ímpares e pares (PRS o e PRS e, respectivamente). Em seguida, testamos o PRS em um segundo conjunto de dados.

Primeiro testamos a correlação entre PRS o e PRS e, chamada θ e o, que está relacionada a um método existente de acasalamento seletivo (47). Descobrimos que o teste para θ e o ≠ 0 indicou de forma confiável a presença de acasalamento seletivo ou estrutura populacional não corrigida. Observe que, após o ajuste para PCs, o teste para θ e o ≠ 0 foi praticamente nulo na presença de estrutura populacional (Tabela 1).

Simulações poligênicas sob aditividade, epistasia isotrópica ou CE assumindo acasalamento aleatório, estrutura populacional ou acasalamento seletivo

No entanto, nosso foco principal está no teste EO para γ e o ≠ 0. Descobrimos que o teste EO foi calibrado em ambos os modelos de interação aditivo e isotrópico, como esperado, com taxas de falso-positivo perto de 0,05 a um valor nominal P & lt limite de 0,05. Em particular, esta é uma demonstração clara de um cenário onde existe uma epistasia par-a-par significativa e ainda assim não existe CE, traçando assim uma distinção clara entre CE e o conceito mais geral de epistasia. Além disso, o teste EO tem poder de aproximadamente 95% no modelo CE (Tabela 1).

Não observamos falsos positivos substanciais no teste EO sob acasalamento seletivo. No entanto, observamos altas taxas de falso-positivo para o teste EO sob estrutura populacional não corrigida (0,95), embora após a correção para PCs, o teste seja calibrado com uma taxa empírica de falso-positivo próximo a 0,05 (Tabela 1). Na prática, recomendamos o ajuste para proxies de estrutura populacional ao executar o teste EO, como é padrão na genética humana.

Em seguida, procuramos traçar um perfil mais abrangente do comportamento do teste EO em uma gama de parâmetros de simulação. Primeiro, variamos o tamanho da amostra, n (Apêndice SI, Fig. S3UMA) Como esperado, a potência nominal P & lt 0,05 cresceu com o tamanho da amostra, de cerca de 5% em n = 1.000, até cerca de 95% em n = 10.000 (nossa linha de base), e alcançando quase 100% em n = 20.000. Em seguida, variamos a herdabilidade aditiva, que afeta o poder de teste EO porque governa a precisão das estimativas PRS (Apêndice SI, Fig. S3B) Como esperado, o poder aumentou com a herdabilidade, crescendo de 35% em h 2 = 0,1 a quase 100% em h 2 = 0,7 (nossa linha de base é h 2 = 0,5). Finalmente, variamos a força do parâmetro CE, γ. Como esperado, o poder cresceu com | γ | , atingindo 100% quando dobramos o parâmetro em relação à nossa linha de base (Apêndice SI, Fig. S3C) Além disso, quando γ = 0, recuperamos testes calibrados com cerca de 5% de taxa de falso-positivo. Curiosamente, nossas simulações tiveram poder semelhante independentemente do sinal de γ, como esperado porque o sinal do fenótipo é arbitrário nessas simulações.

Uma característica essencial do teste EO é que ele é imparcial, mesmo quando a partição par / ímpar de SNPs é escolhida aleatoriamente em relação à partição de SNPs nas vias de interação causais (nas condições estabelecidas acima). No entanto, o poder de detectar CE aumenta quando a partição par / ímpar se alinha mais de perto com a partição causal, demonstramos isso em nossas simulações, combinando diretamente as duas partições (ver Materiais e métodos) Como esperado, o poder do teste EO aumenta de 95 para 100% quando usamos essa partição SNP mais precisa (Tabela 1).

Nossas simulações acima usaram frequências de alelos menores (MAFs) desenhadas i.i.d. de uma distribuição uniforme (0,01,0,5). Para avaliar um espectro MAF mais realista, repetimos nossas simulações de linha de base usando MAFs sorteados aleatoriamente do espectro MAF que observamos no UKBB, excluindo variantes raras com MAF & lt 0,01 para simplificar. No entanto, os resultados da simulação foram quase idênticos (Apêndice SI, Tabela S1).

Finalmente, avaliamos o teste EO sob epistasia de terceira ordem (Apêndice SI, Tabela S2). Primeiro, quando os triplos SNP interagentes foram distribuídos uniformemente ao acaso em todo o genoma, como no modelo isotrópico de epistasia pareada, o teste EO teve uma taxa positiva próxima a 0,05. Este é um comportamento apropriadamente calibrado no sentido informal de que não há relação entre os efeitos principais e os efeitos de epistasia e no sentido formal da definição de CE (Eq. 1, acima de). Em segundo lugar, simulamos um modelo de três vias em que o produto de todas as três vias, mas não de duas, teve um efeito no fenótipo. Neste cenário, os efeitos principais e de interação estão relacionados, mas a definição formal de CE ainda é 0. Na simulação, observamos uma potência próxima de 8% em P & lt 0,05 de significância. Isso é esperado em nossas simulações que usam genomas finitos para qualquer conjunto de dados simulado, as vias terão alguma média diferente de zero que induz a interação de pares, resultando em uma estimativa γ média que é zero, mas superdispersa (isso está relacionado a problemas semelhantes em GREML com números finitos de SNPs causais) (48). No geral, o teste EO é calibrado sob epistasia isotrópica de terceira ordem e tem algum sinal sob epistasia coordenada de ordem superior.

Teste para CE com o Teste EO no UKBB.

Em seguida, testamos para CE com o teste EO no UKBB (49). Nós estudamos 21 características quantitativas e 5 binárias (Apêndice SI, Tabela S3) escolhida para representar uma gama de classes de características, incluindo características antropométricas, de doença e sangue. Analisamos especificamente os indivíduos classificados como "Brancos britânicos" e filtramos os indivíduos relacionados para minimizar o viés da estrutura da população, mantendo grandes tamanhos de amostra (máx. n = 342.816). Calculamos PRS para cada cromossomo para cada amostra usando uma abordagem de limiar padrão (50) (ver Materiais e Métodos) O PRS total é então a soma do PRS dos cromossomos individuais. Avaliamos uma variedade de PRS P limites de valor e corrigidos para esta fonte de testes múltiplos usando um limite de taxa de descoberta falsa de Benjamini – Hochberg (FDR) de 10%. Usamos a validação cruzada de 10 vezes entre os indivíduos para minimizar o viés de sobreajuste na amostra.

Ao contrário dos modelos perfeitamente infinitesimais, em dados reais, o teste EO depende da partição específica dos cromossomos usados ​​para estimar γ. Para minimizar o viés da escolha de uma única divisão, por exemplo, par versus ímpar, na prática, testamos conjuntamente as interações em todos os pares distintos de PRS específico do cromossomo com um teste F (consulte Materiais e métodos) Seguindo a prática comum (51 ⇓ ⇓ ⇓ ⇓ -56), relatamos os resultados significativos por fenótipo.

Descobrimos 18 traços com CE significativo (Tabela 2), incluindo as doenças complexas asma, doença cardiovascular (DCV), eczema e DM2. Também detectamos CE para as características quantitativas complexas da taxa metabólica basal, densidade mineral óssea (DMO), função pulmonar (volume expiratório forçado [VEF] / capacidade vital forçada [CVF]) e altura, bem como nove características do sangue: glicose, lipoproteína de baixa densidade (LDL), largura de distribuição de plaquetas, volume plaquetário médio (MPV), largura de distribuição de glóbulos vermelhos, volume de células esféricas, triglicerídeos (TG) e contagens de monócitos, linfócitos e plaquetas (PLAT). Tomados em conjunto, esses resultados mostram que a CE contribui para a arquitetura genética de múltiplas características complexas.

Resultados do teste EO para 18 características com CE significativo no UKBB

Para avaliar o potencial de impacto pela estrutura populacional e acasalamento seletivo, calculamos a correlação entre cada par de PRS específico do cromossomo (θ e o). Em simulações, descobrimos que θ e o & gt 0 indica a presença de genótipos estruturados, o que pode ser devido ao acasalamento seletivo e / ou estratificação populacional não corrigida. Embora a correção para PCs tenha sido suficiente para inferência calibrada em simulações (Tabela 1), ainda assim estudamos a relação entre θ e o e γ e o como uma métrica para possível confusão do teste EO por estratificação. Essa cautela é motivada pelas complexidades da estrutura da população em conjuntos de dados massivos como o UKBB (57 ⇓ ⇓ -60). No entanto, não encontramos evidências de que a estratificação da população levou a nossa inferência de CE valores maiores de θ não se correlacionaram com os valores de γ ou seus correspondentes P ou log (P) valores (Apêndice SI, Fig. S4). No geral, mesmo com esses testes extras conservadores, não identificamos evidências de que nosso teste EO para CE foi substancialmente confundido por estrutura não corrigida ou combinação sortida.

Como avaliação final, repetimos nosso teste EO para 100 permutações aleatórias do PRS entre as amostras. O FDR de teste EO resultante era nulo, como esperado (Apêndice SI, Fig. S5). Além disso, usamos essas permutações para construir P valores para o teste EO mínimo em todos os limiares PRS como uma alternativa à correção de FDR. Isso dá resultados qualitativamente semelhantes aos da nossa análise primária baseada em FDR, embora os custos computacionais limitem o mínimo empírico atingível P valores (Apêndice SI, Fig. S6). Essas análises não descartam a possibilidade de confusão sutil, mas fornecem mais suporte para a calibração do teste EO na prática.

Replicando os resultados do teste EO com PRS externo.

Embora tenhamos validado nosso PRS, desejamos verificar adicionalmente se nossos resultados não são específicos para uma única população, superdimensionando fatores de confusão específicos do conjunto de dados (57, 58, 60). Investigamos isso construindo PRS usando estatísticas de resumo externas para remover o impacto potencial de artefatos específicos da coorte. Selecionamos oito características que têm grandes estatísticas de resumo externas de GWAS: asma, T2D, CVD, altura, IMC, TG, nível educacional e LDL. Além disso, construímos PRS para nove outras características sanguíneas que estavam disponíveis apenas para um paciente específico P-valor limite (ver Materiais e métodos e Apêndice SI, Tabela S3). Testamos a replicação para as 10 características desta lista com CE internamente significativo.

Aplicamos o teste EO conforme descrito acima e descobrimos que o CE replicou para LDL, PLAT e MPV (Tabela 2). Isso valida a CE no sentido de que nossos resultados não são específicos para as principais estimativas de tamanho do efeito derivadas do conjunto de dados UKBB. No entanto, a CE significativa não se replicou para várias características. Em termos gerais, o CE P os valores foram menos significativos usando PRS externo, provavelmente devido a uma combinação da maldição do vencedor e ao fato de que estudos externos geralmente analisam conjuntos de dados menores do que UKBB e não correspondem perfeitamente a UKBB em termos de meio ambiente e fundo genético.

Para fortalecer ainda mais a confiança no CE, realizamos uma análise de replicação alternativa comparando diretamente as estimativas de efeito de interação PRS interna e externa em todos os pares de cromossomos (Fig. 2). Este teste identificou replicação CE altamente significativa para 7/10 características testadas. Esse teste é mais poderoso do que simplesmente aplicar o teste EO ao PRS externo porque testa uma hipótese alternativa mais restrita. Especificamente, o teste EO pergunta se algum par de cromossomos interage, enquanto o teste de replicação direta pergunta se as estimativas do efeito de interação externa se correlacionam com suas contrapartes internas. Conceitualmente, isso está relacionado a testes unilaterais versus bilaterais, pois os primeiros adicionam poder quando o conhecimento prévio do sinal do estimado está disponível.

Replicação de CE em UKBB. Para cada um dos 10 fenótipos com CE internamente significativo e com PRS externo disponível, traçamos estimativas de interação interna (x-axis) contra estimativas externas (y-eixo) para cada par de cromossomos. Os cromossomos que não contribuem para um PRS específico são excluídos. Usamos o PRS P- limite de valor para cada PRS para minimizar seu CE P valor isso não causa inflação porque não estamos testando o tamanho dessas estimativas de interação, mas sim sua correlação. Este teste de replicação indireta é Bonferroni significativo para 7/10 características ao corrigir para o número de características testadas. Os tamanhos de efeito são exibidos após cada PRS específico do cromossomo ser centralizado e escalado, e o P os valores e as linhas vermelhas correspondem a regressões com interceptações restritas a 0.

Além de fortalecer a confiança na existência do CE, essas análises de replicação também sugerem que o CE pode ser testado de forma confiável usando PRS construído internamente no futuro. Isso pode ser essencial para aplicações em características, populações ou contextos ambientais subestimados (61 ⇓ ⇓ ⇓ –65).

Coordenação de tecidos específicos no UKBB.

Tendo demonstrado a existência de CE para várias características, consideramos agora a possibilidade de que as vias de interação sejam enriquecidas em tecidos relevantes para as características. Especificamente, testamos o enriquecimento específico de tecido de CE nas 26 características acima e 13 anotações genômicas específicas de tecido: 7 com base em genes expressos especificamente (adipócitos, células sanguíneas, cérebro, hipocampo, fígado, músculos e pâncreas) (66, 67) e 6 com base em padrões de marcadores de cromatina específicos de tecido (adiposo, cérebro, hipocampo, fígado, pâncreas e músculo esquelético) (68, 69) como usado na ref. 51

Para cada par de traços de tecido, o teste EO específico de tecido pergunta se a coordenação mediada por um tecido específico excede a média de todo o genoma. Este teste é conduzido criando primeiro um PRS específico de tecido para cada cromossomo (TPRS i) e testando-o para interação com o PRS padrão em outros cromossomos (PRS j, i ≠ j). Para focar nosso teste em efeitos verdadeiramente específicos de tecido, em vez de efeitos globais que por acaso são marcados por regiões específicas de tecido, ajustamos as interações PRS comuns em nível de cromossomo (PRS i ∗ PRS j), bem como os efeitos principais de PRS e TPRS de cada cromossomo. Nós usamos um P = 0,05 limiar com uma correção de Bonferroni conservadora para contabilizar os vários tecidos testados. Avaliamos apenas os fenótipos com CE comum significativo (Tabela 2).

Encontramos 53 casos de enriquecimento de CE específico de tecido usando PRS interno (Tabela 3 e Apêndice SI, Tabela S4). Isso inclui nove tecidos enriquecidos para LDL CE, vários dos quais são controles essencialmente positivos: o fígado é um regulador chave do metabolismo do LDL e os adipócitos e músculos são os sumidouros primários para os triglicerídeos transportados pelo LDL (70). Confirmando ainda mais esses resultados, o enriquecimento de CE de adipócitos replica quando usando LDL PRS externo.

CE específico de tecido no UKBB

Outro conjunto biologicamente plausível de pares de traços de tecido é para MPV, que também tinha o CE comum mais forte de qualquer traço. Em primeiro lugar, encontramos enriquecimento significativo para o fígado, consistente com seu papel conhecido como o principal produtor do principal regulador da produção de PLAT, a trombopoietina (TPO) (71). Em segundo lugar, encontramos enriquecimento significativo de CE para músculos, que também produzem modestamente TPO (71). Além disso, os PLATs são importantes na cura dos músculos. Terceiro, encontramos CE sugestivo com tecidos cerebrais - embora a biologia subjacente seja menos óbvia, há evidências de que o TPO afeta o desenvolvimento do cérebro (72). Além disso, estudos complementares recentes encontraram evidências de que o tecido cerebral desempenha um papel no VPM (73). Todos os três tecidos replicam para enriquecimento CE ao usar PRS externo.

Também encontramos CE específico de tecido para doenças complexas. Por exemplo, CVD tem enriquecimento de CE para cérebro, fígado, músculo e tecido adiposo e tem uma ligação clara com DCV, várias regiões do cérebro foram implicadas na base genética do IMC, um fator de risco de DCV (74, 75) e fígado, músculo e o tecido adiposo está profundamente envolvido na homeostase energética (76). Embora nenhum desses tecidos se replique, isso provavelmente reflete falta de energia, já que mesmo o CE comum não foi significativo em nenhum de nossos testes de replicação externos.

Para adicionar mais confiança no CE específico do tecido, testamos cinco permutações do TPRS entre as amostras. Observamos que o resultado P os valores eram apropriadamente nulos (Apêndice SI, Fig. S7).

Em geral, o teste de EO específico de tecido pode melhorar a força sobre o teste de EO comum quando o tecido correto é identificado, apesar do fato de que o TPRS quase necessariamente explica menos variação de traço do que o PRS geral. Isso é consistente com o resultado de nossa simulação em que o poder do teste EO aumentou sob a abordagem Oracle que particiona os SNPs nos caminhos verdadeiros, embora isso produza PRS com poder preditivo mais fraco. Por exemplo, o teste EO empírico P valor para o volume da célula esférica é 0,03 (Apêndice SI, Tabela S3), mas é P o valor para CE de células sanguíneas é 0,003; no entanto, o PRS geral explica 1,5% da variância da característica, enquanto o TPRS de células sanguíneas explica apenas 0,5%. Propriedades semelhantes podem ser observadas para muitos pares de traços de tecido plausíveis, por exemplo, no CE específico do fígado para glicose e triglicerídeos. Esta é mais uma evidência de que o CE é verdadeiramente enriquecido em tecidos específicos para algumas características e ilustra que o CE captura um eixo genético que é parcialmente distinto da variância aditiva.

Tissue-Pair CE em UKBB.

Em seguida, perguntamos se a CE pode ser detectada entre pares de tecidos com base na hipótese de que as vias podem ser específicas do tecido. Em vez de testar a interação entre PRS específico de tecidoeu e PRS globalj, agora testamos a interação entre PRS específico do tecido 1eu e PRS específico do tecido 2j. Para CE específico de tecido, ajustamos para as mesmas covariáveis ​​acima e agora ajustamos adicionalmente para PRS i ∗ TPRS j para ambos os TPRS testados e todos i ≠ j. Em particular, esses testes de interação tecido-tecido são estatisticamente independentes dos testes EO e dos testes específicos de tecido nas seções acima sob a hipótese nula de interação tecido-tecido.

Se houver CE tecido-tecido, provavelmente causará CE específico de tecido; portanto, para melhorar a potência, testamos apenas pares de traços tecido-tecido que são significativos no teste TPRS acima (interno ou externo, Tabela 3). Esta redução na dimensão do teste é particularmente importante aqui porque o número de testes é proporcional ao quadrado do número de tecidos avaliados. Como cada fenótipo agora tem um número diferente de testes, e esse teste é o mais complexo e de alta dimensão que consideramos, usamos uma correção de Bonferroni agressiva e ajustamos todos os triplos traço-tecido-tecido testados, realizados separadamente para PRS interno e externo.

Encontramos cinco exemplos significativos de Bonferroni de CE tecido-tecido (Tabela 4 e Apêndice SI, Tabela S5). Dois destacam o papel dos músculos no PLAT, um interagindo com os adipócitos (interno é externo significativo P = 0,02), e outro com hipocampo (externo é interno significativo P = 0,01) apesar da replicação interna / externa nominal, a interpretação biológica desses pares de tecidos não é clara. Dois outros pares de tecidos destacam a interação do cérebro com as células do sangue e do fígado para o VPM novamente, o papel do cérebro não está claro, mas tanto as células do sangue quanto o fígado têm forte conexão com a biologia do VPM. Finalmente, encontramos evidências de CE de fígado-pâncreas direcionando FEV / FVC1, o que é particularmente notável como o P valor para este tecido-tecido CE excede qualquer P valor para o CE individual desses tecidos.

Tissue-Pair CE no UKBB


Padrões intrigantes de herança explicados

Existem muitos exemplos de epistasia. Um dos primeiros a serem descritos em humanos é o Bombaim fenótipo , envolvendo o sistema de grupo sanguíneo ABO. Indivíduos com este fenótipo carecem de uma proteína chamada H antígeno (geno-tipo hh), que é usado para formar antígenos A e B. Mesmo que esses indivíduos possam ter genes A ou B, eles parecem ser do grupo sanguíneo O porque não possuem o antígeno H.

Outro exemplo conhecido é a cor da pelagem em camundongos. Dois loci de cor de revestimento estão envolvidos. No locus A, a cor é dominante sobre albino (falta de pigmento). No locus B, a cor da pelagem agouti é dominante sobre o preto. Um mouse que é homozigoto pois o gene albino não mostrará pigmento, independentemente de seu genótipo no outro locus. Assim, os loci A e B são epistáticos.

É provável que o fenômeno da falta de penetrância, no qual um gene dominante deixa de ser expresso, seja freqüentemente devido à epistasia. Existem muitos casos em que os distúrbios dominantes, como a polidactilia (em que os indivíduos têm dedos das mãos ou pés extras), parecem "pular gerações". A não expressão do gene dominante provavelmente se deve aos alelos que o indivíduo possui em um locus independente que é epistático ao locus de polidactilia. A falta de penetrância também pode ser acompanhada por expressividade variável, onde um gene é apenas parcialmente expresso. À medida que a base molecular desses distúrbios se torna conhecida, o motivo da não penetração será mais fácil de determinar.

Essas interações entre loci provavelmente ocorrem na etiologia genética de traços complexos, como os transtornos psiquiátricos esquizofrenia e depressão maníaca. David Lykken, psicólogo genético da Universidade de Minnesota, cunhou o termo "emergênese" para descrever múltiplas interações gênicas envolvidas em um traço complexo específico. Depois de comparar os dados de EEG (eletroencefalograma ou "onda cerebral") de gêmeos idênticos e fraternos, Lykken concluiu que as interações de múltiplos níveis de genes independentes ou parcialmente independentes devem estar envolvidas.

As interações epistáticas dificultam a identificação de loci que conferem risco para doenças complexas e podem ser a principal razão para que os pesquisadores tenham feito apenas um progresso lento no mapeamento de genes de suscetibilidade para doenças complexas. Para localizar loci interagentes envolvidos nas origens genéticas de doenças complexas, é necessário coletar amostras de DNA de um grande número de famílias em que dois ou mais indivíduos têm a doença. Esses estudos em grande escala geralmente são difíceis de conduzir.


Herança Monohybrid

Existem diferentes formas de genes chamados alelos. Essas diferentes formas de genes são o que criam variações entre os seres vivos. Existem dois tipos de alelo: dominante e recessivo. Vejamos um exemplo para entender isso.

Um tipo de gene é para a cor dos olhos. O alelo para o marrom é dominante e, portanto, representado como 'B' (letra maiúscula). O alelo para olhos azuis é recessivo e representado como 'b' (caixa baixa).

A MÃE tem olhos castanhos e o genótipo Bb O PAI tem olhos azuis e o genótipo bb.

Se eles tiverem um bebê, o bebê receberá um alelo de cada um dos pais. Você pode calcular os resultados possíveis, representando-os em um quadrado punnett.


Dois dos resultados são Bb. Isso significa que o bebê tem 50% de chance de ter olhos castanhos. Mesmo tendo um alelo b (olhos azuis), ele possui um alelo B, e como este é dominante, o bebê terá essa característica. Para ter olhos azuis, o bebê deve ter dois alelos azuis recessivos (bb).


Materiais e métodos

Derivação CeMEE

O painel foi derivado em três etapas (Figura 1). Em primeiro lugar, 16 isolados selvagens (AB1, CB4507, CB4858, CB4855, CB4852, CB4856, MY1, MY16, JU319, JU345, JU400, N2 (ancestral), PB306, PX174, PX179 e RC301 obtidos do Caenorhabditis Centro de Genética) foram consanguíneos por autofecundação por 10 gerações para garantir a homozigosidade, em seguida, cruzaram-se para a variação de funil em uma única população híbrida multiparental, conforme descrito em Teotónio et al. (2012). Cada uma das quatro fases do funil compreendia múltiplos cruzamentos de pares recíprocos em tamanhos populacionais moderados (ver Material Suplementar e figura S1 e informações de apoio de Teotonio et al. (2012) para detalhes completos de replicação e tamanhos de população).

Derivação CeMEE. A fase de funil intercruzamento multiparental compreendeu quatro estágios de cruzamentos par a par e mistura de progênies, realizados em paralelo em tamanhos populacionais controlados. Um ciclo de hibridização para um cruzamento de fundador único está inserido à esquerda: em cada ciclo, vários cruzamentos recíprocos foram iniciados, aumentando o número de réplicas e o tamanho do censo a cada geração filial. e a progênie foi primeiro acasalada por irmãos, então as linhagens recíprocas foram fundidas cruzando e expandindo o agrupado (por três a quatro gerações) antes de começar o próximo ciclo de redução. A população híbrida multiparental resultante foi arquivada por congelamento e as amostras foram descongeladas e mantidas por 140 gerações não sobrepostas de autofecundação mista e cruzamento cruzado sob condições laboratoriais padrão para gerar a população A140. Hermafroditas foram então amostrados do A140 e autofecundados para gerar os RILs A140. Além disso, a população ex-A140 evoluiu por mais 50 gerações nas mesmas condições (CA) ou sob adaptação a um gradiente de sal com diferentes proporções sexuais (linhagens GT, GM e GA Theologidis et al. 2014). Ver Materiais e métodos para a descrição dos subpainéis, e Teotónio et al. (2012) para detalhes de números replicados e tamanhos de população para cada geração de funil. CA, linhas adaptadas de controle CeMEE, C. elegans painel de evolução experimental multiparental GA, adaptação gradual GM androdioica, adaptação gradual GT monóica, adaptação gradual RILs trioicas, linhagens endogâmicas recombinantes.

Em segundo lugar, a população híbrida multiparental evoluiu para 140 gerações discretas em tamanhos populacionais de (taxa de cruzamento), para obter a população A140 [conforme relatado em Teotónio et al. (2012), Chelo e Teotónio (2013), e Chelo et al. (2013)]. Mutações de determinação de sexo foram então introgressadas em massa no A140, mantendo a diversidade genética, para gerar populações monóicas (hermafroditas de autofecundação obrigatória) e trioicas (autofecundação parcial com machos, fêmeas e hermafroditas), conforme detalhado em Theologidis et al. (2014). Evolução experimental replicada adicional foi realizada por 50 gerações sob dois regimes ambientais: (1) um regime de controle (condições como antes), com o sistema reprodutivo androdioico de tipo selvagem (CA50 coletivamente) e (2) uma exposição gradual a um gradiente crescente de NaCl, de 25 mM (meio NGM-lite padrão, Biológico dos Estados Unidos) a 305 mM até a geração 35 e, posteriormente, sistema reprodutivo variável (GX50, onde X é androdioica, monóica ou trioica). Embora as populações trioicas tenham iniciado a evolução apenas com hermafroditas, na geração 50 eram abundantes [50%, ver figura S7 em Theologidis et al. (2014)]. As populações androdioicas mantiveram taxas de cruzamento de & gt 0,4 até a geração 35, logo após perder os machos para terminar com uma taxa de cruzamento de ∼0,2 na geração 50 [figura S5 em Theologidis et al. (2014)]. Este complexo esquema de evolução experimental foi desenhado para estudar os efeitos do sistema reprodutivo sobre a genética e evolução de características complexas, entretanto, aqui consideramos esta estrutura apenas na medida em que é relevante para o mapeamento de características quantitativas no painel como um todo.

Finalmente, os hermafroditas foram consanguíneos por autofecundação para obter RILs. Amostras populacionais (indivíduos) foram descongeladas a −80 ° e mantidas em condições laboratoriais padrão por duas gerações. Na terceira geração, hermafroditas únicos foram colhidos no final do terceiro ao início do quarto estágio larval (L3 / L4) e colocados em poços de placas de cultura de 12 poços, contendo meio M9 (NaCl 25 mM) semeado com Escherichia coli. As linhas foram propagadas a 20 ° e 80% de umidade relativa (UR) pela transferência de um único indivíduo L3 / L4 por 16 (população A140) ou 13 gerações (4-7 dias entre as transferências). Em cada passagem, as placas parentais foram mantidas em 4 ° para evitar o crescimento até que a produção de descendentes fosse verificada, e em casos de falha, duas transferências adicionais foram tentadas antes de declarar a extinção da linha. A consanguinidade foi realizada em vários blocos de 2012 a 2016, em dois locais diferentes. Um total de 709 RILs foi obtido e arquivado a −80 °. A designação completa de CeMEE RILs e subpainéis estão no Arquivo S1 e no Arquivo S2.

Sequenciamento e genotipagem

Detalhes completos de sequenciamento, chamada de genótipo e filtragem de variantes podem ser encontrados no material suplementar. Em resumo, os fundadores foram sequenciados a ≥ 30 × profundidade com leituras de extremidade emparelhadas Illumina 50 ou 100 bp, e as variantes foram chamadas contra o WS245 C. elegans Genoma de referência N2 (GATK 3.3-0 HaplotypeCaller McKenna et al. 2010). Após a profundidade, qualidade, zigosidade e filtragem de frequência, chegamos a um conjunto final de 388.201 marcadores SNP fundadores para genotipar RILs.

Os RILs foram sequenciados com leituras de extremidades emparelhadas de 100 ou 150 bp a uma profundidade média de 5,1 ×. Os genótipos foram imputados pelo Hidden Markov Model (HMM), considerando os 16 estados fundadores e as qualidades de base médias das leituras. Depois de remover linhas intimamente relacionadas, retemos 178 A140 RILs, 118 CA50 RILs (de três populações replicadas), 127 GA50 RILs (três repetições) e 79 GT50 RILs (duas repetições). Os 98 GM50 RILs (duas repetições) são derivados de populações monóicas e são altamente relacionados em média, agrupando-se em um pequeno número de "isotipos". Para evitar a introdução de uma estrutura forte, descartamos todos, exceto cinco abaixo de um limite de identidade de pares em todo o painel para fins de mapeamento de características (pegando a linha com a maior cobertura de sequência para cada isótipo, agrupada por identidade de pares média entre as linhas de todos os outros subpainéis + 5 SD). No total, o CeMEE compreende 507 RILs de cinco subpainéis, com 352.583 dos marcadores fundadores segregando dentro dele. As chamadas de variante do fundador brutas e filtradas estão no Arquivo S3 e no Arquivo S4, e os genótipos RIL imputados estão no Arquivo S5.

Estimamos a heterozigosidade residual para 25 linhas A140 sequenciadas para & gt 20 × cobertura (chamadas de amostra única usando GATK 3.3-0 HaplotypeCaller, configurações de filtração variantes MQ & lt 50,0 || DP & lt 5 || MQRankSum & lt −12,5 || SOR & lt 6 || FS & gt 60,0 || ReadPosRankSum & lt −8,0 || QD & lt 10,0 || DP & gt média × 3). A heterozigosidade média nessas linhas nos locais fundadores é de 0,095% (SD 0,042%, intervalo de 0,033–0,18%).

Conjuntos de marcadores genéticos

Quatro subconjuntos dos 352.583 SNPs fundadores segregando no painel CeMEE são usados ​​para análise (referenciados nas seções correspondentes), que definimos aqui:

Subconjunto de 248.668 marcadores usados ​​para GWAS com MAF & gt 0,05 em linhas fenotipadas.

Subconjunto de 88.508 marcadores removidos de forte LD local (gerado por LDAK em uma filtragem baseada em janela de duas passagens em & lt 0,98 (consulte Predição de herdabilidade e fenótipo), usado para análise de LD intercromossômico e estrutura de painel.

Subconjunto de 4960 marcadores usados ​​para testes 2D, com MAF & gt 0,05, LD local fraco (Plink -indep-pairwise, window = 200 kb, step = 10, & lt 0.5), genótipos imputados em falta ou ambíguos e filtragem entre pares de marcadores para o presença de todas as quatro classes de homozigotos de dois locus com uma frequência de pelo menos um teste.

Subconjunto de 256.535 sites dialélicos compartilhados entre o painel CeMEE e CeNDR sem chamadas ausentes ou heterozigotas.

Estrutura genética CeMEE

Diferenciação de isolados naturais e fundadores:

Comparamos a similaridade dentro e entre os RILs CeMEE e 152 isolados selvagens sequenciados do painel CeNDR (versão 20160408). As distribuições para todas as distâncias de genótipo e haplótipo par a par (% de identidade na escala de 0,33 cM na distância do mapa) são plotadas na Figura S1 no Arquivo S22, usando o conjunto de marcadores 4.

LD () foi calculado para fundadores e CeMEE RILs no mesmo conjunto de locais (conjunto de marcadores 2, adicionalmente filtrado para MAF & gt 1/16, então subamostrado por um fator de 10 para tratabilidade computacional), e plotado contra distâncias genéticas [obtidas por interpolação linear do mapa N2 / CB4856, dimensionado para distâncias (Rockman e Kruglyak 2009)]. Para avaliar a presença de LD sutil e de longo alcance na forma de estrutura intercromossômica, comparamos a média entre os cromossomos a uma distribuição nula gerada por permutação, onde as associações entre os cromossomos são randomizadas dentro de cada genoma RIL e a contribuição da diferenciação da frequência do alelo entre os subpainéis é controlado. Em cada permutação (n = 5000), os genótipos RIL (conjunto de marcadores 2) foram subamostrados aleatoriamente para tamanhos iguais nos cromossomos, divididos por cromossomos e, em seguida, embaralhados dentro de cada subpainel, antes de tomar a correlação média entre os cromossomos como a estatística de teste (ou omitir todas as combinações de cromossomos simples e par a par ) O efeito da poda local de LD é reduzir a ponderação de haplótipos longos em LD forte, para testar melhor as interações fracas envolvendo loci distribuídos pela maior parte do genoma. O código de permutação está no Arquivo S6 (interchromLD.R).

Reconstrução de haplótipos ancestrais e expansão do mapa genético:

Para cada RIL, os haplótipos fundadores foram inferidos com o framework RABBIT HMM implementado no Mathematica (Zheng et al. 2015), condicionamento nas frequências de recombinação observadas para os RILs N2 / CB4856 (dimensionados para as coordenadas de comprimento do mapa estão no Arquivo S7 WS220_geneticMap.txt) (Rockman e Kruglyak 2009). A expansão do mapa realizada foi estimada pela probabilidade máxima para cada cromossomo, antes da reconstrução marginal completa (modelando explicitamente a recombinação no X cromossomo e autossomos) usando a decodificação posterior sob o modelo homólogo totalmente dependente (depModel). Sob este modelo, apropriado para diplóides totalmente consanguíneos, cromossomos homólogos são assumidos como tendo origens ancestrais idênticas (identidade anterior por probabilidade de descendência), e a densidade de junção de recombinação (probabilidade de transição) é dada pela expansão de mapa estimada () e taxas de erro de genotipagem ( definido como para fundadores e para RILs com base na probabilidade de uma varredura de parâmetro). Sites chamados de heterozigotos ou ausentes nos fundadores, ou não resolvidos pela imputação de genótipo HMM em RILs, foram configurados para NA (dados ausentes) antes da reconstrução. Para resumir o desempenho, as probabilidades posteriores por marcador foram filtradas para & gt 0,2, e os comprimentos de haplótipos e pontos de interrupção foram estimados a partir de extensões de atribuições de marcadores, tomando o melhor haplótipo único (se presente), mantendo a identidade do haplótipo (se atribuições múltiplas de probabilidade igual), ou o primeiro entre iguais de outra forma.

Para testar a precisão da reconstrução como uma função do comprimento do haplótipo, realizamos simulações combinadas variando apenas o número de gerações de acasalamento aleatório (código no Arquivo S8 RABBIT_simulations.R). Começando com uma única população representando todos os fundadores [N = 1000, correspondendo ao esperado durante a evolução experimental (Chelo e Teotónio 2013)], o acasalamento ocorreu ao acaso com igual contribuição para a geração seguinte. A recombinação entre cromossomos homólogos ocorreu a uma taxa de 50 cM, com total interferência de crossover, e a probabilidade de crossover meiótico com base nas distâncias entre pares de marcadores obtidos por interpolação linear de posições genéticas (Rockman e Kruglyak 2009). Para cada cromossomo, 10 simulações foram realizadas amostragem em 10, 25, 50, 100, 150, 200, 250 e 300 gerações, e a reconstrução do haplótipo foi realizada como acima. Estimativas de máxima verossimilhança da expansão do mapa realizado para simulações foram utilizadas para calibrar um modelo de previsão do número efetivo de gerações nos RILs. Com o aumento do número de geração, foi progressivamente subestimado devido a pequenos eventos de recombinação não resolvidos (por exemplo., Desvio médio de 14% na geração 300). Diante disso, usamos uma regressão polinomial de segundo grau de no número conhecido de gerações, que foi significativamente preferida em vez de um ajuste linear por teste de razão de verossimilhança (LRT).

Estratificação da população:

A estratificação da população foi avaliada usando decomposição de componente principal (PC) e análise discriminante supervisionada e não supervisionada de PCs (DAPC Jombart et al. 2010). Em todos os casos, a decomposição foi de genótipos podados de forte LD local (conjunto de marcadores 2), centrado na média e dimensionado para a variância unitária.

Dos primeiros 50 PCs, 10 estão individualmente significativamente associados à identidade de subpainel por ANOVA (regressão linear de cada PC na identidade de subpainel, testado contra um modelo apenas de interceptação por LRT, P & lt 0,05 após a correção de Bonferroni). Sete dos 10 principais PCs são significativos, embora outros até 38 também estejam associados, mostrando que várias fontes de estrutura contribuem para os principais eixos de variação.

Para DAPC [pacote R adegenet, Jombart (2008)], usamos 100 rodadas de validação cruzada de 10 vezes para determinar o número de PCs necessários para a precisão de atribuição de subpainel ideal (a média de atribuições corretas por grupo). Este valor (40 PCs) foi então usado para inferir grupos por grupos não supervisionados k-Significa agrupamento (configurações padrão de 10 inícios, iterações) com o número de grupos selecionados no Critério de Informação Bayesiano (BIC).

Fenotipagem

Fertilidade:

No esquema de evolução experimental sob o qual os RILs CeMEE foram gerados, a contribuição de um hermafrodita para a próxima geração é o número de embriões viáveis ​​que sobrevivem ao branqueamento (colocados, mas não eclodidos, ou no utero) que posteriormente eclodem nas larvas L1 24 horas depois. Tratamos esse fenótipo como fertilidade e o medimos para vermes individuais de 230 RILs. Detalhes completos são fornecidos no Arquivo S22. Em resumo, usamos ensaios baseados em placas pontuados manualmente do número de embriões viáveis ​​produzidos por hermafroditas adultos únicos, com duas placas independentes para a maioria dos RILs, que consideramos como réplicas para estimativa de repetibilidade (ver abaixo). No total, o número médio de medições por linha foi de 43 (variação de 4 a 84). Os valores finais das características foram os coeficientes de linha transformada de Box-Cox de um modelo linear generalizado de Poisson (link log) com efeitos categóricos fixos de linha, coluna e borda da placa (linhas e colunas externas) e a contagem de descendentes por verme como variável de resposta (modelo S1 em material suplementar). Os dados para 227 RILs passaram na filtragem (os dados brutos estão no Arquivo S9, os coeficientes do modelo estão no Arquivo S10), provenientes de RILs de três subpainéis (170 A140, 45 GA50 e 12 GT50). O subpainel explica 4% da variância neste traço, com GA50 RILs tendo maior fertilidade média do que A140 (regressão linear dos valores do traço na identidade do subpainel, coeficiente de regressão = 0,43, ver Figura S2 no Arquivo S22).

Tamanho do corpo do hermafrodita adulto:

A área de vermes hermafroditas adultos foi medida usando um Multi-Worm Tracker (Swierczek et al. 2011). Os dados foram gerados em dois laboratórios ao longo de vários anos, registrando a umidade relativa e a temperatura no momento do ensaio (consulte o material suplementar para obter todos os detalhes). Os valores finais das características foram os coeficientes de linha transformada de Box-Cox de um modelo linear que incorpora efeitos fixos de ano, aninhados no local, e umidade e temperatura, aninhados no local (modelo S3 em Métodos Suplementares). Os dados de 410 RILs passaram pela filtragem, com dois blocos de descongelamento independentes para a maioria dos RILs (os dados brutos estão no Arquivo S11 e os valores finais de característica estão no Arquivo S12). Os dados vêm de RILs de três subpainéis (165 A140, 118 CA50 e 127 GA50), que explicam 17% da variância dessa característica. GA50 RILs são muito maiores do que A140 (coeficiente de regressão = 0,94, consulte a Figura S2 no Arquivo S22), e isso não é conduzido por covariáveis ​​técnicas: a aquisição de dados para A140 RILs e GA50 RILs foi relativamente equilibrada em relação à localização e tempo, e GA50 RILs são significativamente maiores em todos os cinco blocos de laboratório / ano.

A fertilidade e o tamanho do corpo mostram correlações fenotípicas e genéticas significativas [Figura S2 no Arquivo S22, ver também Poullet et al. (2016)], justificando o último ser considerado um traço proximal ao fitness. Para 202 linhas com dados para ambas as características, a correlação fenotípica = 0,35 (Spearman’s ρ para os coeficientes do modelo de característica final usados ​​para mapeamento de QTL,) e correlação genética (/ onde é a covariância genética entre tamanho e fertilidade, foi estimada por probabilidade máxima restrita / residual (REML) [sommer do pacote R, Covarrubias-Pazaran (2016)] usando similaridade genética aditiva não ponderada UMA (Veja abaixo).

Predição de herdabilidade e fenótipo

Repetibilidade:

A repetibilidade foi estimada a partir de ANOVA das médias de replicação de linha para cada característica como / (), onde (quadrado médio entre as linhas - erro quadrado médio) /, e é um coeficiente de correção para um número variável de observações (médias de placa 1-4) por linha (Lessells e Boag 1987 Sokal e Rohlf 1995). Assumindo variância igual e proporções iguais de variância ambiental e genética entre as réplicas, R representa um limite superior na herdabilidade de sentido amplo (Falconer 1981 Hayes e Jenkins 1997). Os dados de fertilidade foram transformados em raiz quadrada para desacoplar a média e a variância.

Premissas:

Em linhagens isogênicas endogâmicas, a herdabilidade de sentido amplo também pode ser estimada pelo modelo linear de efeitos mistos (LMM) a partir da covariância entre as variâncias genéticas e fenotípicas. No entanto, a medição da similaridade genética está sujeita a uma série de suposições e é (quase) sempre, na melhor das hipóteses, uma aproximação (Speed ​​and Balding 2015).

Uma primeira suposição é que todos os marcadores são os alelos causais da variação fenotípica. No entanto, é inevitável que os marcadores marcem os alelos causais (desconhecidos) em diferentes graus devido à variável LD. Uma segunda suposição, geralmente implícita, no cálculo da similaridade genética é o peso dado aos marcadores em função da frequência do alelo. Um peso maior tem sido dado a alelos raros na pesquisa com humanos, o que tem suporte em cenários de seleção e neutralidade (Pritchard 2002). Uma terceira suposição, relacionada às duas primeiras, é a relação entre LD e variação causal. Se a relação for positiva - variantes causais sendo enriquecidas em regiões de alto LD - então a herdabilidade estimada de todos os marcadores será tendenciosa para cima, uma vez que o sinal da variação causal contribui desproporcionalmente para a similaridade genética (Velocidade et al. 2012).

O uso de sequenciamento do genoma completo aborda amplamente a primeira suposição, dada (como aqui) uma densidade de marcador muito alta e um genoma de referência preciso, embora na ausência de de novo genomas de dados de leitura longa para cada indivíduo, a contribuição do número de cópias em grande escala e variação estrutural, e nova mutação, permanecerão desconhecidos. Para levar em conta a segunda e a terceira suposições, usamos LDAK (v5.0) para explicar explicitamente o LD no CeMEE (meia-vida de decaimento = 200 kb, min-cor (coeficiente de correlação quadrado mínimo) = 0,005, min-obs ( porcentagem mínima de dados não perdidos por marcador) = 0,95 Velocidade et al. 2012). As estimativas de herdabilidade não foram sensíveis à variação no parâmetro de decaimento em um intervalo de 10 vezes ou à unidade de medida (física ou genética), e usamos a distância física. Em todo o conjunto de 507 RILs, 88.508 marcadores de segregação foram usados ​​após a poda local baseada em LD (conjunto de marcadores 2) e, destes, 22.984 marcadores receberam pesos diferentes de zero (Arquivo S13). A ponderação LD pode ampliar os efeitos dos erros de genotipagem. Testamos o efeito da exclusão de 17.740 marcadores com LD local particularmente baixo (média sobre uma janela de 20 marcadores & lt 0,3, ou a razão da média para a média da janela & lt 0,3) antes da estimativa dos pesos LD. As estimativas de herdabilidade permaneceram praticamente inalteradas (dentro dos intervalos relatados), assim como nossas conclusões gerais sobre os componentes de variância e desempenho do modelo.

Modelagem:

Dado m SNPs, a similaridade genética é calculada pela primeira escala S, a matriz de genótipos médios centrados, onde é o número de alelos menores transportados por linha eu (do n) no marcador j e frequência f, dar X: (1) A matriz de similaridade genética aditiva (GSM) UMA é então Aqui, α dimensiona a relação entre a frequência do alelo e o tamanho do efeito (Velocidade et al. 2012), corresponde à suposição de variância igual explicada por marcador (uma relação inversa do tamanho do efeito e frequência do alelo), enquanto alelos comuns recebem maior peso em α & gt 0. Testamos e relatamos resultados que maximizaram a precisão da previsão. Com Y o vetor médio centrado de n valores de fenótipo escalados para variância unitária, o ajuste do modelo aditivo para estimar a herdabilidade genômica () é então: (2) onde β representa efeitos SNP aleatórios que capturam a variância genética e e é o erro residual que captura a variação ambiental Dado Y e UMA, a herdabilidade pode ser estimada a partir das estimativas de REML de variância genética e residual conforme Observe que usamos os termos e a herdabilidade genômica indistintamente aqui por conveniência, embora em alguns casos covariâncias não aditivas sejam incluídas. Assumimos que os RILs são totalmente consanguíneos.

A existência de domínios de taxa de recombinação quase discretos entre os cromossomos levou a uma estrutura característica de variação de nucleotídeos, correlacionada com a densidade e função do gene (Cutter et al. 2009). A variação também varia amplamente entre os cromossomos (Rockman et al. 2010 Andersen et al. 2012). Esta heterogeneidade não é capturada pela similaridade agregada de todo o genoma com peso igual do marcador (Velocidade et al. 2012 Goddard et al. 2016). Para refletir melhor o LD observado, os marcadores foram primeiro ponderados pela quantidade de variação genética que marcam ao longo dos cromossomos (Velocidade et al. 2012). Dado m pesos, os efeitos genéticos para o modelo básico tornam-se: (3) onde C é uma constante de normalização. Em segundo lugar, medimos em conjunto a variância explicada por cromossomos individuais (e pela variação genética nos domínios da taxa de recombinação dentro de cada cromossomo), o que pode melhorar a precisão da estimativa de herdabilidade se as variantes causais não forem uniformemente distribuídas, permitindo que a variância varie entre as partições. Terceiro, testamos similaridade genética epistática e aditiva com (1) o produto de entrada (Hadamard) de GSMs aditivos, dando a probabilidade de compartilhamento de pares de alelos (Henderson 1985 Jiang e Reif 2015), (2) expoentes superiores até quarto- interações de ordem e (3) similaridade baseada em haplótipos em escala multigênica. Componentes adicionais de similaridade (aditivos ou não) são adicionados como efeitos aleatórios ao modelo acima para obter uma estimativa independente dos componentes de variância (consulte os materiais suplementares para obter detalhes).

O ajuste do modelo foi avaliado por predições de fenótipo de validação cruzada leave-one-out, calculando a melhor predição linear imparcial genômica (GBLUP) (Meuwissen et al. 2001 VanRaden 2008) para cada RIL e retornando o coeficiente de correlação quadrático () entre os valores de característica observados e preditos (realizado em LDAK). Para evitar o viés associado ao tamanho da amostra, todos os modelos eram irrestritos (os componentes de variância sem erro foram permitidos para variar fora de 0-1 durante a convergência), a menos que indicado de outra forma, o que geralmente deu melhor probabilidade para modelos de múltiplos componentes.

Testes 1D:

Para traço único, associação de marcador único, ajustamos LMMs: (4) onde X é a matriz de efeitos fixos (genótipo SNP) e β é o efeito na variação fenotípica que é estimada. g são os efeitos aleatórios que descrevem covariâncias genéticas (Equação 3) responsáveis ​​pela não independência entre os testes devido a uma contribuição poligênica assumida para o fenótipo, com UMA o GSM do ajuste aditivo mais preditivo encontrado para cada característica, e e é um erro residual. O modelo acima foi comparado a um modelo nulo excluindo efeitos de genótipo por LRT (ajuste usando o pacote LIMIX Python, https://github.com/limix/limix). GWAS P-valores para tamanho e fertilidade estão no Arquivo S14, usando semelhanças genéticas no Arquivo S15 e Arquivo S16.

Para avaliar a resolução do mapeamento e o poder do painel CeMEE, realizamos o GWAS de acordo com o modelo acima para fenótipos simulados. Simulamos um único locus aditivo (de 1 a 30%) e um componente poligênico de fundo de variância igual (cenários de 10, 100 ou 1000 loci), escolhido aleatoriamente de SNPs com MAF & gt 0,05, com tamanhos de efeito genético e ambiental desenhados independentemente da distribuição normal padrão (o código está no Arquivo S17, GWAS_simulations). O GWAS foi realizado 1000 vezes para cada cenário, controlando para parentesco com similaridade genética aditiva ponderada por LD (). A potência foi estimada a partir de um modelo linear generalizado binomial considerando todos os três cenários poligênicos juntos. A precisão, a fração de QTL significativos que são verdadeiros positivos, foi avaliada após mascarar uma janela de 1 cM em torno do SNP causal simulado. Intervalos de detecção em torno de QTL foram definidos como uma queda no logaritmo de odds (LOD) pontuação de 2 (Morton 1955), e foram calculados a partir de marcadores alimentados de forma semelhante com ≥ MAF, com P-valores convertidos em pontuações LOD como (Nyholt 2000). Os verdadeiros positivos foram definidos como casos em que o local simulado exato foi detectado e os falsos positivos foram 2-LOD com queda de QTL entre todos os outros marcadores detectados a um limite de permutação de significância de 5% (ver abaixo).

Todas as 507 linhas foram usadas para simulação e todos os GWAS testaram 248.668 marcadores com MAF & gt 0,05 (o código do conjunto de marcadores 1 está no Arquivo S18, GWAS_traits.py). Limiares de significância foram estabelecidos por permutação (Anderson e Ter Braak 2003), com fenótipos gerados pela permutação de resíduos de fenótipo, dada a relação estimada entre as linhas para garantir a permutabilidade na presença de efeitos causais poligênicos ou estrutura (UMA), usando o pacote R mvnpermute (Abney 2015). O nível de significância α é o percentil correspondente do mínimo P-valores de 1000 permutações.

Dada a correlação entre as características, também testamos os resíduos do fenótipo para cada característica após a regressão linear na outra, e um LMM de múltiplas características ajustando efeitos gerais e específicos. Nenhum marcador foi significativo em nenhum caso (análise não mostrada).

Testes 2D:

Testamos a epistasia em um espaço de busca reduzido (conjunto de marcadores 3), no pressuposto de homozigosidade completa, para um total de 19.913.422 pares de marcadores (inter e intracromossômico). Usamos um procedimento hierárquico de dois níveis, primeiro testando um modelo linear completo (efeitos principais e de interação) contra um modelo reduzido (apenas interceptação) por ANOVA, tomando como estatística de resumo o P-valor de um LRT. A significância no nível 1 foi testada contra uma distribuição nula gerada pela permutação completa do fenótipo (ou seja, sem efeitos aditivos ou de interação), com a partir dos valores mínimos observados para cada par de cromossomos (permutações). Em seguida, testamos o termo de interação especificamente para pares de marcadores significativos no nível 1 usando um bootstrap paramétrico (Bůžková et al. 2011): foi ajustado para respostas amostradas com substituição de (n = 10.000), tomando a interação P-valor como estatística de teste e, em seguida, comparar a estatística observada com a distribuição nula (significância declarada em P & lt 0,01). O código está no arquivo S19 2D_hierarchical.py. (5) Inicialmente, ignoramos a relação para o teste 2D, então ajustamos os LMMs como acima (Equação 2) com covariância genética UMA para interações candidatas (pacote R hglm Shen et al. 2014). De oito interações candidatas para tamanho, excluímos duas para as quais P-valores por LMM eram quase uma ordem de magnitude mais elevados. Os seis candidatos restantes mudaram pouco (três foram inferiores por LMM). Para fertilidade, interação P-valores eram amplamente insensíveis ao parentesco (menor para seis dos oito casos por LMM). Os modelos também foram ajustados aos valores brutos das características (além dos valores transformados de energia) para avaliar os efeitos de escala. Uma interação para fertilidade foi significativa apenas para valores transformados e foi excluída. A quantidade de variância fenotípica explicada pelas interações para cada característica foi estimada pelo modelo linear ajustado em conjunto com todas as interações principais e de dois locus. Estas estimativas foram semelhantes às dos componentes de variância LMM, ajustando os efeitos aleatórios correspondentes à similaridade genética aditiva e aditivo por aditivo separadamente nas interações candidatas e marcadores de fundo (as estimativas pontuais foram 6% menores para o tamanho e & lt 1% menores para a fertilidade).

Também testamos o excesso de interações poligênicas mais fracas tomando a soma das razões de probabilidade logarítmica (LRs) para cada marcador contra todos os outros marcadores em um outro cromossomo (testes de soma 2D). A significância foi testada em um único limite (LR & gt 16, em torno do valor máximo visto entre a interação de pares nula P-valores), usando o equivalente ao procedimento hierárquico acima: LRs para vs. foram primeiro somados para cada marcador e comparados a uma distribuição nula gerada pela permutação completa do fenótipo. Marcadores candidatos significativos no nível 1 (α = 0,01) foram então testados quanto à significância dos termos de interação contra uma distribuição de somas LR de modelos aditivos nulos para testes com LR & gt 16 nos dados observados. Isso foi repetido 1000 vezes, com a ordem de permutação fixada entre bootstraps para manter a estrutura de correlação, e a significância foi declarada em P & lt 0,01. O código está no Arquivo S20, 2D_sumLRbootstrap.R.

Disponibilidade de dados

Os dados de sequência estão disponíveis no National Center for Biotechnology Information Sequence Read Archive sob BioProject PRJNA381203. Os dados brutos e processados ​​do fenótipo e do genótipo e os scripts de análise são fornecidos como material suplementar (consulte DataDocument) e arquivados no FigShare sob DOI: 10.6084 / m9.figshare.5466574.v1. RILs estão disponíveis com os autores.


Sinergismo entre consanguinidade e parasitismo

Não houve interação significativa e, portanto, nenhuma evidência de sinergismo entre o coeficiente de endogamia e as consequências da infecção parasitária encontradas neste estudo. O parasita reduziu a aptidão de todos os clones consanguíneos igualmente. Anteriormente, Coltman et al. (1999) relataram uma interação entre consanguinidade e parasitismo. Ovinos consanguíneos apresentaram maior mortalidade quando parasitados por nematóides gastrointestinais. Eles sugerem que o parasitismo intensifica a seleção contra a consanguinidade. Abordando questões semelhantes, Stevens et al. (1997) examinou o efeito de um parasita de tênia em endogâmicas Tribolium linhas. Embora os besouros consanguíneos não tenham intensidades de infecção significativamente diferentes dos indivíduos não consanguíneos, a consanguinidade aumentou significativamente a prevalência do parasita. Em nosso estudo, a probabilidade de infecção (prevalência) em diferentes níveis de endogamia não pôde ser estudada, uma vez que dentro de cada réplica, todos ou nenhum dos animais testados estavam parasitados. Isso porque mantivemos as condições tais que apenas a transmissão vertical de O. bayeri ocorreu.

Com relação ao parasitismo, o resultado do presente estudo é consistente com o resultado de Peters (1999), que expôs Arabidopsis thaliana indivíduos a cinco níveis de mutagênese química (EMS) e três níveis de Pseudomonas Syringae infecções e mediu diferentes componentes de fitness. Embora ele tenha encontrado um efeito negativo da mutação e do patógeno, não houve uma interação sinérgica de mutações, nem um efeito sinérgico de mutações e patógenos nos caracteres medidos. Assim, como no presente estudo, as consequências da infecção e das mutações deletérias pareciam ser independentes uma da outra. Em contraste com o estudo de Peters (1999), o presente estudo mostrou uma diminuição não linear na aptidão com o aumento do número de mutações.

Consistente com nossas descobertas, outro estudo sobre D. magna (Haag et al., 2003), que foi projetado especificamente para testar se as infecções parasitárias aumentam a seleção contra genótipos consanguíneos, também não encontraram evidências de um sinergismo entre parasitas e endogamia. Haag et al. (2003) incluiu 14 origens genéticas, mas contrastou apenas os controles com um nível de endogamia. Alguns dos clones que usaram foram os G1x e GClones 1s, usados ​​para criar os clones experimentais do estudo aqui apresentado. Em contraste com nosso estudo, Haag et al. (2003) tiveram maior poder para encontrar um possível sinergismo entre parasitas e endogamia, mas seu projeto não permitiu testar a epistasia em diferentes níveis de endogamia. Embora seu experimento tenha mostrado claramente uma ausência de sinergismo entre parasitas e endogamia, eles descobriram que o efeito dos parasitas na depressão por endogamia dependia do histórico genético. Em nosso experimento, isso foi testado pela interação de três vias, que era apenas marginalmente significativa.

Em conclusão, este estudo observou epistasia usando três clones cada vez mais consanguíneos de D. magna em um experimento de competição. Os clones com o maior coeficiente de endogamia mostraram uma diminuição significativa em sua aptidão em comparação com os outros dois, clones menos consanguíneos. No entanto, nenhum sinergismo entre consanguinidade e um parasita foi encontrado, o parasita reduziu a aptidão de todos os clones igualmente, independente de seu coeficiente de endogamia. Assim, este estudo sugere que mutações e um fator ambiental (um parasita) podem contribuir para a manutenção do sexo de forma independente, ao invés de sinergicamente.


Assista o vídeo: Genetyka! Co to jest DNA, Chromosomy, Dziedziczenie, Zmienność - MEGA ciekawa biologia. (Agosto 2022).