Em formação

Qual é a diferença entre regiões não codificantes e regiões intergênicas?

Qual é a diferença entre regiões não codificantes e regiões intergênicas?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

A pergunta inicial era sobre como entender o que está na jusante de um gene em um organismo eucariótico. Eu entendo que esta região está localizada a 3 'de um gene e, portanto, esperaria encontrar regiões não codificantes, mas há uma diferença entre regiões não codificantes e uma região intergênica?

Um pequeno histórico do que estou fazendo: estou estudando o efeito dos retrotransposons em populações de S. cerevisiae, e já identifiquei os impactos potenciais desses retrotransposons e essas foram as consequências:

Variante do gene a montante 49 Variante do gene a jusante 42 Variante intergênica 4 Ablação do transcrito 3 Variante da sequência de codificação 1 Característica alongamento 1 3 'UTR variante 1

Portanto, é inteligente dizer que a jusante de um gene existem genes não codificantes?


"Intergênico" é, bem, uma vergonha, embora possa ser difícil de evitar. Intergênico significa, literalmente, entre genes. Os genes são, como você esperaria, geneticamente definidas como regiões do cromossomo com algum papel genético. Entre os genes, temos, enfim, lixo, spam, sem sentido ou significância, pois senão seria um gene. Na década de 1990, todo mundo sabia que a maior parte do genoma era "DNA lixo" e era muito simples. E o dogma central era que o DNA faz o mRNA produz a proteína e se não houvesse nenhuma proteína que produzisse o mRNA, ou mesmo nenhum grande proteína, então eles presumiram que não havia gene.

Bem, o problema de usar esses termos hoje em dia é, primeiro, é muito difícil mostrar qualquer pedaço de DNA nunca tem um papel. Afinal, muitas vezes você pode remover um gene inteiro sem efeito visível em um organismo, então como alguma sequência não codificadora "entre genes" pode ser provada conclusivamente como sem sentido e sem relevância para nenhum de seus vizinhos? E em segundo lugar, o DNA definitivamente faz têm um papel, mesmo se tudo o que fizerem for produzir RNA não codificante, ou agirem como uma sequência reguladora que o faça. Assim, por exemplo, no OMIM você pode procurar muitos registros para "intergênicos", com resultados como H19, para o qual um dos termos é "ARN NÃO CODIFICANTE INTERGÊNICO LONGO H19". Observe também que H19 está listado como o símbolo do gene aprovado pelo HGNC, portanto, é um gene intergênico. Complicado, hein? (Tenho grande respeito pelo OMIM - isso não é culpa deles) Além disso, os realçadores podem estar muito longe de um gene, mesmo após o fim de outro gene ou afetando vários genes, mesmo que uma mutação no realçador possa geneticamente agir como um alelo de um gene específico, ele pode ser descrito em termos de sequência como localizado em uma região intergênica.

Resumindo: as regiões intergênicas sobre as quais você está lendo estarão entre coisas que são reconhecidas como genes e podem ou não ter algum efeito sobre um ou outro (ou ambos ...). Eles não conterão CDS, que sempre é considerado um gene, nem 5'UTR ou 3'UTR porque esses são transcritos antes ou depois de um CDS. Depois disso, como eles estão sendo diferenciados de "sequência upstream" e "sequência downstream", isso pode ser completamente arbitrário. Eles podem ter acessado o WormBase e retirado registros de genes selecionados e adicionado um certo número de pares de bases antes do local de início como promotor - mas eu não sei disso. Você apenas terá que tentar encontrar a referência específica para qualquer ferramenta que estiver usando.


Uma região intergênica é apenas um dos muitos tipos de sequência não codificadora.

Outros incluem:

  • promotores
  • sites de ligação regulatória
  • terminadores
  • íntrons
  • aptâmeros
  • locais de entrada de ribossomo

Há um muito de coisas que fazem parte dos genes além da sequência de codificação da proteína.

Uma boa maneira de obter uma imagem dos tipos de coisas que existem além das regiões de codificação é navegar na Ontologia de Sequência. Se você navegar até a sequência de codificação e começar a navegar pelos termos de pais e primos, encontrará um vasto número, incluindo todas as coisas que mencionei acima, bem como a região intergênica, com definições associadas a orelha.


Qual é a diferença entre regiões não codificantes e intergênicas? - Biologia

Um Intergênico região é um trecho de sequências de DNA localizadas entre grupos de genes que contêm poucos ou nenhum gene. Ocasionalmente, alguns intergênico O DNA atua para controlar genes próximos, mas a maior parte dele não tem função conhecida atualmente. É uma das sequências de DNA conhecidas coletivamente como DNA-lixo, embora seja apenas um fenômeno rotulado como tal e científico.
Artigo completo >>>

Intergênico resumo da região com 2 páginas de entradas da enciclopédia, ensaios, resumos,. Análise de 16S-23S intergênico regiões espaçadoras dos operons rRNA.
Artigo completo >>>

Isso sugere que intergênico as transcrições estão sujeitas a restrições funcionais. Em geral, intergênico as transcrições tendem a ser expressas em níveis baixos, às vezes.
Artigo completo >>>

20% de intergênico regiões, geralmente ocorrem em aglomerados e são raros. A fim de encontrar ortólogos intergênico regiões, procuramos pares de.
Artigo completo >>>

O rDNA 16S-23S intergênico espaçador varia mais significativamente em tamanho e. Heterogeneidade entre 16S-23S rRNA intergênico espaçadores de espécies dentro do `.
Artigo completo >>>

Informações da enciclopédia sobre Intergênico DNA. o nome implica, intergênico O DNA se refere. Padrões de restrições evolutivas em intrônicos e Intergênico DNA.
Artigo completo >>>

Rio acima intergênico regiões foram extraídas das sequências do genoma usando um PERL. Intergênico as sequências podem ser obtidas copiando e colando o COGSearch.
Artigo completo >>>

Informações de zoologia, história, artigos e pesquisas de Academic Journals, Newspapers e revistas em HighBeam.com. Teste grátis, cartão de crédito obrigatório.
Artigo completo >>>

Como uma comparação com o intergênico espaçador locus e para avaliar a ligação. Dois dos ligados intergênico os genótipos spacer e p66 eram únicos para as espécies.
Artigo completo >>>

Geramos um conjunto de 66 intergênico sequências em Arabidopsis lyrata, um fechamento. o intergênico as regiões incluíram remanescentes e regiões do elemento transponível (TE).
Artigo completo >>>

mais problemático para intergênico regiões de genomas nucleares de plantas, porque planta. Em teoria ortóloga intergênico os dados são valiosos para estudar.
Artigo completo >>>

Detalhes sobre mutação genética, intragênica, Intergênico, Point Mutations, Enzymatic Capacities, Normal Base Sequence, DNA Moleucle. pode ser intragênico ou intergênico. .
Artigo completo >>>

As setas sublinham as três sequências repetitivas encontradas neste intergênico região. . (B) Representação esquemática do intergênico região. .
Artigo completo >>>

A chave para E. coli. Dra. Sophie Bachellier tem uma página web para os IRUs (Intergênico Repita unidades). localizado no intergênico regiões de bactérias.
Artigo completo >>>

PLoS ONE: um recurso inclusivo, revisado por pares e de acesso aberto do PÚBLICO. Conservado intergênico as sequências são identificadas comparando os IGRs do.
Artigo completo >>>

. pesquisando o genoma de E. coli por intergênico regiões de alta identidade de sequência. Romance intergênico repetições de Escherichia coli K-12 ". Res. Microbiol.
Artigo completo >>>

muitos intergênico regiões seria muito alto. conservado entre as espécies stricto sensu até. de S. cerevisiae que seu intergênico sequências.
Artigo completo >>>

Intergênico as sequências foram excisadas aleatoriamente de todos os 24 cromossomos do ser humano. conjunto de treinamento incluiu 12.000 intergênico fragmentos e 12 000 fragmentos PET. .
Artigo completo >>>

Biblioteca BioInfoBank :: DNA, Intergênico :: fisiologia :: [Sequências não codificantes do genoma eucariótico como proteção adicional de genes de mutagênicos químicos].
Artigo completo >>>

Caracterização do intergênico Perfil de RNA em abdominal-A e Abdominal-B em. Essas observações sugerem que o intergênico Os RNAs podem desempenhar um papel importante em.
Artigo completo >>>


Diferenças entre regiões codificantes e não codificantes no Trichomonas vaginalis genoma: um gene de actina como modelo de locus 1

A sequência de um fragmento genômico clonado de Trichomonas vaginalis contendo um gene de actina completo foi determinado. Um quadro de leitura aberto ininterrupto de 1128 nucleotídeos foi encontrado que codifica para um gene de actina. Duas sequências promotoras de consenso sobrepostas para T. vaginalis foram encontrados 12 nucleotídeos a montante do códon de iniciação da actina. Além da actina, dois quadros de leitura abertos incompletos foram encontrados nas extremidades 5 'e 3' do clone. Essas duas sequências são expressas e mostraram semelhança com genes da adenilato ciclase e uma proteína hipotética de levedura. A sequência geral apresentou maior conteúdo de G + C e menor frequência de sequências repetidas nas regiões codificantes quando comparada com as regiões não codificantes. Uma distribuição desigual de nucleotídeos semelhante foi encontrada em vários T. vaginalis genes recuperados de bancos de dados.


Diversidade microbiana funcional em ambiente contaminado e aplicação em biorremediação

Satyanarayan Panigrahi,. Toleti Subba Rao, em Microbial Diversity in the Genomic Era, 2019

21.2.2.7 Análise do espaçador intergênico ribossomal (RISA)

A análise espaçadora intergênica de rRNA (RISA) é um método de análise de comunidade microbiana que envolve a amplificação por PCR de uma região do operon do gene rRNA entre as subunidades pequena (16S) e grande (23S) (Fisher e Triplett, 1999), chamada de região espaçadora intergênica ( ISR) (Fig. 21.8).

Figura 21.8. Análise de espaçador intergênico ribossomal uma visão geral típica.

Ao usar iniciadores de oligonucleotídeos direcionados a regiões conservadas nos genes 16S e 23S, fragmentos RISA podem ser gerados a partir da maioria das bactérias dominantes em uma amostra ambiental. A maioria do operon rRNA serve a uma função estrutural porções da região intergênica 16S-23S pode codificar tRNAs dependendo da espécie bacteriana. No entanto, o valor taxonômico do ISR reside na heterogeneidade significativa tanto no comprimento quanto na sequência de nucleotídeos. ISR varia entre 150 e 1500 bp com a maioria dos comprimentos de ISR entre 150 e 500 bp. A versão automatizada do RISA é conhecida como ARISA e envolve o uso de um primer direto marcado com fluorescência, e os fragmentos ISR são detectados automaticamente por um detector a laser. ARISA permite a análise simultânea de muitas amostras, no entanto, a técnica demonstrou superestimar a riqueza e diversidade microbiana (Fisher e Triplett, 1999). RISA tem sido usado para detectar populações microbianas envolvidas na degradação de hidrocarbonetos poliaromáticos em baixa temperatura sob condições aeróbicas e de solo enriquecido com nitrato redutor (Eriksson et al., 2003). Foi observado que a dominância de bactérias pertencentes a proteobactérias alfa, beta e gama presentes nos enriquecimentos foram trazidas para a cultura com sucesso. Um estudo recente utilizou ARISA para investigar a diversidade de bactérias degradadoras de hidrocarbonetos e a resposta da comunidade bacteriana em areias de praia contaminadas por derramamento de óleo no Golfo do México (Kostka et al., 2011). Os autores observaram aumento da abundância de sequências de Alcanivorax na areia contaminada com óleo. Ranjard et al. (2001) usaram ARISA para caracterizar as comunidades bacterianas de quatro tipos diferentes de solo. Seus resultados demonstraram que ARISA é um método muito eficaz e sensível para detectar diferenças entre comunidades bacterianas complexas em várias escalas espaciais (variabilidade entre e dentro do local).


Definição

O DNA codificador refere-se ao DNA no genoma, contendo genes codificadores de proteínas, enquanto o DNA não codificador se refere ao outro tipo de DNA, que não codifica proteínas.

Porcentagem no Genoma

O DNA codificador representa apenas 1% do genoma humano, enquanto o DNA não codificador representa 99% do genoma humano.

Componentes

O DNA codificador se compõe de exons, enquanto o DNA não codificador se compõe de elementos reguladores, genes de RNA não codificantes, íntrons, pseudogenes, sequências repetidas e telômeros.

Codificação para proteínas

O DNA codificador codifica para proteínas, enquanto o DNA não codificador não codifica para proteínas.

Resultantes da Transcrição

O DNA codificador sofre transcrição para sintetizar mRNAs, enquanto o DNA não codificador sofre transcrição para sintetizar tRNAs, rRNAs e outros RNAs reguladores.

A função dos produtos genéticos

As proteínas codificadas pelo DNA codificador têm importância estrutural, funcional e regulatória na célula, enquanto o DNA não codificador é importante para controlar a atividade do gene.

Conclusão

O DNA codificador é o tipo de DNA no genoma, que codifica genes que codificam proteínas. Geralmente, esses genes sofrem transcrição para sintetizar mRNA. Em eucariotos, a região codificadora dos genes codificadores de proteínas é interrompida por íntrons, que são removidos após a transcrição. No entanto, os mRNAs sofrem tradução para produzir proteínas. Significativamente, as proteínas desempenham um papel fundamental na célula, servindo como componentes estruturais, funcionais e reguladores da célula. Em contraste, o DNA não codificador é outro tipo de DNA, representando cerca de 99% do genoma. No entanto, ele contém genes para RNAs não codificantes, incluindo tRNAs, rRNAs e outros RNAs reguladores, que são importantes na tradução de mRNA. Além disso, o DNA não codificador inclui elementos reguladores, íntrons, pseudogenes, sequências repetidas e telômeros. Portanto, a principal diferença entre o DNA codificador e o não codificador é o tipo de genes presentes e seus produtos gênicos.

Referências:

1. “O que é DNA não codificador? & # 8211 Genetics Home Reference & # 8211 NIH. ” Biblioteca Nacional de Medicina dos EUA, National Institutes of Health, disponível aqui.

Cortesia de imagem:

1. & # 8220Gene structure ekaryote 2 anotado & # 8221 Por Thomas Shafee & # 8211 Shafee T, Lowe R (2017). & # 8220Eucariota e estrutura do gene procariota & # 8221. WikiJournal of Medicine 4 (1). DOI: 10.15347 / wjm / 2017.002. ISSN 20024436. (CC BY 4.0) via Commons Wikimedia
2. & # 8220TATA box mecanismo & # 8221 Por Luttysar & # 8211 Própria obra (CC BY-SA 4.0) via Commons Wikimedia
3. & # 8220DNA para proteína ou ncRNA & # 8221 Por Thomas Shafee & # 8211 Própria obra (CC BY 4.0) via Commons Wikimedia

Sobre o autor: Lakna

Lakna, graduada em Biologia Molecular e Bioquímica, é Bióloga Molecular e tem um grande e intenso interesse na descoberta de coisas relacionadas à natureza


Conteúdo

A quantidade de DNA genômico total varia amplamente entre os organismos, e a proporção de DNA codificador e não codificante dentro desses genomas também varia muito. Por exemplo, foi originalmente sugerido que mais de 98% do genoma humano não codifica sequências de proteínas, incluindo a maioria das sequências dentro dos íntrons e a maioria do DNA intergênico, [16] enquanto 20% de um genoma procarioto típico é não codificante. [3]

Em eucariotos, o tamanho do genoma e, por extensão, a quantidade de DNA não codificante, não está correlacionado à complexidade do organismo, uma observação conhecida como enigma do valor C. [17] Por exemplo, o genoma do unicelular Polychaos dubium (anteriormente conhecido como Ameba dubia) foi relatado como contendo mais de 200 vezes a quantidade de DNA em humanos. [18] O baiacu Rubricas de Takifugu o genoma tem apenas cerca de um oitavo do tamanho do genoma humano, mas parece ter um número comparável de genes de aproximadamente 90% dos Takifugu genoma é DNA não codificador. [16] Portanto, a maior parte da diferença no tamanho do genoma não se deve à variação na quantidade de DNA codificador, mas sim a uma diferença na quantidade de DNA não codificador. [19]

Em 2013, um novo "recorde" para o genoma eucariótico mais eficiente foi descoberto com Utricularia gibba, uma planta bladderwort que tem apenas 3% de DNA não codificador e 97% de DNA codificador. Partes do DNA não codificante estavam sendo deletadas pela planta e isso sugeria que o DNA não codificador pode não ser tão crítico para as plantas, embora o DNA não codificador seja útil para humanos. [15] Outros estudos em plantas descobriram funções cruciais em porções de DNA não codificantes que antes eram consideradas insignificantes e acrescentaram uma nova camada à compreensão da regulação gênica. [20]

Elementos cis e transregulatórios Editar

Os elementos Cis-reguladores são sequências que controlam a transcrição de um gene próximo. Muitos desses elementos estão envolvidos na evolução e no controle do desenvolvimento. [21] Os elementos cis podem estar localizados em regiões não traduzidas 5 'ou 3' ou dentro de íntrons. Elementos trans-reguladores controlam a transcrição de um gene distante.

Os promotores facilitam a transcrição de um determinado gene e estão tipicamente a montante da região de codificação. As sequências potenciadoras também podem exercer efeitos muito distantes nos níveis de transcrição dos genes. [22]

Edição de íntrons

Os íntrons são seções não codificantes de um gene, transcritas na sequência de mRNA do precursor, mas, em última análise, removidas por splicing de RNA durante o processamento do RNA mensageiro maduro. Muitos íntrons parecem ser elementos genéticos móveis. [23]

Estudos de íntrons do grupo I de Tetrahymena os protozoários indicam que alguns íntrons parecem ser elementos genéticos egoístas, neutros para o hospedeiro porque se removem dos exons flanqueadores durante o processamento do RNA e não produzem um viés de expressão entre os alelos com e sem o íntron. [23] Alguns íntrons parecem ter função biológica significativa, possivelmente por meio da funcionalidade da ribozima que pode regular a atividade de tRNA e rRNA, bem como a expressão do gene codificador de proteínas, evidente em hospedeiros que se tornaram dependentes de tais íntrons durante longos períodos de tempo, por exemplo, a trnL-intron é encontrado em todas as plantas verdes e parece ter sido herdado verticalmente por vários bilhões de anos, incluindo mais de um bilhão de anos nos cloroplastos e 2–3 bilhões de anos adicionais antes nos ancestrais cianobacterianos dos cloroplastos. [23]

Editar Pseudogenes

Pseudogenes são sequências de DNA, relacionadas a genes conhecidos, que perderam sua capacidade de codificação de proteínas ou não são mais expressos na célula. Pseudogenes surgem da retrotransposição ou duplicação genômica de genes funcionais e se tornam "fósseis genômicos" que não são funcionais devido a mutações que impedem a transcrição do gene, como dentro da região promotora do gene, ou fatalmente alteram a tradução do gene, como códons de parada prematuros ou frameshifts. [24] Os pseudogenes resultantes da retrotransposição de um intermediário de RNA são conhecidos como pseudogenes processados, pseudogenes que surgem dos restos genômicos de genes duplicados ou resíduos de genes inativados são pseudogenes não processados. [24] As transposições de genes mitocondriais funcionais do citoplasma para o núcleo, também conhecidos como NUMTs, também se qualificam como um tipo de pseudogene comum. [25] Numts ocorrem em muitos taxa eucarióticos.

Enquanto a Lei de Dollo sugere que a perda de função em pseudogenes é provavelmente permanente, genes silenciados podem realmente reter a função por vários milhões de anos e podem ser "reativados" em sequências codificadoras de proteínas [26] e um número substancial de pseudogenes são ativamente transcritos. [24] [27] Como se presume que os pseudogenes mudam sem restrições evolutivas, eles podem servir como um modelo útil do tipo e das frequências de várias mutações genéticas espontâneas. [28]

Repita sequências, transposons e elementos virais. Editar

Transposons e retrotransposons são elementos genéticos móveis. Sequências repetidas de retrotransposons, que incluem elementos nucleares intercalados longos (LINEs) e elementos nucleares intercalados curtos (SINEs), são responsáveis ​​por uma grande proporção das sequências genômicas em muitas espécies. As sequências Alu, classificadas como um elemento nuclear curto intercalado, são os elementos móveis mais abundantes no genoma humano. Alguns exemplos foram encontrados de SINEs exercendo controle transcricional de alguns genes que codificam proteínas. [29] [30] [31]

As sequências de retrovírus endógenos são o produto da transcrição reversa de genomas de retrovírus nos genomas de células germinativas. A mutação dentro dessas sequências retrotranscritas pode inativar o genoma viral. [32]

Mais de 8% do genoma humano é composto por sequências de retrovírus endógenos (principalmente decaídas), como parte da fração de mais de 42% que é reconhecidamente derivada de retrotransposons, enquanto outros 3% podem ser identificados como restos de transposons de DNA. Espera-se que muito da metade restante do genoma que atualmente não tem uma origem explicada tenha encontrado sua origem em elementos transponíveis que estavam ativos há tanto tempo (& gt 200 milhões de anos) que mutações aleatórias os tornaram irreconhecíveis. [33] A variação do tamanho do genoma em pelo menos dois tipos de plantas é principalmente o resultado de sequências de retrotransposons. [34] [35]

Edição de telômeros

Telômeros são regiões de DNA repetitivo no final de um cromossomo, que fornecem proteção contra a deterioração cromossômica durante a replicação do DNA. Estudos recentes têm mostrado que os telômeros funcionam para ajudar em sua própria estabilidade. RNA contendo repetição telomérica (TERRA) são transcritos derivados de telômeros. TERRA demonstrou manter a atividade da telomerase e alongar as extremidades dos cromossomos. [36]

O termo "DNA lixo" tornou-se popular na década de 1960. [37] [38] De acordo com T. Ryan Gregory, a natureza do DNA lixo foi discutida explicitamente pela primeira vez em 1972 por um biólogo genômico, David Comings, que aplicou o termo a todos os DNAs não codificantes. [39] O termo foi formalizado no mesmo ano por Susumu Ohno, [19] que observou que a carga mutacional de mutações deletérias colocava um limite superior no número de loci funcionais que poderia ser esperado dada uma taxa de mutação típica. Ohno levantou a hipótese de que os genomas dos mamíferos não poderiam ter mais de 30.000 loci sob seleção antes que o "custo" da carga mutacional causasse um declínio inevitável na aptidão e, eventualmente, a extinção. Esta previsão permanece robusta, com o genoma humano contendo aproximadamente 20.000 genes (codificadores de proteínas). Outra fonte para a teoria de Ohno foi a observação de que mesmo espécies intimamente relacionadas podem ter tamanhos de genoma amplamente (ordens de magnitude) diferentes, o que foi apelidado de paradoxo do valor C em 1971. [6]

O termo "DNA lixo" foi questionado sob o argumento de que provoca um forte a priori suposição de não funcionalidade total e alguns recomendaram o uso de terminologia mais neutra, como "DNA não codificador". [39] No entanto, "DNA lixo" permanece um rótulo para as porções de uma sequência do genoma para a qual nenhuma função discernível foi identificada e que, por meio de análise genômica comparativa, não aparece sob nenhuma restrição funcional, sugerindo que a própria sequência não forneceu nenhuma vantagem adaptativa.

Desde o final dos anos 70, tornou-se aparente que a maioria do DNA não codificante em grandes genomas encontra sua origem na amplificação egoísta de elementos transponíveis, sobre os quais W. Ford Doolittle e Carmen Sapienza em 1980 escreveram no jornal Natureza: "Quando um dado DNA, ou classe de DNAs, de função fenotípica não comprovada pode ter evoluído uma estratégia (como a transposição) que garante sua sobrevivência genômica, então nenhuma outra explicação para sua existência é necessária." [40] Pode-se esperar que a quantidade de DNA lixo dependa da taxa de amplificação desses elementos e da taxa na qual o DNA não funcional é perdido. [41] Na mesma edição de Natureza, Leslie Orgel e Francis Crick escreveram que o DNA lixo tem "pouca especificidade e transmite pouca ou nenhuma vantagem seletiva para o organismo". [42] O termo ocorre principalmente na ciência popular e de forma coloquial em publicações científicas, e foi sugerido que suas conotações podem ter atrasado o interesse nas funções biológicas do DNA não codificador. [43]

Algumas evidências indicam que algumas sequências de "DNA lixo" são fontes para a (futura) atividade funcional na evolução por meio da exaptação do DNA originalmente egoísta ou não funcional. [44]

ENCODE Edição do Projeto

Em 2012, o projeto ENCODE, um programa de pesquisa apoiado pelo National Human Genome Research Institute, relatou que 76% das sequências de DNA não codificantes do genoma humano foram transcritas e que quase metade do genoma estava de alguma forma acessível às proteínas regulatórias genéticas como fatores de transcrição. [1] No entanto, a sugestão da ENCODE de que mais de 80% do genoma humano é bioquimicamente funcional foi criticada por outros cientistas, [5] que argumentam que nem a acessibilidade dos segmentos do genoma aos fatores de transcrição nem sua transcrição garantem que esses segmentos têm função bioquímica e que sua transcrição é seletivamente vantajosa. Afinal, seções não funcionais do genoma podem ser transcritas, visto que os fatores de transcrição normalmente se ligam a sequências curtas que são encontradas (aleatoriamente) em todo o genoma. [45]

Além disso, as estimativas muito mais baixas de funcionalidade antes de ENCODE eram baseadas em conservação genômica estimativas em linhagens de mamíferos. [6] [7] [8] [9] A ampla transcrição e o splicing no genoma humano foram discutidos como outro indicador da função genética, além da conservação genômica, que pode perder sequências funcionais mal conservadas. [11] Além disso, muito do DNA lixo aparente está envolvido na regulação epigenética e parece ser necessário para o desenvolvimento de organismos complexos. [4] [13] [14] Abordagens genéticas pode perder elementos funcionais que não se manifestam fisicamente no organismo, abordagens evolutivas têm dificuldades em usar alinhamentos de sequência multiespécies precisos, uma vez que os genomas de espécies estreitamente relacionadas variam consideravelmente, e com abordagens bioquímicas, embora tenham alta reprodutibilidade, as assinaturas bioquímicas nem sempre significam uma função automaticamente. [11] Kellis et al. observou que 70% da cobertura da transcrição foi inferior a 1 transcrição por célula (e pode, portanto, ser baseada na transcrição de fundo espúria). Por outro lado, eles argumentaram que a fração de 12-15% do DNA humano pode estar sob restrição funcional e ainda pode estar subestimada quando restrições específicas da linhagem são incluídas. Em última análise, as abordagens genéticas, evolutivas e bioquímicas podem ser usadas de maneira complementar para identificar regiões que podem ser funcionais na biologia e na doença humana. [11] Alguns críticos argumentaram que a funcionalidade só pode ser avaliada em referência a uma hipótese nula apropriada. Nesse caso, a hipótese nula seria que essas partes do genoma não são funcionais e têm propriedades, seja com base na conservação ou na atividade bioquímica, que seriam esperadas de tais regiões com base em nosso entendimento geral da evolução molecular e bioquímica. De acordo com esses críticos, até que uma região em questão tenha demonstrado ter características adicionais, além do que se espera da hipótese nula, ela deve ser provisoriamente rotulada como não funcional. [46]

Algumas sequências de DNA não codificantes devem ter alguma função biológica importante. Isso é indicado por estudos comparativos de genômica que relatam regiões altamente conservadas de DNA não codificante, às vezes em escalas de tempo de centenas de milhões de anos. Isso implica que essas regiões não codificantes estão sob forte pressão evolutiva e seleção positiva. [47] Por exemplo, nos genomas de humanos e camundongos, que divergiram de um ancestral comum 65-75 milhões de anos atrás, as sequências de DNA codificadoras de proteínas representam apenas cerca de 20% do DNA conservado, com os 80% restantes do DNA conservado representado em regiões não codificantes. [48] ​​O mapeamento de ligação frequentemente identifica regiões cromossômicas associadas a uma doença sem evidência de variantes codificadoras funcionais de genes dentro da região, sugerindo que as variantes genéticas causadoras da doença estão no DNA não codificante. [48] ​​A importância das mutações de DNA não codificantes no câncer foi explorada em abril de 2013. [49]

Polimorfismos genéticos não codificantes desempenham um papel na suscetibilidade a doenças infecciosas, como a hepatite C. [50] Além disso, polimorfismos genéticos não codificantes contribuem para a suscetibilidade ao sarcoma de Ewing, um câncer ósseo pediátrico agressivo. [51]

Algumas sequências específicas de DNA não codificante podem ser características essenciais para a estrutura cromossômica, função do centrômero e reconhecimento de cromossomos homólogos durante a meiose. [52]

De acordo com um estudo comparativo de mais de 300 genomas procarióticos e mais de 30 eucarióticos, [53] os eucariotos parecem exigir uma quantidade mínima de DNA não codificante. O montante pode ser previsto usando um modelo de crescimento para redes genéticas regulatórias, o que implica que é necessário para fins regulatórios. Em humanos, o mínimo previsto é de cerca de 5% do genoma total.

Mais de 10% dos 32 genomas de mamíferos podem funcionar por meio da formação de estruturas secundárias específicas de RNA. [54] O estudo usou a genômica comparativa para identificar mutações compensatórias no DNA que mantêm os pares de bases do RNA, uma característica distintiva das moléculas de RNA. Mais de 80% das regiões genômicas que apresentam evidências evolutivas de conservação da estrutura do RNA não apresentam forte conservação da sequência de DNA.

O DNA não codificador pode talvez servir para diminuir a probabilidade de ruptura do gene durante o cruzamento cromossômico. [55]

Evidência de pontuações poligênicas e edição GWAS

Os estudos de associação do genoma (GWAS) e a análise de aprendizado de máquina de grandes conjuntos de dados genômicos levaram à construção de preditores poligênicos para características humanas, como altura, densidade óssea e muitos riscos de doenças. Existem preditores semelhantes para espécies vegetais e animais e são usados ​​no melhoramento agrícola. [57] A arquitetura genética detalhada dos preditores humanos foi analisada e os efeitos significativos usados ​​na previsão estão associados a regiões de DNA distantes das regiões codificantes. A fração de variância responsável (ou seja, fração do poder preditivo capturado pelo preditor) em regiões de codificação vs. não codificantes varia amplamente para diferentes características complexas. Por exemplo, fibrilação atrial e risco de doença arterial coronariana são controlados principalmente por variantes em regiões não codificantes (fração de variância não codificante acima de 70 por cento), enquanto diabetes e colesterol alto exibem o padrão oposto (variância não codificante de aproximadamente 20-30 por cento ) [56] As diferenças individuais entre humanos são claramente afetadas de forma significativa por loci genéticos não codificantes, o que é uma forte evidência de efeitos funcionais. Genótipos inteiros de exoma (ou seja, que contêm informações restritas apenas às regiões de codificação) não contêm informações suficientes para construir ou mesmo avaliar preditores poligênicos para muitas características complexas e riscos de doença bem estudados.

Em 2013, estimou-se que, em geral, até 85% dos loci GWAS possuem variantes não codificantes como provável associação causal. As variantes são frequentemente comuns em populações e foi previsto que afetassem os riscos de doenças por meio de pequenos efeitos fenotípicos, em oposição aos grandes efeitos das variantes de Mendel. [58]

Algumas sequências de DNA não codificantes determinam os níveis de expressão de vários genes, tanto aqueles que são transcritos para proteínas quanto aqueles que estão envolvidos na regulação gênica. [59] [60] [61]

Fatores de transcrição Editar

Algumas sequências de DNA não codificantes determinam onde os fatores de transcrição se ligam. [59] Um fator de transcrição é uma proteína que se liga a sequências de DNA não codificantes específicas, controlando assim o fluxo (ou transcrição) da informação genética do DNA para o mRNA. [62] [63]

Edição de Operadores

Um operador é um segmento de DNA ao qual um repressor se liga. Um repressor é uma proteína de ligação ao DNA que regula a expressão de um ou mais genes ligando-se ao operador e bloqueando a ligação da RNA polimerase ao promotor, evitando assim a transcrição dos genes. Esse bloqueio de expressão é chamado de repressão. [64]

Edição de Enhancers

Um intensificador é uma região curta do DNA que pode ser ligada a proteínas (fatores de ação trans), bem como um conjunto de fatores de transcrição, para aumentar os níveis de transcrição de genes em um agrupamento de genes. [65]

Editar Silenciadores

Um silenciador é uma região do DNA que inativa a expressão gênica quando ligada por uma proteína reguladora. Funciona de forma muito semelhante aos potenciadores, diferindo apenas na inativação de genes. [66]

Edição de promotores

Um promotor é uma região do DNA que facilita a transcrição de um determinado gene quando um fator de transcrição se liga a ele. Os promotores estão normalmente localizados perto dos genes que regulam e a montante deles. [67]

Edição de Isoladores

Um isolante genético é um elemento de fronteira que desempenha dois papéis distintos na expressão do gene, seja como um código de bloqueio do intensificador ou, raramente, como uma barreira contra a cromatina condensada. Um isolante em uma sequência de DNA é comparável a um divisor de palavras linguísticas, como uma vírgula em uma frase, porque o isolador indica onde termina uma sequência reforçada ou reprimida. [68]

Evolution Edit

Shared sequences of apparently non-functional DNA are a major line of evidence of common descent. [69]

Pseudogene sequences appear to accumulate mutations more rapidly than coding sequences due to a loss of selective pressure. [28] This allows for the creation of mutant alleles that incorporate new functions that may be favored by natural selection thus, pseudogenes can serve as raw material for evolution and can be considered "protogenes". [70]

A study published in 2019 shows that new genes (termed de novo gene birth) can be fashioned from non-coding regions. [71] Some studies suggest at least one-tenth of genes could be made in this way. [71]

Long range correlations Edit

A statistical distinction between coding and non-coding DNA sequences has been found. It has been observed that nucleotides in non-coding DNA sequences display long range power law correlations while coding sequences do not. [72] [73] [74]

Forensic anthropology Edit

Police sometimes gather DNA as evidence for purposes of forensic identification. As described in Maryland v. King, a 2013 U.S. Supreme Court decision: [75]

The current standard for forensic DNA testing relies on an analysis of the chromosomes located within the nucleus of all human cells. 'The DNA material in chromosomes is composed of "coding" and "non-coding" regions. The coding regions are known as genes and contain the information necessary for a cell to make proteins. . . . Non-protein coding regions . . . are not related directly to making proteins, [and] have been referred to as "junk" DNA.' The adjective "junk" may mislead the lay person, for in fact this is the DNA region used with near certainty to identify a person. [75]


More Clues that Intergenic DNA Is Functional

You&rsquore an enzyme of RNA polymerase floating in the nucleus of a cell. Your job is to transcribe a gene, but you are blind and it&rsquos dark. Other machines guide you to a promoter, where your work begins, but how do you know which direction to read?

Two recent papers add more insight to the wondrous design of DNA transcription. Both papers recognize that protein-coding genes represent only a tiny part, about 3%, of the DNA in a cell. The looming question that the ENCODE project began to answer last year is, how much of that intergenic DNA is functional? Since most of it is transcribed (a process that requires the expenditure of energy), the cell presumably performs all that work for a reason.

The first paper, published in Natureza, examined how RNA polymerase (RNAP) knows which way to begin transcription. Gene starts are designated by &ldquopromoter&rdquo regions, but from that point, RNAP can read either direction on either fork, once the double helix is unwound. The authors found that two DNA segments, working against each other, regulate the reading of genes and non-genes.

One, named PAS, controls whether a polyadenylation tail (a series of adenines, or &ldquoA&rdquo letters in the code), is added to the growing messenger RNA (mRNA). For genes, that tail prepares the mRNA for export from the nucleus. For intergenic transcripts, though, polyadenylation signals other enzymes to cleave it into small transcripts.

The other sequence, named U1 snRNP, controls whether the mRNA is cleaved after transcription by suppressing polyadenylation. When present, it allows RNAP to proceed uninterrupted.

Gene regions are rich in U1 snRNP but low in PAS. The reverse is true for intergenic regions. The authors believe this is how RNAP avoids excessive transcribing of non-coding DNA. The shortened, cleaved transcripts, like lincRNAs, stay in the nucleus to perform other functions. A report from MIT explains how these sequences offset each other:

The work demonstrates the important role of U1 snRNP in protecting mRNA as it is transcribed from genes and in preventing the cell from unnecessary copying of non-protein-coding DNA, says Gideon Dreyfuss, a professor of biochemistry and biophysics at the University of Pennsylvania School of Medicine.

&ldquoThey&rsquove identified a very likely mechanism for early termination of these upstream RNAs by depriving them of U1 snRNP suppression of polyadenylation and cleavage,&rdquo says Dreyfuss, who was not part of the research team.

The authors of the Natureza paper, though, remained undecided about the roles of these upstream, intergenic transcripts:

o função of all of this upstream noncoding RNA is still a subject of much investigation. &ldquoThat transcriptional process could produce an RNA that has some function, or it could be a product of the nature of the biochemical reaction. Isto será debated for a long time,&rdquo Sharp says.

His lab is now exploring the relationship between this transcription process and the observation of large numbers of so-called long noncoding RNAs (lncRNAs). He plans to investigate the mechanisms that control the synthesis of such RNAs and try to determine their functions. (Emphasis added.)

In their paper, the authors toss in a Darwinian speculation. They proposed that upstream antisense RNAs (uaRNA), or RNAs transcribed in the &ldquowrong&rdquo direction, might represent ancestors of protein-coding genes, and that lncRNAs are intermediate forms that gained or lost U1 snRNP and polyadenylation sequences. They found some differences in U1 snRNP counts between orthologous regions in human and mouse genomes as support for the idea.

This hypothesis, though, seems absurd for several reasons. For one, how or why would a non-functional transcript acquire a function? Before it had a function, why would it be transcribed and conserved? Natural selection cannot act to &ldquostore up&rdquo variations in hopes of finding a future function. Functional protein sequences, as William Dembski and Robert Marks have shown, represent a tiny fraction of sequence space. Imagining that a blind, unguided process would find one of them seems optimistic to the point of being ridiculous. The authors did not pursue their wishful thinking in detail, but rather dropped the subject after a brief mention, focusing primarily on the &ldquoU1-PAS axis&rdquo as having &ldquowide use as a general mechanism para regulate transcription elongation in mammals.&rdquo Regulation por um mechanism is the language of design.

A second paper, in PLoS Genetics, is more confident that the intergenic transcripts are functional. Confirming what ENCODE found last year (that at least 85% of intergenic regions are transcribed and regulated), these authors believe functions are soon to be discovered in the forest of intergenic DNA. The Abstract says:

Known protein coding gene exons compose less than 3% of the human genome. o remaining 97% is largely uncharted territory, with only a small fraction characterized. The recent observation of transcription in this intergenic territory has stimulated debate about the extent of intergenic transcription and whether these intergenic RNAs are functional. Aqui nós directly observed with a large set of RNA-seq data covering a wide array of human tissue types that the majority of the genome is indeed transcribed, corroborating recent observations by the ENCODE project. Furthermore, using de novo transcriptome assembly of this RNA-seq data, we found that intergenic regions encode far more long intergenic noncoding RNAs (lincRNAs) than previously described, helping to resolve the discrepancy between the vast amount of observed intergenic transcription and the limited number of previously known lincRNAs. In total, we identified tens of thousands of putative lincRNAs expressed at a minimum of one copy per cell, significantly expanding upon prior lincRNA annotation sets. These lincRNAs are specifically regulated and conserved rather than being the product of transcriptional noise. In addition, lincRNAs are strongly enriched for trait-associated SNPs suggesting a new mechanism by which intergenic trait-associated regions may function. These findings will enable the discovery and interrogation of novel intergenic functional elements.

The clear implication is that lincRNAs are functional, else why would the cell regulate them and ensure their conservation? The authors&rsquo optimism continues in their Introduction:

A large fraction of the human genome consists of intergenic sequence. Once referred to as &ldquojunk DNA&rdquo, it is now clear that functional elements exist in intergenic regions. In fact, genome wide association studies have revealed that approximately half of all disease and trait-associated genomic regions are intergenic. While some of these regions may função solely as DNA elements, it is now known that intergenic regions can be transcribed, e um growing list of functional noncoding RNA genes within intergenic regions has emerged.

What do we know about lincRNA functions at this time?

Long intergenic noncoding RNAs (lincRNAs) are defined as intergenic (relative to current gene annotations) transcripts longer than 200 nucleotides in length that lack protein coding capacity. LincRNAs are known to perform myriad functions through diverse mechanisms ranging from the regulation of epigenetic modifications and gene expression to acting as scaffolds para protein signaling complexes.

Since these authors found significantly more lincRNAs in their survey than previously known, the implication is that more of those &ldquomyriad functions&rdquo are waiting to be found. (For more functions already discovered, see the lncRNA blog.) Here&rsquos their concluding statement:

Owing to the extended breadth of tissues sampled and relaxed constraints on transcript structure, we find significantly more lincRNAs than all previous lincRNA annotation sets combined. Our analyses revealed that these lincRNAs display many features consistent with functionality, contrasting prior claims that intergenic transcription is primarily the product of transcriptional noise. In sum, our findings corroborate recent reports of pervasive transcription across the human genome and demonstrate that intergenic transcription results in the production of a large number of previously unknown lincRNAs. We provide this vastly expanded lincRNA annotation set as an important resource for the study of intergenic functional elements in human health and disease.

It&rsquos clear that the search for function is driving this cutting-edge research. Search for function is exactly what intelligent-design science would recommend. Darwinians describe natural selection as a tinkerer, generating useless parts as well as structures cobbled together that might do something by chance, since there is no supervising designer to guide the process in a particular way. By contrast, intelligent design expects that what exists, as the product of mind, is there for a reason.

Remember how Darwinists call ID a &ldquoscience stopper,&rdquo since it supposedly counsels just giving up and saying, &ldquoGod did it&rdquo? The real science stopper is Darwinism. It focused only on protein-coding genes and dismissed everything else as &ldquotranscriptional noise&rdquo or &ldquojunk DNA&rdquo left behind by the blind tinkerer. Why waste time studying junk? Were it not for that attitude, our understanding of intergenic DNA function might have been much farther along by now.


Resumo

Long intergenic non-coding RNA (lincRNA) genes have diverse features that distinguish them from mRNA-encoding genes and exercise functions such as remodelling chromatin and genome architecture, RNA stabilization and transcription regulation, including enhancer-associated activity. Some genes currently annotated as encoding lincRNAs include small open reading frames (smORFs) and encode functional peptides and thus may be more properly classified as coding RNAs. lincRNAs may broadly serve to fine-tune the expression of neighbouring genes with remarkable tissue specificity through a diversity of mechanisms, highlighting our rapidly evolving understanding of the non-coding genome.


Which are found in non coding sections of DNA?

Não-coding DNA sequences are componentes of an organism's DNA that do not encode protein sequences. Algum não-coding DNA is transcribed into functional não-codificação RNA molecules (e.g. transfer RNA, ribosomal RNA, and regulatory RNAs).

One may also ask, what are the coding regions of DNA called? Coding DNA sequences are separated by long regions of DNA called introns that have no apparent function. Coding DNA é também conhecido como an exon.

Likewise, people ask, why do you have non coding areas of DNA?

Some introns posso regulate transfer RNA and ribosomal RNA activity and proteína-coding gene expressão. A very important não-codificação sequência de DNA is called a telomere, which é uma região of repetitive DNA at the end of a chromosome and protects coding DNA from being lost during cell division.


Genomic Variation between Organisms

The amount of total genomic DNA varies widely between organisms, and the proportion of coding and noncoding DNA within these genomes varies greatly as well. More than 98% of the human genome does not encode protein sequences, including most sequences within introns and most intergenic DNA. While overall genome size, and by extension the amount of noncoding DNA, are correlated to organism complexity, there are many exceptions. For example, the genome of the unicellular Polychaos dubium (formerly known as Amoeba dubia) has been reported to contain more than 200 times the amount of DNA in humans. The pufferfish Takifugu rubripes genome is only about one eighth the size of the human genome, yet seems to have a comparable number of genes approximately 90% of the Takifugu genome is noncoding DNA.

In 2013, a new &ldquorecord&rdquo for most efficient genome was discovered. Utricularia gibba, a bladderwort plant, has only 3% noncoding DNA. The extensive variation in nuclear genome size among eukaryotic species is known as the C-value enigma or C-value paradox. Most of the genome size difference appears to lie in the noncoding DNA. About 80 percent of the nucleotide bases in the human genome may be transcribed, but transcription does not necessarily imply function.

Figura ( PageIndex <1> ): Utricularia gibba flower: Utricularia gibba has 3% noncoding DNA, which is low for flowering plants. This 3% has given this plant the title the &lsquomost efficient&rsquo genome.



Comentários:

  1. Rey

    Em vez de críticas, escreva as variantes.

  2. Khristian

    Não se engane a esse respeito.

  3. Ea

    Eu aqui sou casual, mas fui especialmente registrado em um fórum para participar da discussão desta questão.

  4. Santiago

    Que excelente pergunta

  5. Nalkis

    And what would we do without your very good idea



Escreve uma mensagem