Em formação

Link entre macro lncRNA e looping de DNA

Link entre macro lncRNA e looping de DNA


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Gostaria de saber se alguém conhece alguma publicação sobre macro lncRNA (RNAs não replicados muito longos) ou mais geralmente um RNA transcrito que pode levar a cis-DNA looping de regiões genômicas sobrepostas pelo (macro) lncRNA transcrito?

Obrigado


Uma pedra angular para ncRNA

Um relatório sobre o simpósio Keystone 'Non-coding RNAs' realizado em Snowbird, Utah, EUA, de 31 de março a 5 de abril de 2012.

Era uma vez o RNA se encaixava perfeitamente no dogma central como um mensageiro entre o DNA e a proteína. Nos últimos 50 anos, as moléculas de RNA surgiram continuamente como reguladores dinâmicos e versáteis do genoma. Nossa compreensão moderna de RNAs não codificantes (ncRNAs) pode parecer uma bagunça entrelaçada de moléculas, mas coletivamente elas exibem arquitetura e coordenação, levando à regulação elegantemente coreografada de DNA e proteína pelo RNA. O papel emergente do RNA como um orquestrador ressonou durante todo o simpósio inaugural da Keystone sobre ncRNAs, com muitos exemplos de ncRNAs longos (lncRNAs) tendo papéis críticos em várias vias biológicas. Depois da reunião, ficou claro que mais surpresas emergiriam da 'matéria escura' do genoma.

O discurso de Nick Proudfoot (University of Oxford) preparou o cenário ao descrever como as regiões mais classicamente estudadas do genoma, como o locus da β-globina, estão agora emergindo como sendo primorosamente reguladas pelo RNA. Especificamente, Proudfoot resumiu anos de trabalho mostrando como o ato de transcrição por meio de regiões não codificantes e, principalmente, onde ocorre a terminação da transcrição, regula a dinâmica epigenética do locus. Curiosamente, a transcrição convergente pela RNA polimerase II (RNA pol II) pode servir como substrato para recrutar Dicer e outros fatores da maquinaria de RNA de interferência (RNAi). Da mesma forma, Robert Martienssen (Cold Spring Harbor Laboratory) apresentou uma interação entre a atividade de RNA / DNA polimerase e RNAi no estabelecimento de domínios heterocromáticos. A dependência do RNAi co-transcricional permite a liberação de RNA polimerase e evita a colisão com a maquinaria centromérica de replicação do DNA. Juntos, esses estudos demonstram a necessidade não apenas de identificar lncRNAs envolvidos no estabelecimento epigenético, mas também de compreender muitas camadas de regulação simultâneas e interligadas.


O transcriptoma humano não codificador revela um mapa de 'não codarnia'

Thomas Gingeras (Cold Spring Harbor Laboratory) forneceu uma visão geral da complexidade do transcriptoma humano resultante dos esforços do consórcio ENCODE. O mapa transcriptômico ganhou resolução sem precedentes, revelando que 76% do nosso genoma é transcrito. Com uma média de aproximadamente oito transcrições por região gênica, a riqueza de ENCODE redefiniu a hipótese de 'um gene - uma função' em 'muitas transcrições - uma função', ou possivelmente muitas. Usando conjuntos de dados e abordagens complementares, Piero Carninci e o Riken OMICs Center forneceram novos insights sobre a regulação do promotor lncRNA. Por mapeamento preciso dos limites 5 '7-metil guanosina no RNA, o grupo descobriu que 6 a 30% dos locais de início 5' de transcritos de camundongos e humanos iniciam dentro de elementos repetitivos. Notavelmente, mais de 250.000 locais de início da transcrição derivados de retrotransposons mostram expressão específica para tecidos e compartimentos celulares.

Leonard Lipovich (Wayne State University) e colegas adicionaram 6.000 lncRNAs a este catálogo examinando clones de cDNA humanos não classificados e seus perfis de expressão para determinar se esses lncRNAs contribuem para fenótipos de doenças neurológicas. Eles descobriram que certos lncRNAs específicos de primatas e não conservados são expressos diferencialmente em regiões do cérebro que apresentam altos níveis de atividade. Alguns desses lncRNAs, anti-sentido para genes codificadores de proteínas, podem regular a expressão de seus vizinhos. Tecendo a complexidade do transcriptoma com a complexidade do desenvolvimento e cognição do corpo dos mamíferos, John Mattick (Garvan Institute of Medical Research) apresentou exemplos que enfatizaram a necessidade de entender melhor a diversidade dos lncRNAs. Investigar as profundezas da 'matéria escura no genoma' usando métodos de enriquecimento de captura revelou não apenas numerosos novos lncRNAs e suas isoformas, mas também isoformas de mRNAs codificadores de proteínas bem estudados, como o p53. Foi demonstrado que centenas de lncRNAs mudam durante a diferenciação de células-tronco e têm estabilidade de transcrição semelhante aos mRNAs, e muitos estão associados a complexos epigenéticos, sugerindo que essa complexidade não pode ser descartada. em massa como ruído transcricional.


Características do lncRNA

Comprimento

Como discutido acima, os transcritos não codificantes que não codificam proteínas e têm mais de 200 nucleotídeos de comprimento são conhecidos como RNAs não codificantes longos (lncRNAs). O comprimento de um lncRNA pode ser maior que 2 Kb, enquanto seu potencial de codificação é menor que 100 aminoácidos [5]. Kaur e colegas mostraram que no genoma humano 20% do progresso transcricional estaria associado a genes codificadores de proteínas. Esta informação ilustra que os lncRNAs são quatro vezes mais longos do que a sequência codificadora do RNA [5].

Localização no genoma

Os lncRNAs são armazenados principalmente em regiões mal conservadas do genoma, incluindo as regiões intrônicas dos genes [51]. Além disso, alguns lncRNAs são relatados para serem transcritos de uma das fitas de uma sequência de DNA [61] dentro do locus de codificação de proteína. As localizações genômicas dos lncRNAs têm associação direta com sua conservação evolutiva [52, 53]. Resultados de pesquisas e discussões científicas sugerem que grande quantidade de lncRNAs é conservada evolutivamente [54], embora em menor grau em comparação com os genes codificadores de proteínas [55]. Curiosamente, as regiões promotoras dos lncRNAs são mais conservadas em comparação com a sequência dos lncRNAs [56]. A presença de quadros de leitura abertos em alguns lncRNAs torna essas moléculas difíceis de distinguir dos RNAs codificadores de proteínas [17]. O gene lncRNA 'X Inactive Specific Transcript' (ou Xist), responsável pela inativação do cromossomo X, é um exemplo de lncRNA localizado dentro de uma região menos conservada no genoma [81].

Açao

Diferentes famílias de lncRNAs exercem diversos modos de ação para a regulação da expressão gênica e síntese de proteínas. Esses RNAs não codificantes (ncRNAs) podem atuar como andaimes em domínios subnucleares ou podem possuir estruturas secundárias para interagir com DNA, RNA e proteína (http://www.exiqon.com/lncRNA). Longos RNAs não codificantes têm expressão específica para células. Foi relatado que a transcrição de lncRNAs individuais ocorre em um momento específico, portanto, eles podem servir como sinais moleculares para responder a diversos estímulos [103].

Cis- e trans-regulando a ação

A categoria específica de RNAs que exibem complementaridade de sequência com outros transcritos de RNA é conhecida como transcritos antisense naturais (NATs). o trans-NATs e seus respectivos alvos estão fisicamente localizados em diferentes loci no genoma, como miRNAs. Enquanto o cis-NATs e seus alvos estão localizados no mesmo locus, mas em fitas opostas do DNA. Esses cis-NATs foram primeiramente identificados em vírus, depois em procariotos e, finalmente, em eucariotos. Em eucariotos (exceto nematóides), aproximadamente 5–29% das unidades de transcrição estão envolvidas na sobreposição [51]. o cis-Os NATs são transcritos pela RNA polimerase II, que mostra seu envolvimento no processamento do mRNA. A interação dos transcritos com sentido e anti-sentido sugere o papel dos NATs na regulação da expressão gênica. Além disso, também foi relatado que no caso de formação de híbridos de RNA e transcrição de locus gênico em ambas as orientações também pode induzir o silenciamento do gene ou pode desencadear uma resposta imune [108].

Comparação com miRNA

miRNAs e lncRNAs, ambos são não codificantes por natureza. miRNAs são

22 nucleotídeos de comprimento em comparação com lncRNAs 8–10 vezes mais longos. As funções exatas dos lncRNAs ainda não estão claras, mas foi relatado que tanto miRNA quanto lncRNAs atuam como reguladores para controlar processos biológicos na repressão pós-transcricional de genes codificadores de proteínas [101, 102, 105]. Além disso, lncRNAs também podem atuar como esponjas de miRNA e podem reduzir seu efeito regulatório sobre o mRNA [78]. A detecção experimental do genoma humano identificou aproximadamente 2.000 miRNAs diferentes e cerca de 50.000 lncRNAs [15, 21, 34].


Formação e distribuição de R-loop

R-loops são estruturas de três fitas que consistem em um híbrido de RNA & # x02013DNA e a fita deslocada de DNA (Fig. 1, círculos vermelhos). Os recursos do R-loop foram amplamente discutidos em várias análises excelentes 2,5,6,17. Resumidamente, as estruturas de três fitas são tipicamente, mas não exclusivamente, ligadas à transcrição contínua e, até recentemente, eram consideradas meros & # x02019 subprodutos & # x02019 de transcrição que ocorrem exclusivamente em cis, no local da transcrição. O superenrolamento negativo e, portanto, a tendência aumentada para fusão do DNA (separação da fita) que ocorre atrás da RNA polimerase fornece uma oportunidade ideal para o transcrito nascente se anelar com a fita modelo complementar e formar um R-loop. Embora os híbridos de RNA & # x02013DNA sejam continuamente formados dentro da bolha de transcrição da RNA polimerase, é improvável que os R-loops sejam simplesmente uma extensão deste híbrido limitado, mas se formem por meio da re-invasão da extremidade 5 & # x02019 do RNA ( Figura 1 ). Isso é apoiado pela estrutura do complexo de RNA polimerase demonstrando que RNA e DNA são extrudados do complexo em diferentes canais de saída, o que impediria um R-loop de simplesmente ser estendido 28. Além disso, um estudo recente demonstrou que a formação eficiente de R-loops co-transcricionais requer uma extremidade de RNA livre e uma inclinação GC (assimetria na distribuição de guaninas e citosinas entre as fitas, ver abaixo) 29. Híbridos de RNA & # x02013DNA também podem formar em trans quando o RNA é produzido em um local espacialmente distinto (Fig. 1) 30.

A metodologia para a detecção de híbridos de RNA & # x02013DNA tem sido crucial para entender como os loops R são regulados e para mapear onde e quando eles se formam no genoma. Embora a ferramenta predominante para detectar híbridos de RNA & # x02013DNA tenha sido o anticorpo S9.6 específico de híbrido monoclonal 31, reagentes e técnicas alternativas surgiram. Versões catalíticas mortas da ribonuclease H1 (RNase H1 uma enzima que pode degradar a fração de RNA de híbridos de RNA & # x02013DNA), 29,32 ou o domínio de ligação de híbrido RNase H1 fundido a uma proteína fluorescente 33 podem ser usados ​​como sensores híbridos. Resumos abrangentes dessas abordagens, juntamente com uma discussão de suas vantagens e desvantagens, estão disponíveis nas referências. 3,5,34. Embora haja um consenso geral sobre onde os híbridos se acumulam, as discrepâncias entre os estudos podem ser devidas a diferentes métodos de detecção de híbridos. Uma característica conservada dos R-loops é sua natureza transitória. Isso foi apontado pela primeira vez em um estudo usando levedura de brotamento, que demonstrou que somente após a perda de ambas as enzimas RNase H poderia ser detectada uma coloração nuclear uniformemente distribuída de híbridos de RNA & # x02013DNA 35. Isso indicou que híbridos surgem com frequência, mas são rapidamente removidos, pelo menos em parte, por RNase H. Subseqüentemente, além de RNase H, várias helicases demonstraram contribuir para a resolução de híbridos, revisado na ref 3. A coloração S9.6 dispersa ao longo do núcleo também sugeriu que os híbridos de RNA & # x02013DNA estavam se formando em vários loci ao longo do genoma 35. Essas previsões foram verificadas quando o sequenciamento de todo o genoma de loci hospedeiros de híbridos em leveduras revelou uma distribuição generalizada, incluindo uma forte presença em retrotransposons, telômeros e genes altamente expressos, como o RNA ribossômico e loci de tRNA e outros ncRNAs estruturados (Fig. 2 )

R-loops foram mapeados em todo o genoma em várias espécies. O preditor mais prevalente da presença do loop R é a alta atividade transcricional, de fato, os loops R são encontrados nas regiões promotoras, onde promovem a transcrição por indução da desmetilação do DNA, e nas regiões de terminação da transcrição, onde promovem a terminação da transcrição. Outras características das áreas ricas em R-loop incluem alto conteúdo de GC e inclinação de GC, estruturas g-quadruplex (G4), transcrição antisense e regiões onde as máquinas de replicação e transcrição colidem. Híbridos de RNA & # x02013DNA (e talvez R-loops) também se formam em locais de danos ao DNA, particularmente em quebras de fita dupla (DSBs), onde promovem o reparo mediado por recombinação homóloga (HR) por meio do recrutamento da proteína 1 de susceptibilidade ao câncer de mama ( BRCA1). ncRNA, RNAs não codificantes snoRNAs, pequenos RNAs nucleolares rDNA, DNA ribossomal.

R-loops são consideravelmente enriquecidos em genes associados à transcrição anti-sentido e recentemente foi demonstrado que promovem diretamente a expressão anti-sentido 36 & # x0201338 (Fig. 2), sugerindo que eles têm um papel regulador na expressão gênica (ver abaixo). Embora um estudo, que incluiu o tratamento com nuclease S1 como parte do protocolo DRIP para estabilizar híbridos por meio da remoção da fita deslocada, indicou que a inclinação AT e especialmente os tratos poli (A) podem ser pontos críticos de formação de loop R 37, o consenso geral foi que, no fermento, a sequência per se não é um determinante crucial da acumulação do laço R, mas sim a taxa de transcrição no locus. De fato, um locus pobre em R-loop pode ser convertido em um locus rico em R-loop, simplesmente aumentando as taxas de transcrição por meio da alteração dos promotores 37. Há uma tendência de sequências ricas em GC abrigarem mais R-loops, no entanto, o mesmo estudo revelou que genes ricos em GC foram tipicamente mais expressos em leveduras 36. Em células de mamíferos, a inclinação de GC favorece fortemente a formação de loop R (ver abaixo) (Fig. 2). No entanto, os genomas de levedura não exibem muita distorção de GC, além dos telômeros. Em plantas, ambas as regiões com inclinação GC ou inclinação AT são enriquecidas em R-loops 39. A ligação entre altos níveis de expressão e R-loops sugere que as altas taxas de transcrição promovem o acúmulo de R-loop ou que R-loops promovem altas taxas de transcrição. Pode-se também imaginar um loop de feedback positivo pelo qual a transcrição resulta no acúmulo de loop R, o que promove mais transcrição. Por outro lado, é importante ter em mente que os R-loops são conhecidos por serem potentes inibidores da transcrição e levam ao bloqueio da polimerase 10. A relação contraditória entre R-loops e transcrição sugere que um controle rígido da persistência do R-loop (meia-vida) é necessário para sustentar altas taxas de transcrição, ou que existe uma separação espacial entre R-loops e quadros de leitura abertos.

Um estudo em levedura encontrou pouca sobreposição genômica entre hotspots R-loop e a localização de uma subunidade de RNA polimerase II (Pol II) 36. Isso revelou que o mapeamento do R-loop por DRIP com o anticorpo S9.6 não estava documentando exclusivamente a transcrição em curso, mas sim que alguns R-loops podem persistir, ou ser formados, pós-transcricionalmente. Esta foi uma indicação inicial de que os R-loops podem ser mais do que meros subprodutos da transcrição e sugeriu que os híbridos podem se formar independentemente da transcrição, ou seja, em trans, ou influenciar a transcrição à distância.

Semelhante à levedura, em células humanas e em plantas, os R-loops se acumulam em sequências repetitivas, como elementos transponíveis, DNA ribossômico, centrômeros e telômeros 32,39 & # x0201341 (Fig. 2). Surpreendentemente, em humanos e plantas, eles também são proeminentes em regiões promotoras que abrigam ilhas CpG (CGIs) 29,32,39,42 (Fig. 2). Os CGIs estão presentes nos promotores de aproximadamente 60% dos genes humanos. Uma característica dos CGIs é a presença de uma inclinação positiva de GC: enriquecimento de guanina sobre citosina na fita não-molde, a jusante do local de início da transcrição (TSS). Uma localização mais precisa do R-loop dentro das regiões promotoras revelou que R-loops são geralmente restritos entre o TSS e o primeiro íntron & # x02013exon junção 43. Em geral, uma forte distorção de GC se correlaciona com alta expressão gênica e com enriquecimento de R-loop. O acúmulo de R-loops desta maneira específica para a sequência pode ser devido às propriedades de ligação termodinâmica particularmente fortes do RNA rico em G a uma sequência complementar 44,45. Além disso, a presença de estruturas secundárias de DNA, como G-quadruplexes (G4s) no DNA deslocado pode contribuir para a estabilidade da alça R 46 (Fig. 1), seja impedindo o acesso de proteínas de resolução da alça R ou diminuindo o re- capacidade de recozimento do DNA. Um recente em vitro estudo usando microscopia de força atômica indicou que R-loops podem atingir estruturas secundárias independentemente da presença de G4 47. Essas estruturas secundárias são formadas na fita de DNA deslocada e incluem & # x02018blobs & # x02019, & # x02018spurs & # x02019 e & # x02018loops & # x02019. Esses objetos & # x02018R-loop & # x02019 impõem restrições físicas locais no DNA circundante, por exemplo, dobrando o DNA. Uma possibilidade fascinante é que os objetos R-loop poderiam codificar informações regulatórias de ordem superior, por exemplo, recrutando diferentes modificadores de cromatina. No futuro, seria importante confirmar se tais objetos R-loop existem em um contexto de cromatina na Vivo.

A forte presença de R-loops dentro de promotores de genes foi uma primeira indicação de que essas estruturas podem ter importantes funções regulatórias de genes. Em adição às regiões promotoras, estudos de todo o genoma encontraram considerável enriquecimento de R-loops em locais de terminação da transcrição, especialmente aqueles com distorção de GC. Isso está de acordo com a função proposta das alças R na promoção da terminação da transcrição 48,49. Finalmente, os híbridos são produzidos em locais de dano ao DNA, incluindo telômeros disfuncionais e DSBs (Fig. 2), e têm funções importantes na coordenação do reparo do DNA (revisado em 5 e discutido abaixo).

R-loops têm sido considerados subprodutos acidentais da transcrição, prejudiciais à fisiologia celular e apenas uma fonte de instabilidade genômica quando não removidos adequadamente 5,6. No entanto, descobriu-se recentemente que existe uma classe de laços R & # x02018regulatórios & # x02019 benéficos, que têm um papel essencial em uma variedade de processos biológicos. R-loops regulatórios aproveitam a especificidade da sequência do basepairing de RNA-DNA para repelir cofatores ou direcioná-los para loci cromossômicos distintos.Um exemplo primordial, de procariotos, é o sistema CRISPR (Clusters de Repetições Palindrômicas Curtas com Intercalação Regular) & # x02013Cas9, que evoluiu nas bactérias como um mecanismo de defesa natural para reconhecer e destruir elementos de DNA estranhos de origem viral 50,51. O DNA viral que foi integrado em uma matriz CRISPR no genoma bacteriano é transcrito e associado à nuclease Cas9. O complexo Cas9 & # x02013RNA forma um R-loop com uma sequência correspondente no DNA viral invasor e gera uma quebra de DNA, que eventualmente resulta na destruição do DNA viral. Este módulo agora foi aproveitado como uma ferramenta de edição de genes altamente precisa e facilmente projetada usando RNAs-guia para direcionar Cas9 a uma sequência específica no genoma, um processo que envolve a formação de R-loop em trans 52,53 .

Os primeiros exemplos de R-loops regulatórios endógenos em eucariotos vieram de estudos sobre recombinação de troca de classe no locus da cadeia pesada de Ig 54. R-loops que se formam dentro das regiões de troca ricas em G promovem deleções baseadas em recombinação e conduzem a diversidade de classes de anticorpos 55,56. Um switch baseado em recombinação semelhante que ocorre no locus da glicoproteína de superfície variante (VSG) durante a evasão imune em tripanossomas também é regulado por loop R 57. A especificidade de sequência de híbridos de RNA & # x02013DNA posiciona loops R como reguladores candidatos principais da expressão gênica por meio do direcionamento preciso do promotor e das sequências de terminação (Fig. 2).


Introdução

Os adipócitos brancos são responsáveis ​​pelo armazenamento de energia, enquanto os adipócitos marrons e bege são especializados na oxidação de combustível e gasto de energia. Um grande progresso foi feito no delineamento do controle molecular do desenvolvimento específico de linhagem de adipócitos brancos, marrons e bege (1-3), remodelação e inflamação do tecido adiposo (4-6), gasto de energia termogênica (7-9) e mais recentemente, as funções endócrinas emergentes da gordura marrom e bege (10,11). O aumento da termogênese adiposa está frequentemente associado a um perfil metabólico melhorado. A termogênese da gordura marrom e bege é mediada pelo desacoplamento de mecanismos dependentes de proteína 1 (UCP1) e independentes de UCP1, o último inclui o ciclo do substrato de creatina (12–14) e o ciclo fútil de cálcio (15). Além da termogênese, as gorduras marrom e bege exercem seus efeitos na fisiologia metabólica por meio da secreção de fatores endócrinos e exossomos contendo microRNAs que atuam em outros tecidos do corpo (10,11,16). Neuregulina 4 (Nrg4) é um fator secretado enriquecido com gordura marrom que atenua a lipogênese hepática e lesão hepática (17-19), enquanto microRNAs encapsulados em exossomos são liberados por adipócitos marrons e podem servir como mensageiros importantes para a interferência entre tecidos (20, 21). O tecido adiposo é densamente inervado por fibras nervosas simpáticas (22–24). Trabalhos recentes também esclarecem os mecanismos que governam a inervação simpática adiposa e a plasticidade (25-28).

RNAs não codificantes longos (lncRNAs) estão emergindo como reguladores importantes da sinalização celular e da expressão gênica em vários tipos de células. Os lncRNAs são transcritos de RNA longos (& gt200 bp) que não codificam proteínas. Muitos lncRNAs contêm um cap 5 ′, vários exons e poliadenilação 3 ′ (29). Alguns desses transcritos são intergênicos, enquanto outros são gerados a partir de regiões genômicas próximas ou parcialmente sobrepostas a genes codificadores de proteínas. Dependendo da posição relativa com os genes codificadores próximos, lncRNAs podem ser geralmente categorizados em lncRNAs intergênicos, antisense, divergentes, intrônicos e potenciadores (29). Os lncRNAs podem regular as funções das células por meio de uma variedade de mecanismos. Por exemplo, eles podem funcionar como andaimes para trazer duas ou mais proteínas em um complexo de ribonucleoproteína funcional, como iscas para titular uma proteína de seu alvo original, como guias para recrutar enzimas de modificação da cromatina para loci específicos no cromossomo, e como esponjas de microRNA para tamponar as funções inibitórias dos microRNAs na expressão gênica (29,30). É digno de nota que o potencial de codificação de lncRNAs é frequentemente avaliado por métodos computacionais com base no comprimento de quadro de leitura aberta, conservação, uso de códon, etc. Esses procedimentos não são à prova de erros e podem anotar erroneamente alguns transcritos de codificação de micropeptídeo como lncRNAs (31). Portanto, é importante determinar experimentalmente o potencial de codificação de candidatos a lncRNA.

Nos últimos anos, vimos um rápido aumento no número de estudos de lncRNA de adipócitos com foco na anotação de todo o genoma de lncRNAs, análises moleculares e funcionais em adipócitos cultivados e, mais recentemente, estudos in vivo para delinear seu papel na fisiologia e na doença. Aqui, procuramos destacar os últimos avanços na pesquisa de lncRNA adiposo, discutir novos insights sobre a interface regulatória de proteína lncRNA emergente e fornecer perspectivas sobre os desafios atuais e as direções futuras desse campo. Os leitores também são encaminhados para algumas outras revisões excelentes do lncRNA que cobrem tecidos metabólicos adicionais (32-35).


Genes LncRNA no genoma

O complexo genoma dos eucariotos é amplamente transcrito e os esforços para definir de forma abrangente todas as transcrições levaram à ideia de que cerca de metade do genoma pode ser transcrito em RNA em uma célula individual (Djebali et al., 2012). As unidades que produzem RNAs - os genes - podem ser categorizadas em dois biótipos principais: genes codificadores de proteínas (PCGs) e genes não codificadores de proteínas (NCGs). A categoria maior e mais coerente é o PCG, que codifica RNAs que servem como modelo para todos os peptídeos e proteínas na célula. A categoria NCG é uma coleção altamente heterogênea e pode ser subagrupada em genes pequenos ncRNA (RNA não codificante) e ncRNA longo (lncRNA), onde o termo longo se refere ao comprimento arbitrário de 200 nucleotídeos ou mais. Em particular, os genes lncRNA têm atraído muita atenção nos últimos anos devido à sua ampla gama de ação e funções, em sua maioria, inexploradas. Enquanto seu número foi superestimado após a descoberta inicial, semelhante à superestimação do número de PCGs no início do projeto genoma humano (Lander et al., 2001), projetos de curadoria atuais e cuidadosos, como os projetos GENCODE e FANTOM, listar 17.957 e 27.919 genes lncRNA, respectivamente (Figura 1A), em suas publicações de dados mais recentes do genoma humano (Frankish et al., 2019 Hon et al., 2017). Portanto, o número de genes lncRNA está na mesma faixa, ou até um pouco maior, do que o número de PCGs (19.954). No futuro, esta classe atualmente muito heterogênea de NCGs pode ser subdividida em biótipos mais específicos.

Genes LncRNA no genoma.

(UMA) Visão geral dos genes e números de transcritos no genoma humano (GENCODE v35). A área do círculo representa as quantidades relativas. (B) Esquemas de três propriedades funcionais possíveis de loci lncRNA.

Atualmente, três princípios funcionais principais podem ser atribuídos a loci lncRNA (Figura 1B): (1) ou o RNA é a biomolécula funcional e interage com outros componentes na célula, por exemplo DNA, proteínas ou RNAs, (2) um gene regulador elemento está embutido no corpo de transcrição de um gene lncRNA e a atividade do gene lncRNA direciona a atividade do elemento regulador ou (3) o processo de transcrição influencia o genoma e, portanto, a atividade do gene. Um locus lncRNA pode ter uma dessas funções ou uma mistura delas (Yin et al., 2015). Nesta revisão, vamos nos concentrar nas duas últimas propriedades funcionais do lncRNA, nas quais o RNA é, pelo menos parcialmente, dispensável para a função do gene lncRNA.

A transcrição de genes

A geração de RNA usando o genoma como molde, ou o processo de transcrição, depende de certos elementos genômicos funcionais (Figura 2). O elemento central de um gene que inicia a produção de um RNA é o promotor. Um elemento rico em GC acessível (cromatina aberta) atrairá a maquinaria da polimerase e os fatores gerais de transcrição (TFs). Este elemento central mínimo serve como um promotor central e pode ser suficiente para iniciar a transcrição (Deaton e Bird, 2011). A transcrição do RNA começa no local de início da transcrição (TSS), que está localizado dentro do promotor do núcleo. Como os PCGs, a maioria dos lncRNAs são transcritos por POL II (RNA polimerase 2, um complexo multiproteico), mas são mais específicos do tecido em comparação com os PCGs (para revisão, ver Ransohoff et al., 2018). Ambos os biotipos (PCGs e lncRNAs) conservaram sequências de promotores centrais com menos motivos de ligação de TF sobrepostos em promotores de lncRNA, resultando em um nível de expressão geral mais baixo em comparação com PCGs (Figura 2 Mattioli et al., 2019). Assim, a arquitetura do promotor do núcleo é o primeiro jogador que define o grau de expressão de lncRNA (Batut e Gingeras, 2017 Mattioli et al., 2019). O segundo elemento importante que influencia a transcrição de genes são os potenciadores, que são cis- elementos reguladores que podem ter um impacto positivo ou negativo (que muitas vezes são chamados de repressores) em seus genes-alvo. Consequentemente, os intensificadores são regiões genômicas que codificam locais de ligação para o ativador específico da sequência ou o repressor TFs. Esses elementos costumam conferir especificidade na expressão espaço-temporal. Muitos lncRNAs também podem ser gerados a partir de tais elementos estimuladores, o que contribui para sua expressão geral mais específica para o tecido quando comparados aos PCGs (Mattioli et al., 2019).

Características distintivas de geração de transcrição de PCGs e lncRNAs (UMA) LncRNA e (B) mRNAs: os genes lncRNA são expressos de maneira inferior, pois menos fatores de transcrição (TFs) se ligam ao promotor.

Além disso, lncRNA TSS, exon e / ou sítio pA associam-se mais frequentemente com elementos transponíveis (TEs), enquanto TEs contribuem principalmente para UTRs e / ou íntrons de mRNAs. Além disso, os mRNAs são combinados com mais eficiência.

O promotor do núcleo inicia a transcrição e, portanto, a geração de um RNA que pode ou não ser diversificado por splicing (Figura 2). Isso depende se os locais de splice estão presentes entre o promotor e o elemento de terminação da transcrição, o sinal de poliadenilação (pA). O mecanismo de splicing de PCG e lncRNA é semelhante, embora a eficiência de splicing de lncRNAs seja menor do que PCGs, provavelmente devido à perda de fosforilação de RNA POL II proximal em locais de splice 5 '(Krchnáková et al., 2019). Além disso, os lncRNAs mostram sinais de clivagem co-transcricional e terminação prematura com Thr4p PolII enriquecido em todo o corpo do lncRNA (Schlackow et al., 2017). Em algum ponto, a maquinaria transcricional será executada em um sinal de terminação, um elemento de sequência de DNA que consiste em AATAAA e motivos ricos em GU (ou U) a jusante (Eaton et al., 2020). Esses elementos estão presentes de forma onipresente no genoma. Em humanos, pode-se encontrar 569.005 elementos que atendem ao critério de um sinal pA (301.001 em camundongos e 20.931 em C. elegans) (Herrmann et al., 2020). Além disso, esse número alto provavelmente garante o término bem-sucedido da transcrição (Eaton e West, 2020).

Outra classe de elementos genéticos que desempenham um papel importante para a atividade do gene e do genoma são os elementos transponíveis (TEs) (para revisão, consulte Chuong et al., 2017). Esses elementos genômicos móveis constituem mais de 44% do genoma humano (Lander et al., 2001) e atraem a atenção como reguladores importantes da atividade do gene e do genoma (Bourque et al., 2018). A este respeito, os TEs são um componente importante da biologia lncRNA também (Figura 2A). Aproximadamente, 75% dos transcritos de lncRNA contêm elementos de sequência de TEs (Kapusta et al., 2013) e alguns deles representam elementos de sequência importantes para direcionar a localização de lncRNA (Lubelsky e Ulitsky, 2018). Além disso, 25% dos TEs se sobrepõem aos sinais TSS e pA dos genes lncRNA (Kapusta et al., 2013). Portanto, eles são uma importante força motriz da expressão de lncRNA. Um exemplo recente é o lncRNA específico de primata XACT (Tabela 1), que demonstrou proteger o cromossomo X ativo de ser silenciado (antagonizar XIST efeito lncRNA) e cuja sequência contém elementos derivados de um TE (Casanova et al., 2019). Interessantemente, XACT O lncRNA também é regulado por um elemento potenciador derivado de TE que abriga sítios de ligação de fator de pluripotência pioneiro. Isso exemplifica que os TEs contendo motivos de TF incorporados podem direcionar a expressão específica de tecido quando se inserem próximo a um elemento promotor. Vários outros lncRNAs derivados de TE são descritos em outro lugar (Kapusta et al., 2013).

Seleção de genes lncRNA com função independente de RNA.
LncRNALocalização relativa do respectivo gene alvo de TSSsLiteraturaModo de ação
Elemento regulador localizado dentro da unidade de transcrição
Haunt (Halr1)40 kb a jusante de HOXAYin et al., 2015Ativação de HOXA
Lockd4 kb a jusante de Cdkn1bParalkar et al., 2016Regulação positiva de Cdkn1b via formação de loop
Meteoro80 kb a montante de EomesAlexanian et al., 2017Licenciamento positivo de Eomes expressão
ThymoD844 kb a jusante de Bcl11bIsoda et al., 2017Metilação de DNA, ligação a CTCF
Pcdhα-asPcdhαCanzio et al., 2019Metilação de DNA, ligação a CTCF
GAL10-ncRNAGAL10 transcrição antisenseHouseley et al., 2008GAL10 acetilação do promotor
AIRN28 kb antisense para Igfr2Latos et al., 2012Metilação do promotor
Upperhand (Hand2os1)0,1 kb a montante de Hand2Anderson et al., 2016 Han et al., 2019Promove a acessibilidade do intensificador para Hand2 ativação
Atividade exercida pela iniciação ou alongamento da transcrição
Ftx140 kb a montante de XistFurlan et al., 2018Xist ativação independente de Ftx RNA
Chaserr16 kb a montante de Chd2Rom et al., 2019Regulação negativa de Chd2
PVT152 kb a jusante de Meu cCho et al., 2018Elemento de limite de realçador
Mãos para baixo (Handlr)11 kb a jusante de Hand2George et al., 2019 Ritter et al., 2019Blindagem intensificadora baseada em alongamento transcricional

Em resumo, o genoma armazena as informações necessárias para gerar os RNAs que são necessários para o funcionamento adequado de uma célula, seja o RNA codificador de proteínas ou não. Um mecanismo elaborado é estabelecido que controla a ativação específica de genes e regiões genômicas inteiras por meio de mecanismos positivos ou negativos. Esses mecanismos regulatórios exigem investimento de energia da célula. É concebível que às vezes pode ser "mais barato" para uma célula permitir a transcrição espúria de transcrições não prejudiciais, sejam elas codificantes ou não, do que investir energia no silenciamento de todos esses locais transcricionalmente ativos.

Camadas de regulação gênica

A expressão de genes e regiões genômicas inteiras é controlada por várias camadas de regulação. Além dos elementos genômicos descritos acima, o DNA é embalado com proteínas histonas na cromatina. Esses componentes da proteína podem ser modificados para atuar como centros de sinalização para a maquinaria de transcrição (para revisão, ver Talbert et al., 2019). Além disso, as proteínas do núcleo também regulam o arranjo 3D do DNA genômico de tal forma que os elementos funcionalmente conectados da regulação do gene se reúnem. Em suma, cada cromossomo é composto de unidades de sub-megabase conhecidas como domínios topologicamente associados (TADs), a unidade estrutural e funcional do cromossomo (para revisão, ver Szabo et al., 2019). Tais arranjos de genoma podem permitir contatos promotor-intensificador e organizar elementos regulatórios funcionalmente dependentes juntos (Hnisz et al., 2017). Os principais fatores que regulam essa organização são o CTCF (CCCTC-binding TF) e o complexo de coesina (Ali et al., 2016 Rao et al., 2017). A ligação de CTCF frequentemente co-localiza e interage com o complexo de coesina nas fronteiras TAD (Li et al., 2020). Na verdade, a eliminação da coesina dissolve todos os TADs da cromatina, mesmo na presença de CTCF (Rao et al., 2017). Curiosamente, a interrupção dos TADs por remoção de CTCF ou coesina resulta em efeitos leves inesperados na expressão gênica (Nora et al., 2017, Rao et al., 2017). Embora tenha sido aceito que a expressão gênica e o dobramento do genoma 3D estão correlacionados, sua relevância funcional ainda não foi elucidada (Ibrahim e Mundlos, 2020).

Todos esses intensificadores e regiões organizadoras do genoma devem ser regulados funcionalmente para controlar com precisão a atividade do gene e do genoma. Como muitos desses locais regulatórios estão associados a lncRNAs, esses loci lncRNA podem ser importantes elementos de suporte funcional. O processo de transcrição pode auxiliar na reorganização das marcas de cromatina (van Steensel e Furlong, 2019), permitindo que as regiões sejam acessíveis para outros fatores ou prevenindo outros, desviando / direcionando a maquinaria de transcrição para genes próximos.

As anotações atuais no banco de dados são um trabalho em andamento

As anotações atuais dos bancos de dados genômicos categorizam os genes de acordo com vários critérios. Um que parece, superficialmente, ser muito simples é a separação de genes codificadores de proteínas (PCGs) e genes não codificadores de proteínas (NCGs). Já foi descoberto há algum tempo que RNAs originários de NCGs realmente se associam aos ribossomos, a máquina que traduz os mRNAs em proteínas (Ingolia et al., 2011 van Heesch et al., 2014). Essa associação não é surpreendente, pois a função dos ribossomos é ligar RNAs no citosol e tentar traduzi-los em um peptídeo ou proteína. No entanto, só porque um RNA está ligado a um ribossomo não significa que ele seja traduzido e, mesmo que traduzido, a presença pura de um peptídeo não prova uma função desse peptídeo. Em estudos aprofundados mais recentes, verificou-se que alguns lncRNAs produzem peptídeos e que alguns desses peptídeos são até funcionais (Chen et al., 2020 Ji et al., 2015 van Heesch et al., 2019), incluindo dentro Regiões não traduzidas 5 'e 3' (UTR) de mRNAs. Portanto, até que os bancos de dados sejam atualizados com informações adequadas que incorporem a presença de peptídeos derivados de RNAs expressos, uma probabilidade de codificação de peptídeo sempre deve ser levada em consideração ao estudar a função de lncRNA. Igualmente importante, muitos PCG ou NCGs têm um grande número de variantes de splice, algumas das quais podem codificar um peptídeo e outras não.

A revolução do sequenciamento de alto rendimento de bibliotecas de cDNA fragmentadas revelou a complexidade da expressão do genoma. O enriquecimento de transcrições expressas de forma humilde e a análise de sequência subsequente identificou um padrão ainda mais complexo de variantes de emenda (Mercer et al., 2012). No entanto, essas análises basearam-se no sequenciamento de bibliotecas de cDNA fragmentadas e subsequente reconstrução do transcriptoma para um genoma de referência. A geração mais recente de sequenciadores de leitura longa, como os sistemas PacBio ou Nanopore, permite a análise direta de RNAs e elimina a etapa intermediária de uma biblioteca de cDNA fragmentada.A captura de genes lncRNA especificamente e o novo sequenciamento por plataforma de leitura longa (conhecida como Capture Long Sequence ou CLS) determinou a variedade completa de variantes de splice do transcriptoma de mamífero (Lagarde et al., 2017). A vantagem desta tecnologia é a capacidade de determinar com precisão as extremidades 5 'e 3' e, idealmente, todas as variantes de emenda de uma transcrição. Por exemplo, o número médio estimado de exons por lncRNA usando CLS foi de 4,27 em comparação com 3,59 medido pelo método de leitura curta de RNA-seq (Lagarde et al., 2017). Embora esta abordagem não elimine a necessidade de determinar cuidadosamente as variantes de emenda de um locus lncRNA inteiramente, ela fornece um ponto de partida muito bom para uma análise detalhada. Em particular, quando os dados CLS não estão disponíveis para seu locus de interesse ou seu tecido de interesse, deve-se determinar o comprimento total da transcrição, variantes de emenda e elementos regulatórios do lncRNA de interesse. Só então uma estratégia bem-sucedida para estudar o lncRNA pode ser iniciada.

Regulação de genes por genes lncRNA - elementos reguladores dentro da unidade de transcrição

O levantamento da cromatina e da paisagem de modificação do DNA levou à anotação de potenciais regiões regulatórias em todo o genoma e, às vezes, até mesmo para tecidos e tipos de células específicos. Elementos reguladores, sejam eles promotores ou outros elementos reguladores, podem ser encontrados dentro ou longe da unidade de transcrição de um gene. A ocorrência de tal elemento regulador dentro de uma unidade de transcrição, por exemplo de um gene lncRNA, pode indicar que a função desse elemento pode ser afetada por sua atividade.

Um exemplo interessante do gene lncRNA que reflete a dualidade dos genes lncRNA com relação ao seu mecanismo baseado em RNA de um lado, e um elemento potenciador do outro lado, é Assombro. Enquanto o RNA de Assombro é considerado necessário para a regulação negativa de HoxA, a Assombro locus contém elementos reguladores para ativar o HoxA locus durante em vitro diferenciação de células-tronco pluripotentes (Yin et al., 2015). Embora seja demonstrado que esses intensificadores podem interagir com HoxA diretamente, os elementos não são mais definidos, nem como sua função pode depender de Assombro atividade transcricional.

Um exemplo inicial semelhante de um locus lncRNA que contém um elemento regulador dentro de sua unidade de transcrição é o Lockd locus lncRNA, que regula seu cis gene Cdkn1b. A exclusão de todo o locus de Lockd, incluindo elementos upstream de TSS, leva a uma redução de Cdkn1b expressão (Paralkar et al., 2016). Enquanto a região genômica 5 'de Lockd interage genomicamente com o promotor de Cdkn1b, essa interação não é alterada se a transcrição de Lockd é esgotado por um sinal pA inserido no primeiro exon de Lockd. Assim, o próprio locus genômico é importante como um elemento regulador ao invés de sua atividade transcricional.

Mesmo que um elemento regulador específico não possa ser definido, uma análise cuidadosa e a dissecção genética de um lncRNA podem apontar para tal princípio regulatório. O TSS do Meteoro O locus lncRNA é importante para licenciar seu cisgene localizado Eomes para ativação no mesendoderma (Alexanian et al., 2017). A falta de Meteoro expressão por exclusão de TSS causa a perda de Eomes ativação durante a diferenciação mesendoderma de ESCs de mouse. Níveis decrescentes de Meteoro O RNA durante este processo não alterou a expressão de genes a jusante, argumentando contra uma função baseada em RNA de Meteoro. Curiosamente, a ativação endógena de Meteoro não é só licenciar Eomes ativação do gene, mas também de outros genes mesodérmicos cardíacos. Além disso, a inibição transcricional de Meteoro usando uma inserção de elemento de poliadenilação a jusante do Meteoro TSS não causa o Eomes gene a ser silenciado durante a diferenciação do mesendoderma (Alexanian et al., 2017 Engreitz et al., 2016). Esta descoberta argumenta contra um mecanismo baseado na transcrição de Meteoro e sugere que o locus genômico Meteoro abriga importantes elementos regulatórios para processar o cis-localizado Eomes gene ativável durante a diferenciação.

Um excelente exemplo de um lncRNA com um elemento regulador definido dentro da unidade de transcrição é o ThymoD Locus lncRNA. Sua transcrição evita a metilação de um sítio de ligação de CTCF localizado dentro de sua unidade de transcrição (Isoda et al., 2017 Figura 3A). A ligação de CTCF permite o loop do Bcl11b unidade de transcrição no mesmo domínio que regiões ativadoras de Bcl11b. Esta ativação é perdida quando a transcrição de ThymoD é bloqueado pela inserção de um sinal de pA após o exão dois e antes do local de ligação a CTCF e, consequentemente, o local de ligação a CTCF é metilado (Figura 3A). Portanto, a atividade transcricional tem um efeito estrutural indireto na regulação de Bcl11b enquanto o ThymoD O RNA é dispensável.

Modulação da expressão gênica pela transcrição de lncRNA.

(UMA) A atividade transcricional modula a metilação do DNA e, assim, altera a ocupação dos fatores de ligação ao DNA dentro do corpo do gene, por exemplo, CTCF. O complexo POL2 é indicado em violeta. As baquetas pretas indicam CpGs metilados, as baquetas brancas CpGs não metilados. (B) A expressão de LncRNA altera a atividade do promotor (Prom.) Por modificação, e. acetilação de histonas em sítios TSS. (C) O alongamento da transcrição pode ativar potenciadores posicionados dentro de seu corpo gênico (apenas a acetilação é mostrada).

Uma situação mais complexa de várias transcrições antisense que regulam seus cis gene é a protocaderina alfa (Pcdhα) cacho. A expressão estocástica variável de vários agrupamentos de protocaderina fornece proteínas de superfície celular para reconhecimento de identidade celular no sistema neuronal para permitir que dendritos e axônios se distingam de si próprios e de outros neurônios. Esta expressão estocástica é parcialmente regulada por uma região distal do realçador. O aglomerado de Pcdhα produz três variantes distintas de três TSSs alternativos para alcançar a expressão estocástica de variantes de emenda deste cluster. O primeiro exon de cada uma dessas variantes contém um transcrito antisense de lncRNA (Pcdhα-as) (Canzio et al., 2019). A expressão dos lncRNAs precede a expressão dos PCGs e regula positivamente a expressão de PCG mais próxima. Mecanicamente, o Pcdhα lncRNAs agem de forma semelhante ao ThymoD lncRNA (acima) (Figura 3A). Expressão do Pcdhα-as variantes leva à desmetilação de um sítio de ligação de CTCF na região a montante do Pcdhα PCG, permitindo assim uma formação de loop estável com a região distal do intensificador e um efeito positivo na expressão de PCGs.

Existem também exemplos de genes lncRNA que residem dentro de uma entidade transcricional diferente de cis genes alvo. Aqui, é ainda mais concebível que sua atividade tenha um impacto no gene em que estão incorporados. Um dos primeiros exemplos foi um ncRNA dentro do GAL10 cluster de genes em levedura Saccharomyces cerevisiae. Abaixo de 0% de galactose, o TF Reb1 se liga à região promotora de GAL10-ncRNA anti-sentido para GAL10 e ativa totalmente sua expressão (Houseley et al., 2008). A unidade de transcrição de GAL10-ncRNA sobrepõe-se ao TSS de GAL10 e GAL1, levando à inibição do GAL10 e GAL1 gene, promovendo altos níveis de metilação e hipoacetilação de H3K36me3 no GAL10 e GAL1 promotores. Adição de galactose aos blocos de meio de crescimento GAL10-ncRNA expressão e hiperacetilação do GAL10 e GAL1 promotores, levando à expressão de genes que codificam proteínas de fermentação de galactose (Figura 3B).

Um princípio semelhante foi mostrado em eucariotos superiores no AIRN (anti-sentido Igf2r Locus de RNA não codificante). O TSS do lncRNA AIRN está localizado no segundo intron do Igf2r PCG e AIRN é transcrito anti-sentido para Ifg2r. Transcrição de AIRN regula negativamente Igfr2 (Santoro et al., 2013). Quando a transcrição de AIRN é bloqueada por uma inserção de poliA antes do promotor de Igf2r, esta regulação negativa é abolida (Figura 3B). No entanto, se o mesmo pA for inserido após o promotor de Igf2r, este efeito regulatório negativo sobre Igf2r não é observada (Latos et al., 2012). Esses resultados apóiam a hipótese de que a transcrição de AIRN, e não o produto de RNA em si, é importante para a regulação da transcrição do Igfr2.

A transcrição do gene lncRNA que influencia um potenciador é Superior, que é expresso de forma divergente do Hand2 gene codificador de proteína (Anderson et al., 2016). Perda de Superior a transcrição leva a uma perda de acetilação da histona a montante de Hand2, incluindo no intensificador cardíaco. Como resultado, a ligação de GATA4 ao seu intensificador previamente definido (McFadden et al., 2000) é reduzida, e Hand2 a expressão no coração também é reduzida. Portanto, o fenótipo de perda de função de Upperhand é semelhante à perda cardíaca de Hand2 (Figura 3A). Mutantes adicionais de Superior desenhe uma imagem mais complicada da função de Superior em ativar Hand2. Uma exclusão completa do Superior unidade de transcrição que abrange todas as regiões regulatórias conhecidas do Hand2 gene também, causa perda de Hand2 Expressão 5’UTR (Han et al., 2019). Esses achados afirmam a presença de importantes Hand2 ativar elementos genéticos diretamente a montante de seu SST, independentemente de qualquer RNA proveniente desta região. No entanto, uma exclusão do promotor de Superior causa uma perda de seu RNA, deixando todos os outros elementos dessa região intactos, mas nenhum efeito sobre Hand2 expressão foi observada neste caso. Além disso, uma deleção dos últimos dois exões de Superior tem um leve efeito em Hand2 expressão. Pode haver elementos potenciadores até agora não caracterizados na região genômica desses dois exons e sua deleção pode influenciar Hand2 expressão. Além disso, embora o Superior Sugere-se que o RNA não seja necessário para sua na Vivo função, o RNA gera peptídeos que podem ser funcionais (van Heesch et al., 2019). Esses resultados de alguma forma conflitantes sublinham a complexidade da regulamentação do Hand2 gene.

Esses exemplos destacam a importância de dar uma olhada cuidadosa em todo o locus lncRNA que produz um RNA. A ocorrência de um elemento regulador anotado ou a ocupação de um fator regulador do genoma como o CTCF dentro da unidade de transcrição pode ser uma indicação importante para procurar uma função genômica de um lncRNA.

Regulação de genes por genes lncRNA - o ato de transcrição é funcional

A ausência de um elemento regulador dentro da unidade de transcrição pode ser devido à anotação incompleta ou um fator ainda desconhecido que se liga lá, ou o ato de iniciação da transcrição ou alongamento da transcrição é importante para a função de um locus lncRNA.

Um exemplo de tal princípio de regulamentação vem do trabalho no XIST lncRNA, que é um dos lncRNAs originais que tem sido extensivamente estudado (Brockdorff et al., 1992). Enquanto XIST atua por meio do RNA produzido (Brannan et al., 1990 Brown et al., 1992), a regulação de XIST, pelo menos em parte, não. o XIST O locus lncRNA é flanqueado por muitos lncRNAs, e um deles é o Ftx locus encontrado 140 kb a montante de Xist (Chureau et al., 2002). Foi inicialmente proposto que o Ftx O RNA funciona para regular XIST (Chureau et al., 2011). No entanto, uma análise detalhada revelou que a transcrição de Ftx, e não o RNA produzido, é importante para regular Xist (Furlan et al., 2018). Derrubada de Ftx RNA não causa perda de Xist expressão, mas a deleção do promotor de Ftx, e a consequente perda de Ftx transcrição, causa a perda de Xist expressão. CRISPRi de Ftx da mesma forma causa a perda de Xist expressão, sugerindo que a transcrição de Ftx é o regulador positivo de Xist expressão. Uma possibilidade é que a arquitetura do genoma 3D pode ser alterada devido à atividade transcricional de um locus genômico (Figura 4). Surpreendentemente, o promotor de Xist e Ftx são ladeados por locais ocupados pelo CTCF. No entanto, a exclusão dos locais de ligação ao CTCF sozinhos no Ftx promotor não tem efeito sobre o nível de expressão de Xist, argumentando que o dobramento do genoma induzida por Ftx a atividade não envolve a ligação ao CTCF.

Alteração das interações do genoma pela atividade do lncRNA.

DNA: os contatos de DNA podem mudar com a atividade transcricional de regiões próximas, cis genes lncRNA localizados.

Outro bom exemplo é o Chaserr Locus lncRNA, que fica 16 kb a montante do Chd2 gene codificador de proteína (Rom et al., 2019). Embora, derrube de Chaserr O RNA causa um ligeiro aumento na Chd2 expressão, linhas adicionais de evidência inferem que a transcrição do gene lncRNA é provavelmente a função mais importante de Chaserr em regular Chd2 (Figura 4). Além disso, o promotor de Chaserr interage com o Chd2 promotor na análise de captura de conformação cromossômica. Após a exclusão do Chaserr região promotora, a Chd2 o promotor interage cada vez mais com outros elementos potenciadores a montante. Em contraste, se o corpo do gene Chaserr é excluído, deixando o promotor intacto, essas alterações no potenciador /Chd2-Os contatos do promotor não são observados. Uma explicação plausível é que a atividade de iniciação da transcrição, em vez do alongamento da transcrição, é importante para a regulação de Chd2 por Chaserr.

Da mesma forma, o início da transcrição é importante para o PVT1 Locus lncRNA. o Pvt-1 lncRNA foi originalmente descoberto como uma translocação genômica que causa a ativação do Meu c oncogene (Adams e Cory, 1985). Inicialmente, foi sugerido que miRNAs embutidos no transcrito de lncRNA de PVT1 são importantes para a regulação de genes alvo (Wang et al., 2019). Acontece que PVT1 a transcrição também tem uma função independente do RNA. o PVT1 locus codifica várias transcrições com locais de início alternativos. A atividade de seu principal TSS serve como um elemento de fronteira para proteger o MEU C promotor de superativação por um potenciador localizado dentro da unidade de transcrição de PVT1 (Cho et al., 2018 Figura 4). A atividade transcricional é importante para essa capacidade de blindagem, mas não para o alongamento da transcrição (Figura 4). Isso não significa que os miRNAs produzidos por PVT1 não têm uma função, mas parece que a principal atividade do PVT1 lncRNA, e seu efeito sobre MEU C é transmitido pela ativação transcricional de PVT1.

Em adição ao Superior lncRNA a montante de Hand2 (veja acima), existem Hand2-regulando loci lncRNA a jusante de Hand2. Inicialmente caracterizamos este locus e o denominamos Mãos para baixo, devido à sua localização a jusante de Hand2. o Mãos para baixo locus é expresso nos mesmos tecidos que Hand2 mas é mais significativamente expresso no coração em desenvolvimento. Nós mostramos que a transcrição de Mãos para baixo é importante para regular negativamente a expressão de Hand2 (Figura 4). Além disso, o HAND2 TF liga dois locais distintos em torno do TSS de Mãos para baixo no coração E9.5 em desenvolvimento (Laurent et al., 2017). Isso sugere que o HAND2 ativa sua própria região supressora em um ciclo de feedback negativo para controlar sua dosagem. No entanto, a exclusão da região TSS de Mãos para baixo, incluindo apenas um dos locais ocupados por HAND2, não resulta na regulação positiva esperada de Hand2 (George et al., 2019). Múltiplas regiões de TSS potenciais estão presentes na região 5 'de Mãos para baixo e a exclusão de um ou dos principais TSS pode levar ao aparecimento de transcrições alternativas (Lavalou et al., 2019). Portanto, é plausível que o segundo local ocupado pelo HAND2 possa ser suficiente para instruir a transcrição de um local alternativo Mãos para baixo transcrição. Portanto, desde que a atividade transcricional esteja presente no Mãos para baixo região, Hand2 pode ser regulado negativamente e seu nível de expressão ajustado. A dosagem de Hand2 é particularmente importante, pois a perda de uma cópia do Hand2 gene, bem como o ganho de uma cópia adicional do Hand2 gene, causa malformações durante o desenvolvimento (Tamura et al., 2014). Além desses loci lncRNA que flanqueiam o Hand2 gene, potenciadores adicionais putativos são previstos a montante e a jusante de Hand2, sublinhando o complexo reguloma deste importante gene em desenvolvimento.

Enquanto as funções dos lncRNAs no nível de transcrição estão se tornando cada vez mais compreendidas, os mecanismos elucidativos de como tais loci, cuja função é baseada no nível de transcrição, exibem seu efeito (Tabela 1) ainda está em sua infância. Embora esta lista não esteja saturada, o número de lncRNAs que atuam pelo menos parcialmente por tal mecanismo aumentará no futuro. Um modelo muito promissor de como eles podem agir são os microdomínios funcionais. Em tal cenário, esses microdomínios promovem a cooperatividade entre componentes de interação, como TFs, co-fatores, reguladores da cromatina, RNA polimerase II e RNA não codificante, governando assim os processos básicos de regulação gênica. Esses microdomínios são formados favoravelmente por super intensificadores que também frequentemente geram um RNA, mas funcionam no nível transcricional. Portanto, a própria atividade transcricional pode influenciar a acessibilidade da cromatina, a metilação do DNA, a modificação da histona e a estrutura da cromatina de ordem superior.


ARNs NÃO CODIFICADOS LONGOS COMO REMODELADORES DE CROMATINA

Na última década, as modificações na estrutura da cromatina e nas histonas surgiram como reguladores-chave da AS. A interação entre modificações de histonas, proteínas de ligação à cromatina e SFs possivelmente constitui uma rede complexa de comunicação entre a cromatina e o RNA (100). Além disso, foi demonstrado que o contexto da cromatina influencia a taxa de alongamento da RNA polimerase II (Pol II) que, por sua vez, afeta a AS (101-102). Isso significa que a regulação epigenética não apenas determina quais partes do genoma são expressas, mas também como elas são processadas (100). Vários lncRNAs participam na determinação e dinâmica da estrutura da cromatina, o que pode então impactar a saída de splicing, notadamente por: (i) interação direta entre lncRNAs e heteroduplexes formadores de DNA, (ii) recrutamento de modificadores de cromatina para loci específicos, ou (iii) moldar o Organização 3D da conformação da cromatina no núcleo da célula. Finalmente, discutimos como pequenos RNAs derivados de lncRNA controlam a remodelação da cromatina e podem determinar os padrões de AS por meio desse mecanismo.

Regulação de splicing por duplexes DNA-RNA conduzidos por lncRNA

Os RNAs circulares (circRNAs) são moléculas circulares covalentemente fechadas de RNA de fita simples, resultantes de um evento de splicing não canônico, o chamado back-splicing. Este evento consiste na ligação de um sítio doador de splice a jusante reversamente com um sítio aceptor de splice a montante do pré-mRNA, gerando uma molécula de lncRNA circular. Esses transcritos circulares são abundantes e altamente estáveis ​​e podem competir com eficiência com o pré-mRNA linear para o reconhecimento de complexos de proteínas de splicing relacionados (103). Por exemplo, em moscas e humanos, o SF MUSCLEBLIND pode se ligar forte e especificamente ao circRNA derivado de seu próprio locus, denominado circMbl (104). Em células humanas, circRNAs são modulados dinamicamente pelo SF QKI durante a EMT humana (105), e foi demonstrado que em células endoteliais humanas a ocorrência de circRNAs se correlaciona com o salto de exon em todo o genoma (106). No entanto, os mecanismos moleculares que envolvem circRNAs em animais permanecem amplamente desconhecidos.

Foi recentemente demonstrado em Arabidopsis que um circRNA pode modular o AS de seu próprio gene pai, interagindo diretamente com o DNA, formando um híbrido RNA-DNA conhecido como R-loop (107). A superexpressão do circRNA do exon 6 do SEPALLATA 3 (SEP3) gene aumenta o acúmulo do gene que ocorre naturalmente SEP3.3 isoforma, que consiste na transcrição saltada em 6 do exon. SEP3 pertence à família MADS-box (em homenagem aos membros fundadores M CM1- A GAMOUS- D EFICIENS- S RF) de proteínas de ligação ao DNA, e está envolvida no desenvolvimento de flores em Arabidopsis. A modulação de SEP3 o splicing dá origem a fenótipos homeóticos na flor. Surpreendentemente, o exon 6 circRNA é capaz de gerar um R-loop por interação direta com seu próprio locus genômico, apoiando ainda mais a ideia de que a conformação da cromatina desempenha um papel importante na determinação do padrão de splicing (Figura 4i). A caracterização de todo o genoma de R-loops será necessária para avaliar quão amplamente este mecanismo ocorre em todo o Arabidopsis genoma (108).

RNAs não codificantes longos como remodeladores da cromatina. (eu) O exon 6 do SEP3 gene é transcrito e back-spliced ​​em um RNA circular. o SEP3 circRNA interage diretamente com seu gene pai DNA, formando um duplex DNA-RNA conhecido como um R-loop e promovendo o salto do exon 6, assim o acúmulo de SEP3.3 isoforma de mRNA. (ii) A transcrição antisense do FGFR2 gene, chamado asFGFR2 (em vermelho), recruta as proteínas PRC2 EZH2 e SUZ12 para seu locus pai, desencadeando a deposição de H3K27me3 e o recrutamento da desmetilase H3K36 KDM2a. Este complexo aumenta a deposição de H3K36me3 e prejudica a ligação do complexo adaptador de splicing de cromatina MRG15-PTB ao exon IIIb, que é finalmente incluído no mRNA maduro (em verde). (iii) NEAT1 e MALAT1 ligam-se a loci ativamente transcritos comuns e distintos em todo o genoma. A sua ligação ao corpo do gene é diferente entre eles, e. NEAT1 picos de ligação no local de início da transcrição, bem como no final do locus, enquanto MALAT1 liga-se preferencialmente apenas no final do gene. Foi proposto que MALAT1 e NEAT1 promovem a formação de pontos e paraspeckles nucleares relacionados ao splicing, respectivamente, em torno de seu local de transcrição de loci-alvo.

RNAs não codificantes longos como remodeladores da cromatina. (eu) O exon 6 do SEP3 gene é transcrito e back-spliced ​​em um RNA circular. o SEP3 circRNA interage diretamente com seu gene pai DNA, formando um duplex DNA-RNA conhecido como um R-loop e promovendo o salto do exon 6, assim o acúmulo de SEP3.3 isoforma de mRNA. (ii) A transcrição antisense do FGFR2 gene, chamado asFGFR2 (em vermelho), recruta as proteínas PRC2 EZH2 e SUZ12 para seu locus pai, desencadeando a deposição de H3K27me3 e o recrutamento da desmetilase H3K36 KDM2a. Este complexo aumenta a deposição de H3K36me3 e prejudica a ligação do complexo adaptador de splicing de cromatina MRG15-PTB ao exon IIIb, que é finalmente incluído no mRNA maduro (em verde). (iii) NEAT1 e MALAT1 ligam-se a loci ativamente transcritos comuns e distintos em todo o genoma. A sua ligação ao corpo do gene é diferente entre eles, e. NEAT1 picos de ligação no local de início da transcrição, bem como no final do locus, enquanto MALAT1 liga-se preferencialmente apenas no final do gene. Foi proposto que MALAT1 e NEAT1 promovem a formação de pontos e paraspeckles nucleares relacionados ao splicing, respectivamente, em torno de seu local de transcrição de loci-alvo.

RNAs não codificantes longos como recrutadores de remodeladores da cromatina

Um exemplo de AS específico de célula mediado por lncRNA foi ligado ao transcrito antisense denominado asFGFR2. O lncRNA asFGFR2 é gerado a partir do humano FGFR2 locus e induz AS específica do epitélio de FGFR2 promovendo modificações da cromatina em seu próprio FGFR2 locus. Foi proposto que asFGFR2 recruta modificadores de cromatina especificamente para este locus, talvez via heteroduplexes de RNA-DNA. Curiosamente, o pulldown da cromatina de um biotinilado asFGFR2 O RNA mostrou que, após sua superexpressão, asFGFR2 foi direcionado para o FGFR2 locus precisamente em torno do íntron dividido diferencialmente (109). Em células epiteliais, asFGFR2 foi encontrado para recrutar modificadores de cromatina como as proteínas do grupo Polycomb e a desmetilase KDM2a H3K36 para o FGFR2 locus. Como resultado, ele gera um ambiente de cromatina que impede a ligação de reguladores de splicing inibitório e favorece a inclusão do exon IIIb (109). Proteínas relacionadas a Polycomb e KDM2a são recrutadas diferencialmente ao longo FGFR2 de uma maneira específica do tipo de célula, correlacionando-se com FGFR2 resultado de emenda. A hipótese de um papel direto de H3K27me3 e do componente PRC2 EZH2 em FGFR2 AS foi descartado pela expressão de EZH2 em células após knockdown de KDM2a. EZH2 falhou em induzir a inclusão do exon IIIb na ausência de KDM2a, indicando que PRC2 promove a inclusão do exon IIIb mantendo baixos níveis de H3K36me2 / 3 através do recrutamento de KDM2a. Esta paisagem epigenética prejudica a ligação do complexo adaptador de splicing de cromatina MRG15-PTB, que normalmente inibe a inclusão do exon IIIb. O efeito antagônico de H3K36me3 e H3K27me3 em FGFR2 splicing aponta para um cross-talk mediado por lncRNA entre essas modificações de histonas (109) (Figura 4ii).

Além disso, o mencionado lncRNA relacionado ao splicing MALAT1 foi identificado como um regulador chave do estado de metilação da proteína Polycomb 2 (Pc2), impactando a conformação da cromatina (110). Foi relatado que a metilação / desmetilação do Pc2 determina a realocação dos genes de controle do crescimento entre os corpos Polycomb (PcGs) e os grânulos de intercrromatina (ICGs). Este comportamento é regido pela ligação de Pc2 metilado e não metilado a dois lncRNAs, TUG1 e MALAT1, localizados em PcGs e ICGs, respectivamente. TUG1- e MALAT1-proteínas associadas foram identificadas por pull-down usando RNAs biotinilados seguido por análise de espectrometria de massa. Esta abordagem revelou que MALAT1 O RNA ligado não apenas a SFs pré-mRNA, mas também a co-ativadores transcricionais e histonas metiltransferases / desmetilases associadas a marcas ativas de histonas, enquanto TUG1 O RNA também se liga especificamente a uma série de proteínas envolvidas na repressão transcricional, incluindo histonas metiltransferases / desmetilases e modificadores da cromatina. Transpirou que esses lncRNAs medeiam a montagem de múltiplos co-repressores / co-ativadores e podem alterar as marcas de histonas lidas pelo Pc2 em vitro. Além disso, a ligação de MALAT1 ao Pc2 não metilado promove a SUMOilação do fator de transcrição E2F1, levando à ativação do programa do gene de controle de crescimento. Portanto, MALAT1 também participa da modulação do ambiente de remodelação da cromatina, interagindo seletivamente com proteínas modificadoras da cromatina (110). Embora não haja nenhuma evidência de qualquer ligação direta entre MALAT1- ou TUG1modulação e splicing da cromatina mediados, estudos futuros serão necessários para determinar se a função relacionada à cromatina desses lncRNAs pode, conseqüentemente, afetar o AS dos genes-alvo.

RNAs não codificantes longos moldam a organização tridimensional do genoma

A via molecular que liga as ações de lncRNAs específicos da estrutura subnuclear, como TUG1 e MALAT1, e metilação de proteínas não histonas à relocação espacial de unidades de transcrição no núcleo, sugere o papel dos lncRNAs na configuração 3D dinâmica do genoma no Núcleo celular. A organização espacial nuclear e a modulação 3D da cromatina por lncRNAs (37, 111-116), bem como a modulação AS por modificações da cromatina (para revisão, consulte (100, 117)), foram há muito descritas em células de mamíferos, bem como em plantas.

Os lncRNAs relacionados ao splicing NEAT1 e MALAT1 foram usados ​​como iscas para mapear seus locais de ligação em todo o genoma humano (118) por Análise de Hibridização de Captura de Alvos de RNA (QUADRO (119)). Surpreendentemente, NEAT1 e MALAT1 localizar em centenas de loci em células humanas, principalmente em genes ativamente transcritos. Muitos desses loci foram co-enriquecidos em NEAT1 e MALAT1 CHARTs, embora exibindo padrões distintos de ligação ao corpo gênico, sugerindo funções independentes, mas complementares para ambos os lncRNAs. O GRÁFICO seguido por espectrometria de massa também foi realizado para identificar NEAT1 e MALAT1 interatores, revelando componentes comuns de speckle e paraspeckle nucleares. A elucidação dos complexos de ribonucleoproteína suporta ainda a ligação complementar e as funções exercidas por ambos os lncRNAs. As interações dinâmicas entre manchas nucleares e corpos gênicos indicam que as manchas podem servir como um reservatório concentrado de SFs que vão para os genes transcritos (120, 121). Considerando que manchas frequentemente se localizam na vizinhança de genes transcritos ativamente em splicing co-transcricional (122, 123), foi proposto que os corpos nucleares podem ser organizados em torno de genes regulados por NEAT1 e MALAT1 (118). A elucidação anterior da organização da cromatina 3D de células humanas indicou que o MALAT1 e NEAT1 loci genômicos estão localizados em estreita proximidade no núcleo (124). De acordo com este modelo, NEAT1 e MALAT1 poderia moldar a estrutura dos corpos nucleares em loci altamente transcritos, como NEAT1 também participa da organização da formação do paraspeckle em torno de seu local de transcrição (111, 112) (Figura 4.iii). Alternativamente, NEAT1 e MALAT1 podem servir como andaimes, como Xist ou AR QUENTE (119, 125, 126), trazendo proteínas que também interagem com componentes de manchas e paraspeckles nucleares, juntamente com RNA e / ou proteínas de ligação ao DNA. Este modelo considera a ação de lncRNAs como pontes moleculares entre localizações cromossômicas específicas e pontilhados e paraspeckles nucleares (118).

RNAs pequenos na interação entre splicing e compactação da cromatina

Pequenos ncRNAs (smRNAs) derivados de precursores de lncRNA atuam como pequenas moléculas de & lt50 nt. Desde a descoberta do silenciamento de genes mediado por RNA por pequenos RNAs de interferência (siRNAs) (127, 128), outras classes de pequenos RNAs com funções múltiplas foram identificadas, como microRNAs (miRNAs) (129), pequenos fragmentos de RNA derivados de tRNAs (tsRNAs) e pequenos fragmentos de RNA derivados de pequenos RNAs nucleolares (sno) (sdRNAs, RNAs derivados de sno) (130, 131). Foi demonstrado que eles regulam a expressão gênica por múltiplos mecanismos, como segmentação de mRNA clivagem, repressão translacional ou transcricional, iscas de mRNAs ou através da geração de outros smRNAs secundários (132-134) e sequestro ou titulação de proteínas (135). Durante o silenciamento do gene transcricional, os siRNAs desencadeiam a formação de heterocromatina em sequências alvo de DNA. Vários estudos de plantas e leveduras relataram a relação entre splicing e silenciamento mediado pela formação de heterocromatina dirigida por smRNA. Em particular, vários mutantes em genes que codificam SFs também foram prejudicados no silenciamento de certos genes (136-140). No Schizosaccharomyces pombe, mutação em qualquer um dos dois genes que codificam SF Cwf10 ou Prp39 foi encontrado para reduzir o acúmulo de siRNAs centroméricos e para aumentar as transcrições repetidas como dg e dh (136). Da mesma forma, a mutação de um único nucleotídeo no gene U4 snRNA prejudica o silenciamento do centrômero (137). Em ambos os casos, alguns SFs foram encontrados para facilitar a produção de siRNA para modular a formação de heterocromatina e induzir o silenciamento do centrômero. Da mesma forma, em Arabidopsis o SF SR45 estava envolvido em de novo metilação pela via de metilação do DNA dirigida por RNA (RdDM). Na verdade, o sr45 mutante diminuiu siRNAs e metilação de DNA em transgênicos FWA (FLORESCENDO WAGENINGEN) em companhia com o fenótipo de floração tardia associado (138). Outro exemplo é o Arabidopsis RIBONUCLEOPROTEÍNA D1 NUCLEAR PEQUENA (SmD1) que foi proposta para desempenhar um papel em plantas durante o splicing, uma vez que um mutante exibe AS alterado de certos genes. Esta proteína também foi encontrada para facilitar o silenciamento de gene pós-transcricional (PTGS), protegendo RNAs aberrantes do transgene da degradação pela via NMD. Como resultado, o modelo suficiente é fornecido para a produção de siRNAs estabelecendo uma ligação entre o RNA aberrante e AS (141). Além desses exemplos de interação entre a maquinaria de splicing e a formação de heterocromatina dirigida por smRNAs, novos estudos também apontaram uma ligação entre os smRNAs na regulação de SA por meio da remodelação da cromatina, um processo que pode ser regulado por smRNAs. Foi demonstrado em humanos, moscas e vermes que a densidade do nucleossomo é maior sobre os exons do que sobre os íntrons, sugerindo que o posicionamento do nucleossomo define os exons no nível da cromatina (142-146). O contexto da cromatina influencia a taxa de alongamento da RNA polimerase II (Pol II), que por sua vez afeta a AS (100–102). A transcrição rápida favorece o salto de exon, enquanto a transcrição mais lenta estimula o uso de sítios de splice fracos de exons variantes promovendo o processo de inclusão de íntron ou outros locais alternativos para reações de splicing (146, 147). Por exemplo, o FIBRONECTINA 1 gene (FN1) produz diferentes isoformas de proteínas por meio de AS do domínio extra de exon I (EDI). Em células de hepatoma e HeLa, foi descrito que siRNAs aplicados exógenos direcionados a sequências de genes localizados próximos ao exon alternativo de EDI levam a um estado heterocromático no local que afeta a eficiência de alongamento de Pol II e medeia AS de EDI (148). Descobriu-se que essa regulação é dependente do ARGONAUTE 1 (AGO1), que é um ator crucial no silenciamento de RNA, ligando-se a siRNAs para reconhecer seus RNAs alvo. Outro exemplo de AS mediado por siRNAs é a inclusão do exon 18 do MOLÉCULA DE ADESÃO DE CÉLULAS NEURAL (NCAM) gene que é regulado por marcas de heterocromatina após a diferenciação de células neurais N2a de camundongo. Este processo também pode ser induzido pela aplicação exógena de siRNAs direcionados ao exon em células N2a indiferenciadas (149). Esses exemplos sugerem que os siRNAs podem regular a AS por meio da modulação da heterocromatina em locais específicos, a fim de ajustar a taxa de alongamento de Pol II. Além das implicações mecanísticas do uso de siRNAs aplicados exógenos a exons alternativos específicos, uma abordagem de todo o genoma sugeriu a relevância potencial deste mecanismo em condições fisiológicas (150). Notavelmente, a purificação de complexos associados à cromatina AGO1 e AGO2 revelou sua interação com SFs. Além disso, aproximadamente um terço dos smRNAs carregados nesses complexos AGO1 e AGO2 se alinham especificamente com as extremidades 3 ′ dos íntrons, as junções íntron-exon (150). Essas observações sugerem que esses smRNAs relacionados ao íntron e a maquinaria da proteína RNAi podem ter uma função na regulação da AS. Além disso, matrizes de exon de todo o genoma em fibroblastos embrionários de Ago2- ou Dicercamundongos nulos mostraram que eles têm eventos AS alterados semelhantes (150). Neste trabalho, o CD44 gene foi tomado como um modelo para caracterizar o mecanismo subjacente porque vários de seus exons alternativos podem ser altamente incluídos por um tratamento com forbol-12-miristato 13-acetato (PMA) (150, 151). Em células de mamíferos tratadas com PMA, os smRNAs recrutaram AGO1 e AGO2 para as regiões transcritas de CD44 de uma maneira dependente de Dicer- e HP1 (HETEROCHROMATIN PROTEIN 1), que aumentou os níveis locais de H3K9me3 na região correspondente aos exons variáveis. Posteriormente, as proteínas AGO facilitam o recrutamento de spliceossomos e a modulação da processabilidade de Pol II para dar forma CD44 AS (150), sugerindo ainda um envolvimento de smRNAs na regulação de splicing. A regulação da heterocromatina por smRNAs é amplamente encontrada em diferentes organismos entre leveduras, plantas e mamíferos. Portanto, é possível que a interação entre o splicing e a via de smRNAs / heterocromatina seja um mecanismo difundido em eucariotos para regular rapidamente o splicing e as taxas de AS de genes específicos ao longo do crescimento e da diferenciação.


Fundo

A seca é um dos fatores vitais que limitam a produtividade e a sobrevivência das culturas. Devido à mudança climática global em curso, mais e mais pesquisas têm se concentrado em compreender os mecanismos de como as culturas resistem ao estresse hídrico e melhoram seu nível de resistência [1,2,3,4,5,6,7,8]. As plantas detectam sinais de seca e produzem substâncias de segundo mensageiro, como Ca 2+, fosfatidilinositol e espécies reativas de oxigênio (ROS) [9, 10], enquanto causam um aumento na concentração de íons de cálcio intracelular, iniciando uma rede em cascata de vias de fosforilação de proteínas. Por fim, as proteínas alvo estão diretamente envolvidas na proteção das células, ou seja, regulam a expressão de uma série de genes específicos relacionados ao estresse por meio de TFs (MYC / MYB, ABF, CBF / DREB, bZIP, etc.), protegendo assim as células e melhorando a resistência das plantas à adversidade [11,12,13]. Embora os rápidos desenvolvimentos na biologia molecular moderna tenham gradualmente descoberto os mecanismos moleculares da resistência das plantas à seca, o desenvolvimento de plantas resistentes à seca para lidar com o estresse hídrico permanecerá um desafio substancial no futuro.

O RNA não codificante longo (lncRNA) é um tipo de transcrito de RNA que tem mais de 200 nucleotídeos de comprimento e não tem ou possui capacidade limitada de codificação de proteínas [14,15,16]. Um crescente corpo de evidências tem mostrado que lncRNAs exercem seus efeitos regulatórios sobre os níveis de expressão gênica, envolvendo regulação epigenética, regulação transcricional e regulação pós-transcricional na forma de RNA [17,18,19,20,21,22,23,24, 25]. Com a vantagem de tecnologias de sequenciamento de próxima geração e abordagens de bioinformática, muitos lncRNAs foram descobertos em plantas modelo, como Arabidopsis [26,27,28,29], trigo [30], milho [31,32,33] e arroz [34], indicando que os lncRNAs desempenham um papel importante em vários processos biológicos de desenvolvimento da planta e resposta ao estresse. Pesquisas recentes confirmaram que lncRNAs respondem a estresses abióticos [31, 35, 36], incluindo estresse de seca. Por exemplo, 664 lncRNAs responsivos à seca foram analisados ​​em milho [31]. Sob estresse hídrico, 2542 candidatos a lncRNA foram identificados a partir de Populus trichocarpa, 504 dos quais foram considerados responsivos à seca [37]. No Arabidopsis, 1832 Os lncRNAs mudaram após 2 he / ou 10 h de tratamentos com seca, frio, alto teor de sal e / ou ácido abscísico (ABA) [29]. No milho, 664 transcritos foram confirmados como lncRNAs responsivos à seca, 8 dos quais foram comprovados como precursores de miRNAs [31]. Em arroz, o perfil de expressão de pré-miRNA indicou que miR171f está envolvido na progressão do desenvolvimento e crescimento da raiz do arroz, bem como na resposta ao estresse hídrico [38]. No algodão, RNAs não codificadores intergênicos / intergênicos de longa intervenção (lincRNAs) XLOC 063105 e XLOC 115463, estiveram envolvidos na resposta ao estresse de seca pela regulação de genes vizinhos [39]. Além disso, 19 lncRNAs (17 lincRNAs e 2 transcritos antisense naturais (NATs)) em painço rabo de raposa responderam ao estresse de seca induzido por polietilenoglicol-6000 (PEG), apenas um dos lncRNA responsivo à seca tinha sintonia com sua contraparte de sorgo [40] . Qin et al. (2017) identificou um Arabidopsis lncRNA, lncRNA induzido pela seca (DRIR), que responde à seca e ao estresse salino. DRIR pode ser significativamente ativado por seca e estresse salino, bem como por tratamento com ácido abscísico (ABA) [41]. Além disso, na mandioca, foram identificados 318 lncRNAs, que respondiam ao estresse pelo frio e / ou seca, e que estão associados à transdução de sinal hormonal, biossíntese de metabólitos secundários e à via de metabolismo da sacarose [42]. Além disso, vários lncRNAs envolvidos na regulação da expressão gênica em resposta ao estresse foram identificados e caracterizados em Brassica [43,44,45,46]. Em repolho chinês (Brassica rapa ssp. chinensis), 4594 lncRNAs putativos foram identificados em resposta ao estresse térmico, 25 dos quais foram co-expressos com 10 genes responsivos ao calor [47]. No Brassica Rapa L., 549 lncRNAs foram identificados alterando significativamente sua expressão em resposta ao tratamento com frio, e transcritos antisense naturais induzidos por tratamento com frio de curto prazo (NATs) em BrFLC e BrMAF genes que estão envolvidos na vernalização foram identificados [48]. Summanwar et al. (2019) identificou 530 lncRNAs diferencialmente expressos a partir das raízes de torta-suscetíveis e resistentes Brassica napus linhas. Vinte e quatro lncRNAs diferencialmente expressos foram identificados a partir do cromossomo A08, que foi relatado para conferir resistência a diferentes P. brassicae patotipos [49]. No Brassica Juncea, 1614 lncRNAs expressos diferencialmente em resposta ao estresse por calor e seca, e alguns lncRNAs foram co-expressos com TFs que estão envolvidos na resposta ao estresse abiótico [50].

Colza (Brassica napus L.) é uma importante cultura de sementes oleaginosas no mundo [51]. É vulnerável à seca, que influencia substancialmente a produção de colza [52,53,54]. Embora muitos lncRNAs tenham sido encontrados em diferentes espécies de plantas, indicando que lncRNAs podem desempenhar um papel importante na resposta a estresses abióticos, uma identificação e caracterização de todo o genoma das respostas de lncRNAs ao estresse hídrico e tratamentos de reidratação ainda está faltando, especialmente em B. napus. A fim de compreender melhor os mecanismos moleculares da resposta de B. napus ao estresse hídrico e reidratação, comparamos as mudanças no transcriptoma entre Q2 (um genótipo tolerante à seca) e Qinyou8 (um genótipo sensível à seca) em resposta ao estresse hídrico e tratamentos de reidratação no estágio de muda, e identificamos os lncRNAs envolvidos em tratamentos de estresse hídrico e reidratação. O presente estudo utilizou um método baseado em co-expressão, no qual as funções do lncRNA foram preditas, com base nas funções de seus genes codificadores de proteínas coexpressos [55]. Portanto, a rede de co-expressão lncRNA-mRNA foi construída para a análise de enriquecimento da via. Além disso, a rede de co-expressão de lncRNA-mRNA de transdução de sinal de hormônio vegetal foi analisada para explorar ainda mais os papéis potenciais de lncRNAs expressos diferencialmente em resposta ao estresse hídrico e rega.


Link entre macro lncRNA e DNA looping - Biologia

Todos os artigos publicados pela MDPI são disponibilizados imediatamente em todo o mundo sob uma licença de acesso aberto. Nenhuma permissão especial é necessária para reutilizar a totalidade ou parte do artigo publicado pela MDPI, incluindo figuras e tabelas. Para artigos publicados sob uma licença Creative Common CC BY de acesso aberto, qualquer parte do artigo pode ser reutilizada sem permissão, desde que o artigo original seja claramente citado.

Os artigos de destaque representam a pesquisa mais avançada com potencial significativo de alto impacto no campo. Artigos de destaque são submetidos a convite individual ou recomendação dos editores científicos e passam por revisão por pares antes da publicação.

O Artigo pode ser um artigo de pesquisa original, um estudo de pesquisa substancial que frequentemente envolve várias técnicas ou abordagens, ou um artigo de revisão abrangente com atualizações concisas e precisas sobre os últimos avanços no campo que analisa sistematicamente os avanços mais interessantes na área científica literatura. Este tipo de artigo fornece uma perspectiva sobre as futuras direções de pesquisa ou possíveis aplicações.

Os artigos do Editor’s Choice são baseados em recomendações de editores científicos de periódicos MDPI de todo o mundo. Os editores selecionam um pequeno número de artigos publicados recentemente na revista que eles acreditam ser particularmente interessantes para os autores ou importantes neste campo. O objetivo é fornecer um instantâneo de alguns dos trabalhos mais interessantes publicados nas várias áreas de pesquisa da revista.


Considerações ao interpretar fenótipos resultantes da mutação lncRNA

O projeto de experimentos funcionais deve ser guiado pela biologia essencial do RNA do locus lncRNA escolhido: sua proximidade com genes codificadores de proteínas, suas assinaturas de cromatina, estabilidade, número de cópias, modelos de transcrição de comprimento total e perfis de expressão em tecidos. Se ele compartilha um promotor bidirecional, minimize a interferência com o locus adjacente ao projetar estratégias de direcionamento. Se mais abundante e estável, com marcas de cromatina semelhantes a promotores em seu local de início da transcrição, considere se o lncRNA atua em trans de uma maneira dependente de RNA.

Considere todas as transcrições disponíveis, elementos regulatórios e evidências evolutivas ao projetar mutações.

Considere se, ao contrário das expectativas iniciais, o lncRNA codifica a proteína ou, como para o H19, abriga um miRNA.

Escolha da estratégia de perda de função e previsão de se o lncRNA atua em cis ou em trans deve ser informado por sua localização citoplasmática, nuclear ou cromatina. Se for encontrado no citoplasma, considere se está, de fato, traduzido. Se estiver associado à cromatina, considere se ela age em cis. Em contraste, se citoplasmático ou nucleoplasmático, considere se é trans-acting.

Escolha células para experimentos funcionais em que o lncRNA é relativamente altamente expresso, certamente em mais de uma molécula por célula.

Minimize as interrupções da sequência genômica ao investigar a função do lncRNA ou lncRNA. Use manipulações de controle para distinguir as interrupções que influenciam os genes flanqueadores daquelas que influenciam o lncRNA.

Investigar cada locus usando várias estratégias complementares, por exemplo, introdução de deleções, inversões ou interrupções direcionadas mínimas de DNA e, separadamente, de cassetes de truncamento transcricional. Considere o uso de controles para manipulações genéticas de loci lncRNA: inverter o cassete de truncamento sempre que possível, usando um cassete de truncamento mutado, usando um tipo diferente de cassete de truncamento e usando diferentes locais para truncar o lncRNA. É importante remover quaisquer cassetes de seleção e considerar a influência dos genes repórter e loxP sites no locus. Descreva totalmente o locus mutado, incluindo se a cassete de seleção é mantida.

O ensaio biológico replica separadamente. Células-tronco embrionárias (ES) ou células pluripotentes induzidas (iPS) frequentemente variam em sua cinética de diferenciação, especialmente após serem submetidas a direcionamento e seleção de genes, e embriões de camundongo, particularmente embriões de camundongo em estágio inicial de implantação, mostram uma variação considerável no tempo de desenvolvimento. Da mesma forma, as linhas de células cancerosas são inerentemente geneticamente instáveis. Essa variabilidade torna essencial estudar vários clones de células ou mutantes derivados de forma independente para garantir que os efeitos observados sejam devidos à mutação de interesse e não dependentes de outros efeitos do fundo genético. Isso é especialmente importante quando os efeitos fenotípicos são sutis.

Avaliação da evidência da funcionalidade do lncRNA

Considere a evidência para cada um dos muitos conhecidos transcricionais ou pós-transcricionais, nucleares ou citoplasmáticos, cis ou trans, Mecanismos dependentes ou independentes de RNA de lncRNAs.

Empregar técnicas baseadas em RNAi principalmente ao investigar RNAs citoplasmáticos e mecanismos dependentes de RNA pós-transcricionais. Se estiver usando RNAi, o efeito knockdown no compartimento citoplasmático e nuclear deve ser determinado separadamente. Uma alternativa é usar oligos de DNA antisense para induzir uma atividade de RNase H no núcleo.

Afirme apenas que um fenótipo é causado pela alteração de um trans- agindo transcrito de lncRNA quando ele é resgatado com sucesso e repetidamente após a expressão do lncRNA de um transgene independente.

Aproveite as vantagens de abordagens bioquímicas cuidadosamente controladas ao avaliar a função potencial de um lncRNA.

Publicações e relatórios

Avaliar e relatar objetivamente todas as evidências a favor ou contra a função dependente da sequência do RNA ou função dependente da transcrição (independente da sequência do RNA).

Relate os fenótipos com precisão. Comumente, os knockouts de genes matam embriões em períodos críticos, por exemplo, implantação, gastrulação, 12,5 dpc quando o sistema cardiovascular se torna essencial e no nascimento, quando os pulmões e muitos outros sistemas se tornam essenciais. Em geral, os órgãos maternos resgatam muitos defeitos de órgãos do embrião. Para as células ES, os fenótipos que afetam a pluripotência precisam ser definidos e devem ser considerados com cautela devido à instabilidade inerente desse estado.

Explicitamente, tenha cuidado quando houver evidência de função dependente de RNA vs independente, ou trans- vs cisfunção de atuação, não é bem definida.

Estratégias de perda de função in vivo

Diferentes estratégias de perda de função genética podem ser empregadas in vivo para estudar a função de lncRNAs (Figura 2). A priorização da estratégia deve depender da biologia conhecida do lncRNA, incluindo sua localização em um ou mais citoplasma, núcleo ou cromatina. Em um estudo, a maioria dos lncRNAs humanos foram enriquecidos no citoplasma (van Heesch et al., 2014) e estes podem se associar com ribossomos e, ao contrário do que se espera, alguns podem ser traduzidos (Guttman et al., 2013 Kim et al. , 2014, Wilhelm et al., 2014). Os lncRNAs nucleares, particularmente aqueles que estão associados à cromatina, podem atuar como cis-actuando reguladores transcricionais, enquanto lncRNAs citoplasmáticos ou nucleoplasmáticos podem funcionar em trans em contraste, alguns lncRNAs nucleoplasmáticos podem, é claro, ser produtos não funcionais da transcrição.

Diferentes estratégias para análise de perda de função de lncRNA. As estratégias que foram usadas para alterar a função do lncRNA são descritas pictoricamente, com a situação do tipo selvagem na linha superior.

O locus lncRNA é indicado em rosa, o gene vizinho que codifica a proteína em azul, os locais de ligação do fator de transcrição dentro dele por ovais azuis e roxas, as sequências do terminador da transcrição em amarelo ("Termo") e o processo de transcrição por linhas pontilhadas em cinza. Os oligonucleotídeos antisense são capazes de se ligar a transcritos de RNA nascentes e desencadear a degradação mediada por RNase H do transcrito no núcleo. O RNAi é provocado por espécies curtas de RNA que se ligam às proteínas argonauta (Ago, oval verde) dentro da célula. Este complexo reconhece moléculas de lncRNA complementares no citoplasma e desencadeia sua desestabilização pela maquinaria celular endógena. Os sistemas CRISPR e TALE usam fatores de ligação de DNA projetados para recrutar domínios repressores ou ativadores (oval laranja) para o lncRNA para afetar a iniciação da transcrição. Os efeitos de cada estratégia sobre o processo de transcrição e presença de elementos de DNA subjacentes, como locais de ligação a fatores de transcrição, são indicados. A possibilidade de gerar animais transgênicos estáveis ​​para investigar fenótipos ao longo do desenvolvimento também é observada.

A depleção de transcritos codificadores de proteínas é frequentemente alcançada usando técnicas baseadas em RNAi, que fornecem RNA de fita dupla que é capaz de desencadear a desestabilização pós-transcricional do mRNA maduro e inibir a tradução, predominantemente no citoplasma. Embora a presença de fatores de RNAi ativos em núcleos de células humanas tenha sido proposta (Gagnon et al., 2014), a extensão em que lncRNAs exclusivamente nucleares podem ser derrubados permanece obscura. Embora útil para estudos de muitos transAgindo lncRNAs, o knockdown baseado em RNAi atua pós-transcricionalmente e, portanto, não bloqueia o ato de transcrição, impedindo análises de lncRNAs que podem produzir seus efeitos por meio desse mecanismo.

Outra abordagem experimental é manipular geneticamente o locus lncRNA. Ao inserir sequências terminadoras transcricionais, deve-se ter cuidado para controlar as mudanças no espaçamento entre os elementos reguladores do DNA e levar em consideração os elementos reguladores que podem ser inseridos inadvertidamente, como promotores de genes de resistência, uma vez que estes podem ser capazes de conduzir a expressão de genes vizinhos ou desviar atividades de intensificadores próximos. A inserção de sequências exógenas pode induzir fenótipos (Steshina et al., 2006). Mesmo solteiro loxP os locais podem atrair a metilação da linha germinativa que pode potencialmente reprimir os elementos reguladores de flanco (Rassoulzadegan et al., 2002). Controles extras são, portanto, necessários para identificar possíveis efeitos de ganho de função decorrentes de sequências inseridas, como repórteres ou cassetes de seleção. O advento de nucleases programáveis ​​(Kim e Kim, 2014) oferece oportunidades para investigar essas possibilidades. As sequências terminadoras da transcrição podem variar em sua eficácia, dependendo do contexto genômico no qual são inseridas, o que pode fazer com que a terminação seja altamente ineficiente. Por exemplo, uma sequência que termina de forma eficiente a transcrição em vários contextos em Airn, não o fez quando inserido próximo a uma ilha CpG (Latos et al., 2012).

Outras abordagens incluem a deleção do locus lncRNA de comprimento total ou sua sequência promotora, mutação de domínios funcionais putativos ou interrupção direcionada entre o promotor e a sequência de RNA por meio de uma inversão projetada (Figura 2 Tabela 1). Embora úteis, essas estratégias podem nem sempre ser bem-sucedidas. A inversão do promotor, por exemplo, nem sempre pode anular a transcrição, devido à bidirecionalidade dos promotores (Wu e Sharp, 2013), e a deleção do promotor também pode interromper o nível de expressão dos transcritos codificadores de proteínas com os quais os lncRNAs compartilham um promotor bidirecional. Em todos esses casos, é importante minimizar a remoção ou reorganização dos locais de ligação de fatores regulatórios ou outros elementos reguladores dentro do DNA, e controlar a adição de novos locais de ligação. Por exemplo, deve-se ter em mente que muitos lncRNAs iniciam dentro de potenciadores (Marques et al., 2013) e, nesses casos, a interrupção do promotor lncRNA também pode causar alterações não intencionais na expressão gênica. No caso de terminadores de transcrição, para garantir que os efeitos sejam devidos a mudanças no RNA em vez de no DNA, podem ser usadas inversões da sequência do terminador ou uma variedade de terminadores diferentes. No projeto experimental, também é importante considerar transcritos com splicing alternativo e locais de início da transcrição adicionais para garantir a anulação total da expressão de lncRNA.

Os oligonucleotídeos anti-sentido podem fornecer uma técnica alternativa para a análise da função lncRNA. Acredita-se que eles atuem formando um híbrido DNA / RNA com o transcrito de RNA nascente e desencadeando a degradação dependente de RNase H do RNA no núcleo (Figura 2). Isso reduz o nível do RNA antes que o transcrito maduro seja produzido, mas a natureza e a extensão dos efeitos fora do alvo não são totalmente compreendidos e podem ser substanciais (Sahu et al., 2007). Além disso, não é possível gerar linhas transgênicas estáveis, o que restringe a análise a linhas celulares ou a sistemas onde os oligonucleotídeos podem ser fornecidos por injeção. Outras abordagens para interromper a função de lncRNA usam o direcionamento de oligos anti-sentido de morfolino, e. sites de splice (Ulitsky et al., 2011), ou oligonucleotídeos antisense de ácido nucleico bloqueado (Sarma et al., 2010).

Desenvolvimentos recentes no projeto racional de fatores de ligação de DNA usando proteínas efetoras semelhantes a ativadores de transcrição (TALE) ou o sistema de repetições palindrômicas regularmente intercaladas (CRISPR) permitiram o recrutamento de ativação transcricional (Cheng et al., 2013) ou domínios de repressão (Cong et al., 2012 Gilbert et al., 2013) para definir locais dentro do genoma para modular a transcrição, ou para interferir diretamente na passagem da RNA polimerase. Essas técnicas poderiam ser usadas para modular a taxa de iniciação ou alongamento da transcrição do lncRNA (Figura 2), mas deve-se ter cuidado para controlar os efeitos diretos desses fatores na transcrição de genes vizinhos.

Separando efeitos dependentes de sequência de RNA de DNA

A deleção de um locus genômico de lncRNA não separa claramente uma função do lncRNA per se de uma função de outros elementos funcionais contidos no DNA subjacente. Esses elementos podem ser irrelevantes para a função do lncRNA, mas críticos para a função normal de um gene vizinho que codifica uma proteína. Dezoito linhas de nocaute de camundongos foram recentemente descritas nas quais regiões genômicas contendo loci lncRNA intergênicos (tamanho médio de 21,6 kb, intervalo de 4,8 kb-49,7 kb) foram deletadas e substituídas por um lacZ cassete repórter (Sauvageau et al., 2013). Para 13 dessas linhas, nenhum fenótipo evidente foi relatado. Em contraste, fenótipos fortes de 5 linhas de eliminação foram observados: Perigo −/− ou Fendrr −/− ratos reduziram a viabilidade Mdgt −/− e linc-pint −/− camundongos apresentam defeitos de crescimento e linc-Brn1b −/− camundongos exibem anatomia cortical anormal. Os autores concluem que esses distúrbios do desenvolvimento gerados por deleções de DNA demonstram os papéis críticos que os lncRNAs desempenham in vivo (Sauvageau et al., 2013).

Embora esta possa ser a interpretação correta, os fenótipos fortes observados nessas linhas podem derivar da deleção projetada de cis- elementos reguladores do DNA que se encontram dentro dessas grandes deleções de DNA que são críticas para as funções normais dos genes codificadores de proteínas proximais. Por exemplo Fendrr é 1,4 kb de Foxf1, e Mdgt começa a apenas 84 bp do exon 5 ′ de Hoxd1 e termina perto de Hoxd3 (Figura 3). Consistente com esta noção, os dados do projeto ENCODE indicam que a região genômica excluída em Mdgt −/− as linhas contêm locais de ligação para vários fatores de transcrição e proteínas reguladoras da cromatina (Figura 3). Embora os autores não tenham detectado nenhuma mudança global na expressão de genes codificadores de proteínas vizinhas, conforme avaliado por RNAseq limitado de tecidos, ainda é possível que o tipo de célula alterado ou a expressão específica do estágio de desenvolvimento desses genes tenham escapado à detecção. Os LncRNAs são frequentemente transcritos em uma população de células altamente restrita e uma análise global de alto rendimento até mesmo do embrião inteiro pode não ter sido informativa. Em última análise, a melhor evidência para a função de lncRNA dependente de RNA deriva da perda de função, seguida por abordagens de complementação, como, por exemplo, descrito em Grote et al. (2013).

Dados ENCODE humanos e de camundongo indicam que Mdgt −/− as linhas contêm deleções de locais de ligação conservados para fatores de transcrição e proteínas reguladoras da cromatina.

A deleção projetada em camundongos, e sua sequência equivalente em humanos, são indicadas por retângulos vermelhos e abrangem 85% (12,4 kb de 14,7 kb) da sequência intergênica entre camundongos Hoxd1 e Hoxd3. Mdgt, virtualmente compartilha seu site inicial com Hoxd1, um gene expresso com especificidades requintadas em apenas algumas populações de células durante o desenvolvimento inicial (Zakany et al., 2001). Os locais de ligação do fator de transcrição previsto (TFBs) que são conservados em humanos, camundongos e ratos são mostrados contra o genoma humano (Consortium, 2012 Ernst e Kellis, 2012). Os números de TFBs determinados experimentalmente por intervalo genômico são mostrados no histograma, e grupos de locais de hipersensibilidade à DNase 1 também são mostrados alinhados contra o locus humano. As ilhas CpG previstas adquiridas do navegador do genoma UCSC são mostradas em verde e os alinhamentos humanos-camundongos em cadeia são mostrados em verde oliva. As pontuações de conservação evolutiva (GERP) são indicadas abaixo do locus do mouse.

Este problema também é relevante para outros lncRNAs transcritos de dentro Hox aglomerados de genes. No caso de Ar quente (Rinn et al., 2007), uma grande deleção de vários kb de todo o Ar quente DNA genômico in vivo induz um fenótipo morfológico sutil na coluna, que foi interpretado como um ganho de função de Hoxd genes em trans (Li et al., 2013). Contudo, Ar quente está embutido no HoxC agrupamento de genes e modificações topológicas ou rearranjos em tal série densa de unidades de transcrição provavelmente modificarão a expressão de genes vizinhos. Mais insights foram adquiridos removendo todo o HoxC locus, incluindo tanto o locus lncRNA quanto os genes flanqueadores (Suemori e Noguchi, 2000 Schorderet e Duboule, 2011). Mesmo quando vários alelos estão disponíveis, como para Ar quente, a função lncRNA permanece difícil de avaliar.

Especificidade de expressão e série alélica

Exclusão do mouse Ar quente O lncRNA também induziu um fenótipo de desenvolvimento sutil no pulso (Li et al., 2013). No entanto, porque murino Ar quente transcrições não foram detectadas em botões de membros anteriores em desenvolvimento (Schorderet e Duboule, 2011), ainda é possível que este fenótipo se desenvolva a partir da falta de Ar quente RNAs durante os estágios subsequentes do desenvolvimento do punho. Essa possibilidade só poderia ser avaliada por uma análise mais aprofundada do padrão de expressão desse lncRNA. A introdução sistemática de um cassete repórter em lncRNAs (Sauvageau et al., 2013) pode ajudar a resolver este problema, desde que a diferença entre a estabilidade da coloração repórter e a meia-vida do RNA seja mantida em mente, em particular para pequenos e populações de células dinâmicas (Zakany et al., 2001).

Quanto aos genes que codificam proteínas, uma descrição exaustiva das características funcionais associadas a um lncRNA particular não pode ser obtida usando um único alelo mutante, portanto, séries alélicas são necessárias. Como indicado acima, a natureza dos alelos necessários para avaliar a função de um dado lncRNA depende de sua localização genômica e sua especificidade de expressão durante o desenvolvimento e a idade adulta. Isso pode ser bastante desafiador, como exemplificado pelo bidirecional Cachorro-quente e Gêmeo de cachorro-quente lncRNAs: embora esses RNAs estejam localizados a centenas de kb de distância do HoxD cluster de genes no meio de um deserto de genes, seu local de início compartilhado interage fisicamente com Hoxd genes como parte de uma estrutura regulatória geral. Neste caso, um cis-efeito poderia, em princípio, ser avaliado separando os loci lncRNA do HoxD cacho através da uma grande inversão com um ponto de interrupção no meio. Acontece, no entanto, que essa inversão interrompe globalmente a regulação de HoxD ao deslocar intensificadores de ação de longo alcance junto com os loci lncRNA, dificultando a interpretação (Delpretti et al., 2013).

Discrepâncias entre diferentes estratégias

O lncRNA Fendrr foi estudado usando duas estratégias independentes: deleção genética (Sauvageau et al., 2013) e inserção do terminador transcricional (Grote et al., 2013). Embora ambos os estudos descrevam um fenótipo letal, destacando a importância potencial deste lncRNA no desenvolvimento, os resultados são diferentes. A deleção genética resulta em maturação pulmonar e defeitos de diferenciação mesenquimal (Sauvageau et al., 2013), enquanto a inserção do terminador leva a defeitos do coração e da parede corporal e a efeitos na expressão do corpo vizinho Foxf1 gene (Grote et al., 2013). É importante ressaltar que os defeitos causados ​​pela inserção do terminador foram resgatados por um transgene contendo uma única cópia de tipo selvagem do Fendrr Locus lncRNA (sem seu funcional Foxf1 vizinho), isso implica fortemente a exclusão do produto de RNA, ao invés de seu DNA genômico, como causador dos fenótipos observados (Grote et al., 2013). Experimentos de resgate de transgene são, portanto, cruciais para estabelecer a função de lncRNA dependente de RNA. Uma ilustração anterior bem-sucedida desse princípio foi o resgate de defeitos de desenvolvimento no peixe-zebra por co-injeção de RNA emendado para cada um dos dois lncRNAs, Cyrano e megamind, cujos RNAs precursores foram derrubados usando oligos anti-sentido de morfolino (Ulitsky et al., 2011). No entanto, as sequências regulatórias necessárias para a transcrição do próprio lncRNA devem ser idealmente incluídas na construção de resgate de modo a manter os níveis fisiológicos de expressão. Isso, adicionado ao comprimento dos lncRNAs que às vezes podem atingir várias centenas de kb, pode representar um desafio para uma abordagem transgênica.

Diferenças substanciais também foram observadas entre o knockdown mediado por RNAi e a inserção do terminador da transcrição no Evf-2 Locus lncRNA (Feng et al., 2006 Bond et al., 2009 Berghoff et al., 2013 Kohtz, 2014). Este lncRNA é transcrito através de um elemento potenciador entre o Dlx5 e Dlx6 genes, e estudos iniciais em cultura de células usando RNAi sugeriram um modelo pelo qual Evf-2 foi importante para a ativação de Dlx5 / 6 (Feng et al., 2006). No entanto, a inserção do terminador transcricional em camundongos mostrou o efeito oposto na expressão de Dlx5 / 6 (Bond et al., 2009) e causa alterações específicas na metilação do DNA no intensificador. É importante ressaltar que essas mudanças podem ser resgatadas por Evf-2 expressão de um transgene separado, o que implica que eles são dependentes do próprio lncRNA (Berghoff et al., 2013).

Da mesma forma que neste exemplo, knockdown de lincRNA-p21 por RNAi originalmente sugeriu um trans-mecanismo atuante, no qual o lncRNA estava envolvido no recrutamento de complexos de proteínas para a cromatina (Huarte et al., 2010). No entanto, estudos subsequentes em que o promotor do lncRNA foi deletado ou sua transcrição foi bloqueada por oligonucleotídeos antisense destacaram um papel diferente, já que este lncRNA regula o adjacente p21 gene em cis, sem ter transefeitos atuantes (Dimitrova et al., 2014). Embora ambos os estudos tenham analisado por RNAseq o efeito da depleção de lncRNA na expressão gênica global em fibroblastos embrionários de camundongo, os dois conjuntos de genes expressos diferencialmente não se sobrepuseram significativamente. Ao analisar a função do lncRNA, é importante considerar várias estratégias de perda de função que tratam de vários mecanismos de ação.

Os potenciais efeitos de confusão das técnicas utilizadas para separar a função dependente de DNA de RNA são ainda exemplificados por estudos da Drosophila bxd lncRNA, que é expresso de dentro do cluster HOX, adjacente ao Ultrabitórax (Ubx) gene. Sua expressão é altamente específica e ocorre na mesma ampla região do embrião que o Ubx gene, embora notavelmente nunca dentro da mesma célula (Petruk et al., 2006). Estudos de bxd a perda de função usando técnicas diferentes gerou interpretações conflitantes. Há muito se sabe que pequenas deleções dentro deste lncRNA causam efeitos dramáticos na expressão do vizinho Ubx gene (Lewis, 1978), resultando em transformações homeóticas. Na verdade, certas combinações alélicas são capazes de gerar uma mosca de quatro asas. Estudos mais recentes das mesmas deleções sugerem que o ato de transcrição deste lncRNA reprime Ubx no cis alterando a ligação da proteína ao Ubx promotor (Petruk et al., 2006). Em contraste, foi relatado que a inversão do bxd promotor, conduzindo a transcrição na direção errada enquanto mantém a composição genômica, resulta em efeitos muito menores sobre Ubx expressão, e então apenas mais tarde no desenvolvimento (Pease et al., 2013). Além disso, uma deleção removendo o promotor induziu um Cdx- como ganho de função de Ubx (Sipos et al., 2007). Claramente, a interpretação correta de tais experimentos de perda de função, em tais loci complexos, requer consideração cuidadosa de fatores potencialmente confusos.

Resultados contrastantes de diferentes experimentos também podem surgir por causa do envolvimento de um lncRNA em diferentes mecanismos em diferentes contextos celulares. Por exemplo, em células embrionárias, a transcrição de Airn silencia o adjacente Igf2r gene (Latos et al., 2012), enquanto em tecidos extraembrionários atua mais distalmente, recrutando a histona metiltransferase G9a para genes impressos (Nagano et al., 2008).

O fim do começo: um campo de lncRNA em maturação

O estudo de lncRNAs ainda está em sua infância, e as técnicas bioquímicas e genéticas usadas para abordar o verdadeiro significado e os mecanismos de ação dessa classe de RNA só recentemente foram desenvolvidas ou adaptadas daquelas usadas para investigar genes codificadores de proteínas. Tais técnicas devem, portanto, ser usadas com cautela e com controles apropriados (Brockdorff, 2013 Riley e Steitz, 2013). A partir dos exemplos descritos acima, é evidente que a estratégia ideal para estudar a perda de função de um lncRNA depende do mecanismo pelo qual ele atua, em particular em um cis ou trans configuração e as sequências regulatórias presentes em seu locus. Sugerimos que as primeiras lições aprendidas com lncRNAs repressores de paradigma, como Xist, e lncRNAs impressos, como Airn ou Kcnq1ot1, deve orientar o planejamento de experimentos em lncRNAs identificados mais recentemente. Tentamos destilar essas lições nas considerações propostas na Caixa 1. A introdução dos alelos múltiplos que serão necessários para dissecar adequadamente a função do lncRNA in vivo será muito auxiliada pelos avanços recentes na engenharia do genoma usando nucleases específicas do local projetadas, como CRISPR / Cas9 e TALENs. A introdução de sistemas de perda de função aguda rápida para lncRNAs, por exemplo aqueles que inserem um sítio de ribonuclease específico de sequência cuja nuclease está sob controle induzível por fármaco, também facilitaria muito a investigação de lncRNA.

o trans A função de um lncRNA pode ser investigada usando deleção de locus, deleção de promotor, inversões, terminação transcricional ou RNAi. Sempre que possível, essas estratégias devem ser combinadas com experimentos de resgate genético, onde o lncRNA é expresso a partir de um transgene independente inserido em um local distinto do locus lncRNA. Essa estratégia separa os efeitos dependentes de RNA daqueles decorrentes da manipulação do DNA subjacente. Experimentos de resgate usando a expressão do lncRNA de um transgene independente são possíveis apenas para trans- lncRNAs atuando onde a própria porção do RNA e não o ato da transcrição é crítica para a função.

o cis A função de um lncRNA pode ser investigada usando uma combinação de vários alelos, tais como inserção de terminadores transcricionais, deleções de promotor e inversões. É provável que vários alelos sejam necessários para separar lncRNA-dependente de outros efeitos e, como controles, para revelar artefatos de engenharia genética. Inversões projetadas também podem ser usadas para separar o locus lncRNA de seu potencial gene alvo vizinho para investigar seus papéis em cis. O uso de recombinases específicas do local, como o sistema phiC31 / attP (Bateman et al., 2006 Zhu et al., 2014) como 'locais de aterrissagem' ou para troca de cassete mediada por recombinação, aumentará muito nossa capacidade de gerar tais séries alélicas . Por exemplo, o locus lncRNA pode ser excluído e substituído por um "local de aterrissagem" de recombinase no qual diferentes construtos podem ser introduzidos para investigar o resgate de fenótipo.

Em resumo, se os biólogos do lncRNA quiserem resolver as verdadeiras funções in vivo dessas numerosas e enigmáticas transcrições, então os pontos fortes e fracos das técnicas disponíveis precisarão ser reconhecidos. A resolução, sem dúvida, derivará da dissecção genética cuidadosa e abrangente de loci individuais usando alelos múltiplos. O campo da biologia de lncRNA se beneficiaria muito com o desenvolvimento de abordagens adicionais que são eficazes na distinção de efeitos mediados por lncRNAs como espécies moleculares de seu efeito em elementos reguladores de genes com os quais os loci lncRNA são intercalados em todo o genoma de mamífero.


Assista o vídeo: RNA Stem Loops (Julho 2022).


Comentários:

  1. Jabari

    Estou final, sinto muito, mas é absolutamente outro, em vez disso é necessário para mim.

  2. Erian

    Esta é uma mensagem valiosa

  3. Mogore

    que faríamos sem a sua ideia brilhante



Escreve uma mensagem