Evolución molecular de RAMOSA1 (RA1) en plantas terrestres

Artículo


RAMOSA1 (RA1) es un factor de transcripción de dedo de zinc de tipo Cys2-His2 (C2H2) que controla el destino y la identidad del meristemo de las plantas y ha desempeñado un papel importante en la domesticación del maíz. A pesar de su importancia, se desconoce el origen de RA1 y la evolución en plantas solo se entiende parcialmente. En este artículo, presentamos una filogenia bien resuelta basada en 73 secuencias de aminoácidos de 48 especies de embriofitas. La topología del árbol recuperada indica que, durante la evolución de las gramíneas, RA1 surgió de dos duplicaciones consecutivas de SUPERMAN, lo que dio lugar a tres linajes de secuencias de gramíneas distintos: RA1-like A, RA1-like B y RA1; sin embargo, la mayoría de estas copias tienen funciones desconocidas. Nuestros hallazgos indican que RA1 y RA1-like desempeñan funciones en el núcleo a pesar de carecer de una señal de localización nuclear tradicional. Aquí, informamos que las copias diversificaron su región codificante y, con ella, su estructura proteica, lo que sugiere diferentes patrones de unión al ADN e interacción proteína-proteína. Además, cada una de las copias retenidas diversificó los elementos reguladores a lo largo de sus regiones promotoras, lo que indica diferencias en su regulación previa. En conjunto, la evidencia indica que las familias de genes RA1 y similares a RA1 en las gramíneas experimentaron subfuncionalización y neofuncionalización posibilitadas por la duplicación génica.

Resultados

Análisis filogenético

Evolución del SUP y origen del RA1

El BLASTp busca secuencias de SUP recuperadas a lo largo de la mayoría de las especies de embriofitas, excepto de M. polymorpha y S. moellendorffii . Para identificar el origen de RA1 y entender su evolución, reconstruimos un árbol filogenético con secuencias de aminoácidos obtenidas de genomas de gramíneas y otras embriofitas. Para eso, usamos secuencias de SUP de plantas sin semillas ( P. patens y C. purpureus ) como grupos externos. La topología del árbol recuperado, y la presencia de una secuencia de copia única de la gramínea P. latifolia sugiere que RA1 se originó a partir de dos duplicaciones sucesivas de SUP que ocurrieron en la división del clado BOP y PACMAD ( Figura 1 ). Como resultado de estas duplicaciones, se generaron tres linajes de secuencias; uno de ellos incluye secuencias de RA1, y los otros dos se denominan aquí arbitrariamente RA1-like A y RA1-like B. En este árbol, las relaciones evolutivas entre RA1 y RA1-like siguen sin estar claras.
Figura 1. Evolución de SUP y origen de RA1. Árbol de consenso de regla mayoritaria (N = 22502 árboles) del factor de transcripción RA1 en embriofitas generado por inferencia bayesiana utilizando 73 secuencias de péptidos ( Figura S1 y Tabla S1 ). Los puntos negros indican probabilidad posterior bayesiana (PP) = [0,9 a 1]. Las flechas verdes indican eventos de duplicación génica. El asterisco negro señala proteínas con función conocida ( Tabla S2 ).

Evolución de RA1 en gramíneas

Para obtener una resolución sobre la relación entre RA1 y RA1-like, reconstruimos una nueva filogenia con secuencias de aminoácidos obtenidas de 16 genomas de especies de gramíneas usando como grupo externo la secuencia SUP de la ascendencia monocotiledónea J. ( Figura 2 a, Figuras S2 y S3 ). La topología del árbol obtenida sugiere la posibilidad de que (1) RA1 se originó después de una segunda duplicación alrededor de la división de los clados BOP y PACMAD, (2) RA1 es hermana de las proteínas B similares a RA1, (3) RA1 se perdió en el clado BOP y actualmente está presente en el clado PACMAD, (4) RA1-like A y RA1-like B se encuentran en especies de los clados BOP y PACMAD, y (5) las duplicaciones específicas de especies y la pérdida de algunas copias de RA1 y RA1-like sugieren una evolución compleja de estas moléculas durante la diversificación de las gramíneas ( Figura 2 a y Figura S4 ). En general, SUP , RA1 y RA1-like son genes de copia única, a excepción de las dos variantes RA1 encontradas en S. bicolor , como se describió previamente [ 2 ] ( Figura 2 a).
Figura 2. Evolución de RA1 en gramíneas. ( a ) Árbol de consenso de regla mayoritaria (N = 22502 árboles) de factores de transcripción RA1 y similares a RA1 en especies de gramíneas generados por inferencia bayesiana utilizando 35 secuencias de aminoácidos ( Figuras S2 y S3 y Tabla S1 ). Cada clado se identifica con un color. Los puntos negros indican probabilidad posterior bayesiana (PP) = [0,9 a 1]. El asterisco negro señala proteínas con función conocida ( Tabla S3 ). ( b ) Patrones de distribución de motivos en secuencias de aminoácidos RA1 y similares a RA1 en especies de gramíneas. Los cuadros de colores representan la aparición de motivos ( Figuras S7 y S8 ). ( c ) Logotipo de representación de secuencia del Motivo 1 obtenido a partir del alineamiento de secuencias múltiples ( Figura S9 ). La punta de flecha negra indica la variante de aminoácidos (A- > G) en el Motivo 1.
Las anotaciones del genoma indican que SUP está en Chr3:8242256…8243372 del genoma de Arabidopsis, mientras que RA1 , RA1-like A y RA1-like B están en los cromosomas de maíz Chr7:114958642…114959398, Chr5:68312034…68312578 y Chr10:103427449…103428364, respectivamente. Los mapas de visualización de colinealidad cromosómica indican que el cromosoma 3 de Arabidopsis carece de sintenia con los cromosomas de maíz 7, 5 y 10 ( Figura S5 ). Por el contrario, los genes RA1 y RA1-like se colocan en bloques cromosómicos sinténicos entre el maíz, la Setaria y el arroz ( Figura S6 ). Estos resultados sugieren que RA1 y RA1-like son parálogos sinténicos.

Análisis de motivos conservados entre secuencias codificantes RA1 y similares a RA1

Para descubrir características específicas que caracterizan la región codificante de cada linaje, realizamos un análisis de motivos ( Figura 2 b). Buscamos 15 motivos diferentes usando MEME para comprender mejor la plasticidad de secuencias ( Figuras S7 y S8 ). Algunos de ellos son específicos del linaje (por ejemplo, Motivo 7 (WPPPQVRS), Motivo 8 (PPPNPNPSCTVLDL), Motivo 11 (FPWPPQ), Motivo 12 (VVCSCSST) y Motivo 13 (MESRSAARAGDQQH)), y otros son compartidos por linajes, como el Motivo 3 (ARAPJPNLNYSPPHPA), que está presente en secuencias A similares a RA1 y B similares a RA1, mientras que el Motivo 4 (APPVVYSFFSLAASA) es compartido por secuencias RA1 y B similares a RA1 ( Figura 2 b y Figura S7 ). Todas las secuencias tienen en común la presencia de un dominio de dedo de zinc C2H2 (Motif 1 (SSSSSYTCGYCKREFRSAQALGGHMNVHRRDRARLRHGQSP)) ( Figura 2 b y Figura S9 ). En particular, las secuencias del linaje RA1 tienen la variante QGLGGH en el dominio de dedo de zinc, como se informó previamente [ 2 ] ( Figura 2 c). Además, Motif 2 (GDGAEEGLDLELRLG) apareció dos o tres veces hacia el C-terminal de todas las secuencias. Nuestro análisis identificó dos Motif 2 a lo largo del C-terminal de las secuencias similares a RA1, mientras que se detectaron tres Motif 2 en la mayoría de las secuencias RA1 del clado PACMAD ( Figura 2 b y Figura S9 ). Además, encontramos que el número de Leu (L) y las distancias entre los Motifs 2 varían entre clados ( Figura 2 b y Figura S9 ). Según la literatura, el motivo 2 es un supuesto motivo represor similar a EAR [ 2 , 41 , 42 , 43 , 44 , 45 ].

Localización subcelular

Para determinar la localización subcelular in vivo de las proteínas RA1 y similares a RA1 del maíz y S. viridis , generamos una fusión traduccional N-terminal con GFP. Las construcciones 35S:GFP:RA1 y similares a 35S:GFP:RA1 se analizaron mediante un sistema de expresión transitoria en hojas jóvenes de tabaco agroinfiltradas. La fluorescencia se observó a través de un microscopio confocal de barrido láser. Se utilizó tinción DAPI para visualizar la localización de los núcleos. Como se muestra en la Figura 3 , las proteínas RA1 y similares a RA1 se localizan en los núcleos de las células epidérmicas del tabaco.
Figura 3. Análisis de la localización subcelular de las proteínas RA1 y similares a RA1. Localización subcelular de las construcciones RA1-GFP, SvRA1-GFP, SvRA1-like A-GFP y SvRA1-like B-GFP en células epidérmicas de hojas de tabaco. El color verde es la señal de la proteína GFP. El color azul representa el núcleo teñido con DAPI.

Modelado molecular

Estructura secundaria y plasticidad conformacional de las proteínas

Las propiedades de estructura secundaria de los miembros SUP/RA1 están pobremente caracterizadas [ 33 , 46 ]. Solo el tipo C2H2 de dedo de zinc de SUP ha tenido su estructura secundaria resuelta experimentalmente por RMN [ 33 ]. Entonces, para obtener una perspectiva de la estructura de la proteína entre SUP, RA1 y RA1-like, se llevaron a cabo predicciones de estructuras secundarias utilizando PsiPred Workbench ( http://bioinf.cs.ucl.ac.uk/psipred ) y su herramienta PsiPred 4.0 [ 29 ]. También utilizamos la herramienta del servidor DisoPred 3.1 [ 30 ] para predecir regiones a las que no se les puede asignar una estructura secundaria conocida, que se denominan regiones desordenadas. El mismo algoritmo también predice regiones con alta probabilidad de unirse a otras proteínas. Estas propiedades se muestran gráficamente en la Figura 4 y la Figura S10 y la Tabla S4 como una función del número/nombre del residuo. En general, se predice que la región N-terminal de SUP, RA1 y RA1-like está desordenada con afinidades de unión a proteínas. Asignados dentro del segmento desordenado N-terminal hay motivos comunes compartidos entre linajes, como el Motivo 4 y 5 ( Figura 2 b). La región desordenada N-terminal es seguida por una región definida como una bobina que continúa con el dominio de tipo C2H2. Las predicciones estructurales sugieren que el dedo de zinc está formado por una lámina β (dos hebras β consecutivas) seguida de una hélice α ( Tabla S4 ). En general, el C-terminal de RA1 y RA1-like se presenta como una región desordenada con afinidades de unión a proteínas. Asignado dentro del segmento desordenado C-terminal está el Motivo 3 compartido por RA1-like A y RA1-like B ( Figura 2 b). Además, encontramos segmentos ordenados estabilizados, como dos a tres hélices α. Estos segmentos ordenados están correlacionados principalmente con la asignación del motivo 2 ( Figura 4 y Figura S10 y Tabla S4 ).
Figura 4. Estructura secundaria y plasticidad conformacional de las proteínas. ( a ) Predicción de la estructura secundaria de las proteínas SUP, ZmRA1-like A, ZmRA1-like B y RA1 obtenida por el servidor PsiPred. La hélice α correspondiente al dominio de dedo de zinc está representada en naranja. La hélice α correspondiente al Motivo 2, supuesto motivo EAR, está representada en violeta. Otras hélices α están representadas en rosa. Las cadenas β están representadas en amarillo. ( b ) Niveles relativos de desorden de las estructuras medidos en un rango de 0 a 1,0 ( Figura S10 y Tabla S4 ). Los niveles superiores a 0,5 (línea discontinua) se consideran regiones desordenadas. Abreviaturas: ZF, dominio de dedo de zinc; EAR, motivos represores EAR.

Simulación de dinámica molecular con dedos de cinc

El dedo de zinc de SUP (1NJQ) es una estructura resuelta por RMN (20 modelos), que tiene un 75% de identidad de secuencia con el dedo de zinc de RA1 ( Figura S11a ). No existe una estructura experimental de RA1. Dadas las diferencias en la identidad de secuencia entre SUP y RA1, realizamos simulaciones de dinámica molecular de 1μs de cada dominio de dedo de zinc de la proteína para evaluar las diferencias en la estabilidad estructural de estas variantes. Los RMSD de estas simulaciones en función del tiempo simulado ( Figura S11b ) muestran pequeñas desviaciones de sus valores iniciales (valores promedio de RMSD menores a 0.5Å). Este hecho está asociado con la robustez de la estructura del dominio de dedo de zinc de ambas proteínas y la proximidad de los modelos iniciales a las estructuras equilibradas. Asumimos que el tiempo simulado en el período [0.8μs, 1.0μs] es adecuado para calcular las propiedades de equilibrio de los sistemas ya que los RMSD de las simulaciones de ambas proteínas muestran pequeñas fluctuaciones sin ninguna tendencia definida apreciable.
El análisis de la evolución temporal de la estructura secundaria de los péptidos SUP y RA1 mostró el patrón clásico de un dedo de zinc con una lámina β compuesta por dos hebras (Y47T48-F55E56 e Y46T47-F54E55 en SUP y RA1, respectivamente) y un giro estabilizado por enlaces de hidrógeno (S50F51C52 y G49Y50C51 para SUP y RA1), seguido de una hélice α (A59:H69 y A58:R72 para SUP y RA1) ( Figura 5 a, Tabla S4 ). El motivo estructural de hélice α es cuatro residuos más largo para el caso de RA1 (un giro adicional). Más allá del motivo estructural de hélice α, el péptido SUP presenta un giro de una hélice 310 (D72:R75) ( Figura 5 a, Tabla S4 ). Observamos una estructura adicional con características fluctuantes de hélice 310, hélice α y giros en el péptido RA1 (I76:Y80) ( Figura 5 a, Tabla S4 ).
Figura 5. Simulación de dinámica molecular con dedo de zinc. ( a ) Evolución temporal de la estructura secundaria de las proteínas SUP y RA1 determinada por el algoritmo DSSP utilizando las estructuras simuladas en el intervalo de equilibrio termodinámico (0,8 a 1,0 μs). Al lado del gráfico, se citan las secuencias de aminoácidos con su número de residuo en las proteínas. En el centro del gráfico, se indica la posición relativa de cada residuo en referencia al primero del extremo N-terminal de la hélice α. ( b ) RMSF de los átomos de la cadena principal de cada secuencia de aminoácidos en el intervalo de equilibrio (0,8 a 1,0 μs), tomando como referencia para el ajuste de las estructuras la que tenga el menor RMSD en el mismo periodo.
Trabajos previos sugieren que el cambio de Ala (A) a Gly (G) en el motivo QALGGH del dedo de zinc RA1 podría conducir a una movilidad mejorada de los residuos en la α-hélice [ 2 ]. Sin embargo, tal hipótesis aún no ha sido probada. Aquí, realizamos un análisis comparativo de RMSF entre RA1 y SUP para probar si la G afecta la dinámica estructural de la α-hélice del dedo de zinc ( Figura 5 b). El RMSF de los aminoácidos SUP y RA1 se calculó en el intervalo de equilibrio de las simulaciones para los átomos de la cadena principal de cada residuo. Encontramos que, en este sitio, los aminoácidos de RA1 muestran fluctuaciones más pequeñas que los respectivos aminoácidos de SUP ( Figura 5 b). Se podría argumentar que el efecto de la sustitución de A por G puede no ser local; sin embargo, encontramos que los aminoácidos RA1 muestran fluctuaciones más pequeñas a lo largo de todas las extensiones del dominio canónico del dedo de zinc. La existencia de un motivo de hélice α más largo en el péptido RA1, seguido por el patrón de hélice adicional, hace que la región de pequeñas fluctuaciones o rigidez relativa del péptido se extienda mucho más allá del motivo de dedo de zinc canónico ( Figura 5 b). Estos resultados indican que sustituir A por G no afecta la movilidad estructural tridimensional en ese sitio, ni tampoco afecta la estructura general del dedo de zinc.

Análisis de elementos reguladores que actúan en cis entre las secuencias promotoras RA1 y similares a RA1

Cuando se examinaron los promotores de los genes RA1 y similares a RA1 de 16 especies de gramíneas, se identificaron muchos motivos reguladores y se agruparon en 33 tipos de elementos, de acuerdo con la familia de factores de transcripción (TF) correspondiente ( Figura 6 , Tabla S5 ). Se reconocieron secuencias conservadas que contenían motivos de unión para reguladores transcripcionales bien conocidos. Identificamos motivos TF involucrados en diferentes procesos biológicos relacionados con (1) la germinación de semillas, como el desarrollo del embrión, la embriogénesis somática y la regulación positiva de la proliferación de la población celular; (2) el desarrollo de la planta, como la regulación de la formación de brotes secundarios, el desarrollo de las hojas, el desarrollo de las flores y el desarrollo de las raíces; (3) la respuesta al estrés abiótico, como la respuesta al estrés salino, la respuesta al estímulo luminoso y la respuesta al agua; y (4) la respuesta al estrés biótico, como la respuesta de defensa a las bacterias ( Tabla S6 ). Además, identificamos sitios de unión de TF relacionados con la regulación positiva o negativa de las vías de señalización hormonal, los procesos biosintéticos de hormonas, así como las respuestas de auxina, giberelina, ácido abscísico y etileno ( Tabla S6 ).
Figura 6. Elementos cis no codificantes identificados en las regiones promotoras previstas de los genes RA1 y similares a RA1 de especies de gramíneas. Los círculos de colores representan la presencia de motivos conservados en el promotor. Las secuencias de consenso de motivos se muestran en la Tabla S5 .
Los motivos reguladores conservados albergaban nueve sitios putativos de unión de TF para el linaje A similar a RA1, 22 sitios putativos de unión de TF para el linaje B similar a RA1 y 13 sitios putativos de unión de TF para el linaje RA1. Encontramos dos motivos conservados compartidos por las secuencias promotoras similares a RA1 y RA1 : (1) los motivos ABI están presentes entre al menos 24 de las 35 secuencias promotoras analizadas; (2) los motivos WRKY se identificaron en 12 de las 35 secuencias promotoras.
RA1-like A comparte (1) motivos TCP con las secuencias promotoras de RA1-like B del clado PACMAD, excepto las de Andropogoneae, y (2) motivos DREB1E con las secuencias promotoras de Andropogoneae de RA1 .
RA1-like B tiene cinco motivos en común con RA1 : (1) los motivos ARF están presentes en todas las secuencias promotoras RA1-like B y RA1 de la tribu Andropogoneae; (2) los motivos AGL están bien conservados en las secuencias promotoras RA1-like B , excepto en la tribu Andropogoneae, mientras que los motivos AGL están restringidos a la tribu Andropogoneae en el linaje RA1; (3) los motivos MYB se identificaron en las secuencias RA1-like B de las secuencias promotoras PACMAD y RA1 de la tribu Andropogoneae; (4–5) el motivo MNB1A y los motivos ERF se identificaron entre las secuencias promotoras RA1-like B del clado PACMAD, excepto las de Andropogoneae, y las secuencias promotoras RA1 de la tribu Andropogoneae.
Descubrimos que cada copia del linaje de especies se caracteriza por elementos cis únicos . El linaje A similar a RA1 ha conservado motivos BPC fuera de la tribu Andropogoneae y un motivo de unión a RA1 en la tribu Andropogoneae. El motivo TGA9, el motivo GRP9 y el motivo HHO3 se identificaron solo en secuencias promotoras de especies del clado PACMAD fuera de la tribu Andropogoneae. El linaje B similar a RA1 se caracteriza por la presencia de motivos NAC en todas las secuencias promotoras analizadas, excepto en la de T. intermedium . El motivo OsRR22, el motivo BZIP48 y el motivo GATA20 están restringidos al clado BOP. Entre las especies del clado PACMAD, se identificaron los motivos bHLH130, ANL2 y un motivo desconocido en la tribu Andropogoneae, mientras que los motivos PLT1, FUS3, ABF2, Zm00001d027846, ATHB-12, AHL20 y DOF3.6 se identificaron fuera de la tribu Andropogoneae. Finalmente, las secuencias promotoras del linaje RA1 se caracterizan por la presencia de secuencias (1) motivos SPL14, TB1, CDF5 y O2 en la tribu Andropogoneae y (2) motivos SMZ fuera de la tribu Andropogoneae.