ADN-BIOINFORMÁTICA

ADN-BIOINFORMÁTICA

lunes, 20 de mayo de 2019

INTRODUCCIÓN
La bioinformática representa la intersección de la informática y la biología, que supone un enfoque matemático o informático que permite mejorar nuestra comprensión de los procesos biológicos. 
Uno de los principales objetivos en la bioinformática es el desarrollo de programas informáticos que permiten el acceso más eficiente y la gestión de grandes conjuntos de datos. Otros métodos tienen como objetivo desarrollar nuevos algoritmos (fórmulas matemáticas) y las medidas estadísticas que evalúan las relaciones entre los elementos de los grandes conjuntos de datos.
Estos programas a menudo incluyen el reconocimiento de patrones, la minería de datos, aprendizaje automático y visualización.

OBJETIVO
En esta práctica, vamos a explorar la herramienta BLAST bioinformatics.
Hemos leído las autorradiografías de secuenciaciones automáticas de geles y posteriormente hemos analizado los datos resultantes utilizando las bases de datos disponibles al público (BLAST)para identificar los genes y productos genéticos.
Las autorradiografías se han obtenido mediante el método de Sanger, por lo que la cadena original es la complementaria a la que inicialmente obtendremos (5'-3').

MATERIAL NECESARIO
  • 4 autorradiografías de secuenciaciones automáticas de geles
  • Caja de luz blanca
  • Ordenador
PROCEDIMIENTO
Antes de proceder a los ejercicios de la práctica, hemos de conocer la página web en la cual vamos a leer las secuenciaciones de las autorradiografías ("Nucleotide BLASTN"). Para ello, hemos de seguir los pasos detallados que nos aparecen en nuestro protocolo.

EJERCICIO 1
Consiste en familiarizarnos con la autorradiografía mediante la lectura de la secuencia de ADN de la muestra #1.
Antes de empezar con el ejercicio, debemos tener en cuenta algunas notas sobre la lectura de un gel de secuenciación, como:
  • Se puede introducir la secuencia directamente en el cuadro de consulta o escribir la secuencia en un pedazo de papel y luego entrar la en el cuadro de búsqueda.
  • Es muy importante que no confunda los carriles cuando lea la secuencia. El gel contiene los carriles A, C, G y T de izquierda a derecha.
  • La lectura de un gel de secuenciación requiere que leerlos nucleótidos en la dirección 5’→3’. Esto se puede lograr mediante la lectura hacia"arriba" del gel (a partir de la parte inferior del gel a la parte superior).
  • Observar que,en general ,la separación y la intensidad de la mayor parte de las bandas es bastante constante. Ignore las bandas de colores claros y elegir los sólo el más oscuros. En ocasiones, la secuencia será oscura y los cuatro carriles serán de intensidad relativamente similares. Esto se llama una compresión de la secuencia de ADN y es común cuando hay tramos de G y C. Este tipo de patrón debe ser tratado como una posición ambigua.
  • Si una banda en una posición exacta es ambigua, puede introducir una "N" que indica que podría ser cualquiera de las bases:A, C, G o T.  
  1. Comenzar en la flecha y leer hacia arriba el gel durante 20 nucleótidos.








2. Copiar en un folio la secuencia y posteriormente hacer su complementaria. 
3. Buscar la secuencia en la base de datos del NCBI utilizando el programa BLASTN.
La secuencia resultante ha sido la siguiente:
5'-TACAAATAGTTACCTTGGAA-3’
Y su cadena original (cadena complementaria), por tanto: 
3'-ATGTTTATCAATGGAACCTT-5’
  • Introducimos la secuencia en la página web BLASTN y obtuvimos los siguientes resultados:









A continuación, vamos a realizar el mismo procedimiento pero esta vez vamos a leer una serie de 30 nucleótidos:

5'-TACAAATAGTTACCTTGGAACATAAACGG-3’
3'-ATGTTTATCAATGGAACCTTGTAGTTTGCC-5’

Los resultados han sido los siguientes:










Con los resultados obtenidos de la autorradiografía #1 responder a las siguientes preguntas:

 1.¿Los resultados obtenidos con BLASTN para la primera y la segunda búsqueda se parecen entre sí?
Sí, ya que se trata del mismo gen, pero en el segundo especifica más los resultados al haberle introducido más nucleótidos a la secuencia.

2. ¿Cuál es el nombre de este gen?
   GEN XM021162809
Factor de replicación C

3. ¿A qué organismo es probable que pertenezca la secuencia de ADN de este ejercicio? 
Mus musculus (Ratón Doméstico) 


EJERCICIO 2 
 Leer el análisis de la secuencia de ADN de la autorradiografía correspondiente ala muestra #2.
Hay que tener en cuenta que a veces es difícil juzgar la distancia y la intensidad más fuerte de la banda en cada carril y por lo tanto es necesario utilizar su mejor juicio.
Comenzamos el ejercicio mediante la lectura de la secuencia de ADN de la muestra #2, aproximadamente 6 cm desde la parte inferior de la tira. Los primeros 12 nucleótidos deben ser: 5'...GGACGACGGTAT...3'.


La secuencia resultante que leemos es la siguiente:
5'-GGACGACGGTATGGAATAGAGAGGAAGTTCCTCTTGAAA-3'
Y su complementaria: 3’-CCTGCTGCCATACCTTATCTCTCCTTCAAGGAGAACTTT-5'

 Al introducir la secuencia en la página web de BLASTN hemos obtenido los siguientes resultados:







 a. ¿Cuál es el nombre de este gen?
Mus caroli UEV and lactate/ malate dehyrogenase domains.
b. ¿Cuál es la cadena simple que representa la secuencia de consulta?
La cadena positiva
¿Cuál es la cadena simple que representa la secuencia “hit”?
La cadena negativa


EJERCICIO 3
En este ejercicio hemos leído la secuencia de ADN de la muestra 3.
Comenzamos a leer por la parte inferior de la autorradiografía igualmente, y escribimos la secuencia de ADN.Posteriormente la escribimos en la base de datos del NCBI utilizando BLASTN.
Los resultados fueron los siguientes:
5'-GATTTGTAATGTAAGTGAATAAGGAA
TAGGATGTAGTTCAAAGAGAAAATGTA
ATTTTGATGTGAATTATCTGTATGAAAC
ATGAACTATACTACTGACCCTGAACAT
GCATGTCTAGATTGCTTTGTCAATCAG
CTGTGCATCACTCCATCCATTATCAAG
ATCGTCATGTA-3’

3'-CTAAACATTACATTCACTTA
TTCCTTATCCTACATCAAGTT
TCTCTTTTACATTAAAACTTAC
ACTTAATAGACATACTTTGTAC
TTGATATGATGACTGGGACTT
GTACGTACAGATCTAACGAAA
CAGTTAGTCGACACGTAGTGA
GGTAGGTAATAGTTCTAGCAG
TACAT-5’









a. ¿Cuál es el nombre de este gen?
Pan paniscus Rho GTPase activating protein 5
b. ¿Cuántas pares de bases, aproximadamente,tiene este gen?
7933 pb.

EJERCICIO 4
En este caso se mostró la interacción de dos proteínas codificadas por dos genes. Las interacciones proteína-proteína desempeñan un papel fundamental en prácticamente todos los procesos en una célula viva. 
Este proceso, llamado transducción de señales, es muy importancia en muchos procesos biológicos tales como la división celular y la formación del citoesqueleto celular.
En este ejercicio, vamos a utilizar secuencias de ADN para caracterizar dos genes humanos.
En un principio, vamos a leer la secuencia de ADN obtenida de la muestra #4. Para ello, vamos a leer desde la parte inferior de la banda y escribir alrededor de 30 pares de bases de la secuencia de ADN.
A continuación, suba alrededor de un tercio de la altura de la tira (aproximadamente 14 cm) y leer una parte de esta sección de la secuencia de ADN.
Para este ejercicio se limitó la búsqueda a la base de datos de genes humanos. Para ello cambiamos la opción de "Choose Search Set” (Elija conjunto de búsqueda) y a "Human genomic + transcript” (Genóma humano + transcripción).




Buscar cada sección de la secuencia de forma individual en la base de datos del NCBI utilizando el programa BLASTN.
 1º parte de la secuencia:
5'-ACAGCTTGGGTGGTCATATGGCCATGGAGC-3’
3'-TGTCGAACCCACCAGTATACCGGTACCTCG-5’








 2º parte de la secuencia:
5'-TTCCTGGAGAATATATCCTACTGTCTTGAC-3'
3’-AAGGACCTCTTATATAGGATGACAGAACTG-5’








Con los resultados obtenidos de la autorradiografía #4 responder a las siguientes preguntas:
a.  Este ejercicio contiene dos secuencias de ADN (desde la sección inferior y a partir de la sección central). ¿Cuáles son los nombres de los genes correspondientes a estas dos secuencias?
La primera secuencia de ADN es la de Bai1.
La segunda secuencia es la de Rac1.

b. ¿Cuáles son las funciones de las dos proteínas codificadas por estos genes?
La secuencia Bai1codifica BAI1, un inhibidor de la angiogénesis específica del cerebro. La angiogénesis implica el crecimiento de nuevos vasos sanguíneos a partir de vasos preexistentes, es un proceso normal en el crecimiento, desarrollo y cicatrización de heridas. Sin embargo, la angiogénesis también ha demostrado ser esencial para el crecimiento y la metástasis de tumores sólidos. Con el fin de obtener el suministro de sangre para su crecimiento, las células tumorales son potentemente angiogénicas. La BAI1se cree que inhibe el nuevo crecimiento de las células de los vasos sanguíneos, por lo que suprime el crecimiento de los glioblastomas (tumores cerebrales malignos). La BAI1 también se cree que funciona en la adhesión celular y transducción de señales en el cerebro. La secuencia Rac1 codifica una pequeña GTPasa llamada RAC1. La RAC1 actúa como un interruptor molecular en las vías de señalización que pueden cambiar la transducción de señales hacia dentro y fuera de una célula. La RAC1 está activo u "ON" cuando se une a una GTP e inactiva u "OFF" cuando se une con a un PIB. La forma inactiva de RAC1 (PIB-forma) se activa mediante el intercambio de GDP por GTP por los factores de cambio de nucleótidos de guanosina (GEFs). La inactivación de la RAC1se consigue mediante la activación de las proteínas GTPasa (GAP), que revierten la conformación de nuevo a la forma inactiva unida a GDP a través de la hidrólisis del GTP.

c. ¿Cómo interactúan estas dos proteínas en una célula viva?
En una célula viva, después que la RAC1 se activa mediante la unión de GTP, interactúa con BAI1. Esta interacción en la membrana citoplasmática es crucial para la función de BAI1, ya que se cree que participa en el crecimiento neuronal. La BAI1 también se asocia con otros efectores derivados de las proteínas G Rho pequeñas, que se asocian con la formación de fibras y la citocinesis. 

PREGUNTAS
1. ¿Qué es una secuencia de ADN?
Es una sucesión de letras representando la estructura primaria de una molécula real o hipotética de ADN o banda, con la capacidad de transportar información.
Las letras A, C , G y T que simbolizan las 4 subunidades de nucleótidos de una banda ADN -adenina, citosina, guanina y timina- que son bases covalentemente ligadas a cadenas fosfóricas. En el típico caso, las secuencias se presentan pegadas unas a las otras, sin espacios, como en la secuencia AAAGTCTGAC, yendo de 5' a 3' de izquierda a derecha.

2. ¿Qué representa cada banda en una autorradiografía?
Representa los distintos nucleótidos de una determinada secuencia de ADN (ddATP, ddCTP, ddGTP, ddTTP).
 
3. ¿Qué es el programa BLAST? ¿Por qué se le considera una herramienta bioinformática?
Es un programa informático de alineamiento de secuencias de tipo local, ya sea de ADN, ARN o de proteínas. El programa es capaz de comparar una secuencia problema (también denominada en la literatura secuencia query) contra una gran cantidad de secuencias que se encuentren en una base de datos. El algoritmo encuentra las secuencias de la base de datos que tienen mayor parecido a la secuencia problema. Es importante mencionar que BLAST usa un algoritmo heurístico por lo que no nos puede garantizar que ha encontrado la solución correcta. Sin embargo, BLAST es capaz de calcular la significación de sus resultados, por lo que nos provee de un parámetro para juzgar los resultados que se obtienen.
Se le considera una herramienta bioinformática porque nos permite utilizarla para comparar secuencias, ya que hacemos empleo de una herramienta informática para el análisis de datos biológicos. 





   

 


  

Comentarios

Entradas populares de este blog

SECUENCIACIÓN AUTOMÁTICA DEL GENOMA HUMANO