Qumica Biolgica Patolgica Tcnicas de Biologa Molecular aplicadas
Química Biológica Patológica Técnicas de Biología Molecular aplicadas a Bioquímica Clínica 2015 Tema 1 Dra. Silvia Varas curso. tecmol@gmail. com
Tema 1 Genoma Humano n Proyecto Genoma Humano n Controversias Éticas n Mutaciones mas comunes según Human Gene Mutation Database n Deleciones y Mutaciones puntuales n Estrategias de laboratorio n
DEFINICIONES Genoma: es el set completo de genes de un organismo n Transcriptoma: completo set de genes que se expresan (todas las moléculas de RNA) n Proteoma: completo set de polipéptidos codificado por un genoma completo n
GENOMA n n n Es la base de la herencia de un organismo Larga secuencia de ADN que contiene toda la información que define a un organismo. Físicamente, esta formado por diferentes moléculas de ADN o cromosomas Funcionalmente, el genoma esta dividido en genes Cada gen es la secuencia de ADN que codifica para un tipo de RNA (algunos son polipéptidos posteriormente).
Genoma Humano Su detallado conocimiento esta ligado al proyecto genoma humano n En 1986 el Dpto de Energía de los EEUU lideró la iniciativa y puso en marcha el mayor proyecto biomédico de la historia. Oficialmente se inicia en octubre 1990. Hasta conseguir la secuenciación completa en 2005. n
Proyecto Genoma Humano n El Proyecto Genoma Humano ha identificado la mayoría de los genes presentes en el núcleo de las células humanas y ha establecido la localización que ocupan estos genes en los 23 pares de cromosomas del núcleo.
Proyecto Genoma Humano n En 1990 se inició oficialmente. n En los 1ºcinco años: construir mapas genéticos (de ligamiento) y de mapas físicos (clones) de todo el genoma. n En el etapa de mayor actividad del programa se secuenciaba 1000 nt/seg. Francis Collins (director del CONSORCIO Proyecto Genoma Humano) y Craig Venter (gerente de Celera Genomics)
MAPAS n n Genéticos: marcadores usados en estudios de ligamiento RFLP VNTR, STR SNP n n Físicos Mapas de restricción STS Sitio Etiquetado de pares de bases (Pequeña secuencia de localización y secuencia conocida. Inicialmente separados en 100 Kb).
Proyecto Genoma Humano: representación n n Si cada par de nucleótidos se dibuja para abarcar 1 mm, entonces el genoma humano se extendería 3. 200 kilometros lo suficiente para cruzar la línea a través del centro de África (línea roja). A esta escala, habría, en promedio, un gen codificante para proteína cada 130 m. Un gen promedio se extendería por 30 m, pero las secuencias codificantes de este gen podría abarcar algo más de 1 metro.
Genoma Humano: citas International Human Genome Sequencing Consortium (2001) Initial sequencing and analysis of the human genome. Nature 409, 860– 933. n International Human Genome Sequencing Consortium (2004) Finished: the euchromatic sequence of the human genome. Nature 431, 931– 45. n
Genoma humano n n El genoma humano haploide consiste de 3200 millones pb de DNA Se suponía en un principio que el genoma humano podría tener unos 50. 000 a 100. 000 genes distribuidos en los 23 pares de cromosomas de la célula
Genoma humano: Historia n n n Si 6. 000 genes pueden producir una levadura, y 14. 000 a una mosca, ¿cuántos se necesitan para codificar un ser, una criatura compleja humano, curiosa y lo suficientemente inteligente como para estudiar su propio genoma? Hasta que los investigadores completaron el primer borrador de la secuencia del genoma humano, la estimación más citada fue 100. 000. Pero ¿de dónde esa cifra? ¿Y de donde sale la nueva estimación de sólo 25. 000?
n Walter Gilbert, un físico convertido en biólogo y quien ganó el Premio Nobel por el desarrollo de técnicas de secuenciación de ADN, fue uno de los primeros en lanzar una estimación aproximada del número de genes humanos. n A mediados de la década de 1980, Gilbert sugerido que los humanos podrían tener 100. 000 genes, una estimación basada en el tamaño medio de los pocos genes humanos conocidos en el momento (aproximadamente 3 x 104 pares de nucleótidos) y el tamaño de nuestro genoma (3 x 109 pares de nucleótidos). Hizo un cálculo que produjo un número con una redondez agradable tal, que terminó siendo citado ampliamente en artículos y libros de texto.
Comparación de secuencias de nucleótidos de muchos vertebrados diferentes revela regiones de alta conservación n La secuencia de nucleótidos examinado en este diagrama es de un pequeño segmento del gen humano para una proteína transportadora de membrana plasmática. n La secuencia del exón se conserva en todas las especies, incluyendo el pollo y pescado. Tres bloques de la secuencia del intrón que se conservan en los mamíferos, pero no en la de pollo o pescado, se muestran en azul. las funciones de secuencias de intrones más conservadas en el genoma humano (incluyendo estos tres) no son conocidos.
Tipos de Secuencia
Constitución n Gran % del genoma humano consiste de secuencia repetidas. Incluyen grandes duplicaciones y repeticiones sencillas. Los genes ocupan solo el 25% del genoma humano, pero las secuencias que codifican proteínas son solo una pequeña parte de esa fracción(1%).
La mayor parte del genoma humano está compuesto de no codificante y secuencias de nucleótidos repetitivos. Las LINEs, SINEs, transposones similar a retroviral, y los transposones -ADN son elementos genéticos móviles que se han multiplicado en nuestro genoma mediante la replicación de sí mismos y la inserción de las nuevas copias en diferentes posiciones. Las repeticiones simples son secuencias de nucleótidos cortas (menos de 14 pares de nucleótidos) que se repiten una y otra vez durante largos períodos. Las duplicaciones de segmentos son bloques grandes del genoma (1000 -200. 000 pares de nucleótidos) que están presentes en dos o más lugares en el genoma. Las secuencias únicas que no son parte de ningún intrones o exones (verde oscuro) incluyen elementos reguladores de genes, así como las secuencias cuyas funciones no se conocen. Los bloques más altamente repetidas de ADN en la heterocromatina aún no se han secuenciado por completo; por lo tanto, cerca del 10% de las secuencias de ADN humano que no están representados en este diagrama
n n n SINE (Short Interspersed Nuclear Elements, elementos nucleares dispersos cortos): elementos Alu, 250 -280 nucleótidos, con unas 1. 500. 000 copias. Los LINE (Long Interspersed Nuclear Elements, o elementos nucleares dispersos largos) constituyen un 20 por ciento del genoma humano. Son secuencias con un tamaño de varias kilobases Transposones ADN
Organización del Cromosoma 48 x 106=1, 5 % A) El cromosoma 22, uno de los más pequeños cromosomas humanos, contiene 48 X 106 pares de nucleótidos y constituye aproximadamente el 1, 5% de todo el genoma humano. La mayor parte del brazo izquierdo del cromosoma 22 se compone de secuencias cortas repetidas de ADN que son empacados en una forma particularmente compacta de la cromatina (heterocromatina). (B) una expansión de diez veces de una porción del cromosoma 22 muestra unos 40 genes. los de color marrón oscuro se conocen como genes y los rojos se predice genes. (C) una porción ampliada de (B) muestra toda la longitud de varios genes. (D) el arreglo intrón-exón de un gen típico se muestra después de una ampliación de diez veces más. cada exón (rojo) codifica para una porción de la proteína, mientras que la secuencia de ADN de los intrones (gris) es relativamente poco importante. (Adaptado de la Human Genome Sequencing Consortium International, Nature 409: 860 -921, 2001
Proyecto Genoma Humano: ESTADISTICAS n Se estima que el genoma humano contiene en torno a los 20 000 -25 000 genes. n Alrededor de un 50 por ciento del genoma humano está constituido por ADN repetitivo. n Se puede estimar que la densidad media de genes es de 1 gen/ 100 kb, aunque existen regiones ricas en genes (algunas zonas del cromosoma 19, por ejemplo) y otras regiones que son muy pobres en genes (como el cromosoma Y). Por tanto, se puede deducir una frecuencia media de 10 genes/ Mb de secuencia. n El tamaño promedio de un gen humano es de 20 -30 kb, aunque hay grandes diferencias de unos genes a otros. n El número de exones que forman un gen es muy variable (desde genes que tienen un solo exón hasta algunos genes con 100 exones o más), pero podemos establecer un valor promedio de 7 -8 exones/gen. n El tamaño medio de un exón es de 150 nucleótidos. Por lo que respecta a los intrones, en cambio, existe una enorme variabilidad de tamaños, y no es infrecuente encontrar en casi todos los genes algún intrón de gran tamaño. n El tamaño medio de un ARNm es de 1, 8 -2, 2 kb incluyendo las regiones notraducidas flanqueantes. La longitud media de una región codificante es de 1, 4 kb.
Proyecto Genoma Humano: HALLAZGOS El rasgo más notable del genoma humano es el pequeño porcentaje que codifica para proteínas, RNAs estructurales y RNAs catalíticos. Casi la mitad del ADN restante se compone de elementos genéticos móviles que han colonizado nuestro largo genoma durante el tiempo evolutivo. Una segunda característica notable del genoma humano es el tamaño grande del promedio de los genes (27. 000 pares de nucleótidos). Sólo se requieren alrededor de 1. 300 pares de nucleótidos que codifica una proteína de tamaño medio (unos 430 aminoácidos en los seres humanos). La mayor parte del ADN que permanece en un gen consiste en largos tramos de ADN no codificadora en los intrones entre los exones que codifican proteínas relativamente cortos Además de los intrones y exones, cada gen se asocia con secuencias de ADN reguladoras que aseguran que el gen se expresa en el nivel y el momento adecuado, y en el tipo apropiado de célula. En los seres humanos, estas secuencias de ADN reguladoras están normalmente distribuidos en decenas de miles de pares de nucleótidos, mucha de la cual parece ser ADN "espaciador". Los exones y secuencias reguladoras comprenden menos del 2% del genoma humano. Otra característica sorprendente del genoma humano es su número relativamente pequeño de genes. Las estimaciones anteriores habían sido de alrededor de 100. 000. Aunque el número exacto todavía no está claro, estimaciones revisadas indican que el número de genes humanos en alrededor de 25. 000, nos compara al números de genes de animales multicelulares más simples, tales como Drosophila (14. 000), C. elegans (19. 000).
Proyecto Genoma Humano: búsqueda del número de genes Si a una secuencia la leemos de a tripletes solo hay 3 posibles caminos de la traducción a aminoácidos. Estas posibilidades se llaman marcos de lectura En ADN genómico: cuando se busca en el recuento teórico del número de genes se tuvieron se buscaron el número de ORFs (open reading frames): secuencias de 100 codones comprendida entre un codón de inicio (AUG) de la traducción y un codón de terminación, descontando las secuencias que corresponden a los intrones en caso de haberlas. Se encuentra acotado por los UTRs, o secuencias no traducidas. Existen programas que son usados para la búsqueda de ORFs, los cuales se inician con el codón ATG, y terminan con un codón de terminación TAA, TAG, o TGA.
POLIMORFISMO / SNP n n n Se llama polimorfismo genético a la coexistencia de múltiples alelos en un locus de una población. Un locus es polimorfico cuando esta presente >1% en una población. Cuando 2 alelos se comparan y hay solo 1 nt de diferencia se llama SNP, (pronunciado como snips) (single nucleotide polymorphisms). Hay mas de 10 millones de SNP Se han identificado mas de 6 millones de SNP Hay 1 SNP/1330 pb.
Los Polimorfismos de un solo nucleótido (SNPs) son secuencias en el genoma que difieren en un solo par de nucleótidos entre una porción de la población y otra.
Proyecto Genoma Humano: Individualidad Genética No hay 2 personas iguales (excepto gemelos) Cuando se compra la misma región del genoma en 2 personas difiere en 0, 1% 3 millones de diferencias en el genoma La mayoría son de un único cambio de nucleótidos llamados SNPs La gran ventaja de los SNP sobre los demás tipos de marcadores, además de ser tan abundantes y estar muy uniformemente distribuidos por todo el genoma humano, es la posibilidad de analizarlos mediante métodos automatizables a gran escala, como los microarrays
Proyecto Genoma Humano: Individualidad Genética Otro importante origen de la variación heredadas de nuestros ancestros es la duplicación y deleción de grandes blocks de DNA. Cuando el genoma de cualquier persona es comparada con el genoma de referencia estándar se observa al menos 100 diferencias que involucran grandes blocks de secuencia. Algunas de estas diferencias son muy comunes, sin embargo otras estas presentes en una pequeña minoría de la población.
En un estudio, por ejemplo, los investigadores compararon el genoma de un ser humano "normal" con la secuencia original generada por el Proyecto Genoma Humano y encontraron que se diferenciaban por 297 variantes estructurales de segmentos de tamaño intermedio (8 kilobases): 139 inserciones, 102 deleciones y 56 inversiones. Este es un nivel notable e inesperado de la variación genómica a gran escala
¿El genoma humano es patentable? El 11 de Noviembre de 1997, la UNESCO aprobó la DECLARACIÓN UNIVERSAL SOBRE GENOMA HUMANO Y LOS DERECHOS DEL HOMBRE, fijando tres principios: n La dignidad del individuo cualesquiera sean sus características genéticas. n Rechazo al determinismo genético. n El Genoma Humano es PATRIMONIO DE LA HUMANIDAD.
Controversias éticas El conocimiento del genoma humano tiene también diversas implicaciones éticas, jurídicas y sociales, estimulando un debate internacional sobre algunos aspectos: n Patentar secuencias de genes humanos para uso comercial. n Confidencialidad en la información obtenida, como por ejemplo, poner la información sobre genética humana a disposición de empresas de seguros. n La libertad a no saber si se es o no portador de una enfermedad genética.
EN RESUMEN:
GENOMA HUMANO Longitud del ADN Número de genes 3, 2 x 109 pb Gen mas largo 2, 4 x 106 pb 25. 000 Tamaño medio de gen Menor nº de exones /gen Mayor nº de exones /gen Nº medio de exones /gen 27. 000 pb 1 178 10, 4 Tamaño del exón mas largo 17. 106 pb Tamaño medio de exon Nº de pseudogenes % de la secuencia del DNA en los exones (secuencias que codifican proteínas % de la secuencia del DNA en secuencias altamente conservadas* % de DNA elementos altamente repetitivos 145 pb Mas de 20. 000 1, 5% 3, 5% 50% *: incluye DNa que codifica 5’ y 3’ UTRs (untranslated regions of m. RNAs), genes de RNAs estructural y cataliticos, regiones regulatorias de ADN y regiones conservadas de función desconocidas.
Polimorfismo y Mutación Cuando la frecuencia alelica, del alelo más raro es del uno por ciento o mayor, ese locus se llama locus polimórfico, y esa variación se denomina polimorfismo. n Cuando la variación es menos frecuente es una mutación, es más grave y desencadenan una enfermedad n
Human Gene Mutation Database (HGMD) n http: //www. hgmd. org/
Número Total de Mutaciones Total: 148. 413 mutaciones informadas 24 -06 -14
Espectro de diferentes tipos de mutaciones en genes humanos (Human Gene Mutation Database) Mutaciones sin sentido Mutaciones con cambio de sentido n 14. 363 mutaciones en 783 genes
Espectro de diferentes tipos de mutaciones en genes humanos (Human Gene Mutation Database) 24 -6 -14 Single base pair substitutions Mutaciones sin sentido/con cambio de sentido
Mutaciones Puntuales Hay de 2 TIPOS: n La clase más común es la transición de una pirimidina por otra pirimidina. O de una purina por otra purina. n La menos común es la transversión en la cual una purina reemplaza a una pirimidina o viceversa n
Mutaciones Puntuales: Sustituciones de una única par de base en genes que causan enfermedades hereditarias
Hotspots Son regiones del genoma donde la frecuencia de las mutaciones esta incrementada en al menos 1 orden de magnitud. n Una causa es la metilación de 5 metil-citosina timidina n En los hotspots (5 -CH -C) la mutación es una transición de G-C por A-T n 3
DELECIONES DE GENES n n n Las deleciones son responsables de mas 500 enfermedades hereditarias en humanos. Y estas deleciones pueden ser clasificadas en base a la longitud del ADN delecionado. Algunas deleciones consiste de solo unas pocas pares de bases hasta varias cientos de kilobases
DELECIONES DE GENES n n n 2, 5 a 5% de pacientes con hemofilia A son debidos a deleciones en el gen F 8 C (Factor VIII) con perdida de 26 exones de un longitud 186 Kb 84% de los pacientes con deficiencia sulfatasa esteroidal (STS), con perdida de 10 exones de una longitud de 146 kb de ADN genómico. Grandes deleciones son comunes en la distrofia muscular de Duchenne, GH, RLDL y el gen de 1 -globina
PEQUEÑAS DELECIONES n Existe un total de 2. 368 deleciones de genes causantes de enfermedades con una longitud de 20 bp o menos
Espectro de diferentes tipos de mutaciones en genes humanos (Human Gene Mutation Database) 24 -6 -15 Single base pair substitutions Mutaciones sin sentido/con cambio de sentido
MUTACIONES PUNTUALES En la región regulatoria n En el splicing n Sin sentido (nonsense) n Con cambio de sentido (missense) n
Estrategias en el laboratorio de Biología Molecular n n n Grandes Deleciones Southern Blotting Microsatellites and SNPs GAP-PCR MAPH and MLPA Long-range PCR n Mutaciones Puntuales y deleciones pequeñas n RFLP-PCR(ER-PCR) Mutagenesis mediada por PCR Alelo-Específicas: MAS-PCR ARMS- MARMS DOT-ASO n n n
Estrategias en el laboratorio de Biología Molecular II n Desconozco la mutación o polimorfismo SSCP (single strand conformation polymorphism) n DGGE (Denaturing Gradient Gel Electrophoresis) n
SSCP n n SSCP (single strand conformation polymorphism) es un método simple y accesible para detectar alteraciones en la secuencia en un fragmento obtenido por PCR Fundamento: se basó en el hecho de que los fragmentos de ADN de una sola hebra relativamente cortos pueden migrar en un gel no desnaturalizante no sólo de su tamaño sino también por su secuencia.
Pasos n n n Amplificación: La muestra se enriquece en ss. ADN por medio de una PCR asimétrica (uno de los primers esta en mayor cantidad que el otro). Los fragmentos de ADN amplificados se someten a la desnaturalización con calor o agentes químicos, tales como formamida. Posteriormente, los fragmentos de ADN desnaturalizados se someten a electroforesis a través de un gel de poliacrilamida no desnaturalizante.
El carril 1 corresponde al patrón WT para cualquier locus dado analizado. 2 - Control homocigota para la mutación A y 4 - para la B 3 - corresponde a un caso heterocigotos A 5 - doble heterocigota para las mutaciones A y B, 6 -Homocigota pequeña delecion. 7 - Heterocigotos y homocigotos para una pequeña deleción. 8 - Heterocigotos para una pequeña inserción. Inserción Delecion
DGGE (Denaturing Gradient Gel Electrophoresis) Los productos de PCR son cargados en un gel con un gradiente desnaturalizante simple complejo 20% Típicamente 20 -80% formamida ADN doble cadena migra hasta encontrar su melting El melting es determinado por su secuencia y contenido de GC 80% Las diferentes secuencias migran a diferentes distancias
• DESNATURALIZACIÓN DEL DNA 1. Composición de bases 2. Longitud DNA doble 3. Presencia de agentes desnaturalizantes Agentes desnaturalizantes. Formamida: Baja la T° de melting a 0, 72°C cada 1%
DGGE (Denaturing Gradient Gel Electrophoresis) II Ventajas Puedo cortar las bandas y secuenciar Puedo detectar pequeñas diferencias en la secuencia de DNA n Desventajas q q Puede haber complejidad en el chorreado de las muestras Requiere una aparatología específica
TUBOS EPPENDORF 200 l 500 l 1, 5 ml
Pipetas Automáticas P-1000 100 -1000 l P-200 20 -200 l P-100 10 -100 l P-10 0, 5 -10 l
Termocicladores
Extracción de ADN n Todos los alumnos harán una extracción de muestra de sangre por punción venosa.
Bibliografía Eric D. Green: The Human Genome Project and Its Impact on the Study of Human Disease n Stylianos E. Antonarakis, Michael Krawczak, David N. Cooper: The Nature and Mechanisms of Human Gene Mutation n
- Slides: 61