Uma abordagem computacional para estudo de polimorfismos de
Uma abordagem computacional para estudo de polimorfismos de base única. Orientando: Miguel Galves Orientador: Zanoni Dias Instituto de Computação UNICAMP
Roteiro n n Contexto SNPs: Polimorfismos de Base Única Porque estudar SNPs? Metodologias de estudo de SNPs: n n n PCR-RLFP Abordagem computacional Etapas para o estudo de SNPs n n n Alinhamento Detecção Correlação Projeto PIPE n Cronograma n
Contexto n A informação genética dos seres vivos está codificada em cadeias de nucleotídeos (A, C, G, T). Conjunto de sequências = genoma. n Genoma armazenado na forma de DNA ou RNA. n n Expressão gênica: geração de proteínas a partir do DNA. n Duas etapas: transcrição, tradução.
SNPs: Polimorfismos de base única n Polimorfismo: mudança de uma ou mais bases em sequências genêticas. n Devem ser observadas em mais de 1% de índividuos de uma população. SNP: Polimorfismo que ocorre em apenas uma base em um dado gene. n Poderia ser bi, tri, ou tetra alélico. n n Caso mais comum: bi-alélico.
Porque estudar SNPs? n n n Correspondem a mais de 90% dos polimorfismos nos seres humanos. Grande parte das doenças com base genética são causadas por um ou mais SNPs. Grande interesse das industrias farmacêuticas: n n Criação de terapias específicas. Farmacogenética: interface entre genética e farmacêutica.
Metodologias de estudo de SNPs: PCR-RLFP - Restriction Length Fragment Polymorphisms. n Utiliza enzimas de restrição para detectar polimorfismos. n Restrito ao estudo de SNPs conhecidos: n Permite detectar apenas SNPs que criem ou destruam sítios de restrição. n Depende da disponibilidade de enzimas de restrição apropriadas. n
Metodologias de estudo de SNPs: Abordagem computacional n n Utiliza sequências de DNA obtidas através de métodos de sequenciamento automático. Se baseia em comparação utilizando ferramentas computacionais. Método que está se popularizando com o barateamento do processo de sequenciamento automático. Se beneficia do grande número de sequências armazenadas em bases de dados públicas.
Etapas para o estudo de SNPs: Alinhamento - Conceitos n n Inserção de buracos em duas sequências deixando-as com mesmo tamanho: ACGTTCGGC T A-GTTTG-CT Permite criar uma pontuação para avaliar os alinhamentos obtidos. n n n Exemplo: match =1, mismatch = -1, gap = -2. Exemplo: match =1, mismatch = -1, g = -2, h = -1 Objetivo: obter um alinhamento ótimo entre duas sequências.
Etapas para o estudo de SNPs: Alinhamento - Estratégias n Alinhamento global: visa gerar o melhor alinhamento entre duas sequências. ACTGACCTCG GG ACGCGTGG ACTGACCTCGGG AC-G-CGT--GG
Etapas para o estudo de SNPs: Alinhamento - Estratégias n Alinhamento semi-global: utilizado para alinhar sequências incompletas. n Não penaliza a criação de buracos no início e final das sequências. ACTGACCTCG GG ACCGTCGGGC GG ACTGACC-TCGGG----ACCGTCGGGCGG
Etapas para o estudo de SNPs: Alinhamento - Estratégias n Alinhamento local: encontra o melhor alinhamento entre duas sub-sequências. n Retorna apenas o alinhamento dos segmentos que geram a maior pontuação. ACTGACCTCG GG ACCGTCGGGC GG TCGG G
Etapas para o estudo de SNPs: Alinhamento - Problema n Problema: alinhar c. DNA e RNA com DNA genômico: n n DNA muito maior que c. DNA pode conter regiões de íntrons.
Etapas para o estudo de SNPs: Alinhamento - Objetivos Estudar os métodos de alinhamento de DNA genômico e c. DNA utilizados por ferramentas de domínio público. n Definir um conjunto de parâmetros ideais para alinhamento de DNA com c. DNA utilizando estratégia semi-global. n Executar testes para medir a qualidade dos alinhamentos obtidos. n
Etapas para o estudo de SNPs: Detecção - Métodos existentes n Análise de cromatograma (polyphred). n Analisa o cromatograma obtido após análise sequenciamento.
Etapas para o estudo de SNPs: Detecção - Métodos existentes n Análise de sequências alinhadas (polybayes). n Utiliza métodos Bayesianos para determinar SNPs em um alinhamento
Etapas para o estudo de SNPs: Detecção - Objetivos Análise dos métodos existentes para detecção de polimorfismos. n Formulação de uma nova metodologia para detecção de SNPs. n Montar casos de testes com dados reais para avaliação da metodologia proposta. n
Etapas para o estudo de SNPs: Correlação - Motivação Predisposição a uma doença pode ser influenciada por SNPs agindo em conjunto. n LD: associação não-aleatória de alelos. n n n Quand um alelo está presente, o outro também estará, e vice-versa. Importante ter medidas para quantificar o grau de correlação.
Etapas para o estudo de SNPs: Correlação - Medidas Existentes n D = PAB - PA x PB n n n Primeira medida proposta. Não tem muita utilidade. D’ = D / (máx D) n D’ = 1 representa LD completo. n r 2 = n n n D 2 /(PA x PA’ x PB’) r 2 = 1 representa LD perfeito. Medida utilizada para medir a utilidade de um LD. r 2 > 1/3 indica LDs úteis em processos de mapeamento.
Etapas para o estudo de SNPs: Correlação - Objetivos Análise das medidas utilizadas para avaliação de SNPs. n Formulação de uma metodologia que permita integração destas medidas ao processo de estudo de SNPs n
PIPE: Sistema de Identificação de Polimorfismos n n Programa de apoio a pequenas empresas de base tecnológica. Concedido à empresa Scylla Bioinformática. n n Coordenação: Prof. João Meidanis Visa desenvolver a ferramenta SIP Projeto será desenvolvido nas instalações da empresa. Trabalho comprenderá a documentação das metodologias desenvolvidas.
Cronograma n n n I - Estudo e identificação de parâmetros ideais para alinhamento. II - Testes com os novos métodos de alinhamento obtidos. III - Escrita dos resultados obtidos nos testes.
Cronograma n n n IV - Análise dos métodos existentese formulação de uma nova metodologia de correlação de SNPs. V - Testes computacionais com os novos métodos de correlação de SNPs. VII - Escrita dos resultados obtidos nos testes.
Cronograma n n n VII - Análise das metodologias utilizadas e formulação de uma nova metodologia de detecção de SNPs. VIII - Testes computacionais com os novos métodos propostos. IX - Escrita dos resultados obtidos nos testes.
Cronograma n n X - Revisão do texto da dissertação. XII - Defesa da dissertação
- Slides: 24