Les bases de donnes biologiques au LBBE n
Les bases de données biologiques au LBBE n n Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données Journées du laboratoire 1 -2 Juin 2005 Simon Penel
Le système ACNUC Système de requête sur les séquences biologiques n n n Développé au laboratoire (M. Gouy) Génération d’index à partir des annotations de séquences Permet de retrouver les séquences à partir de mot clefs, de la bibliographie, de la taxonomie, de la date, du type de séquence, du type de molécule Séquences « mères » et « filles » Permet d’extraire les séquences sous différents formats, de récupérer les annotations
Bases de données généralistes structurées sous ACNUC maintenues au laboratoire n n n n Mise à jour automatique: Gen. Bank Séquences nucléiques - 2 milions de CDS (NCBI) EMBL Séquence nucléiques - 2 milions de CDS Uniprot (anciennement Swiss. Prot + Tr. EMBL + PIR) 2 milions de protéines et aussi. . Ensembl Génomes complets métazoaires Genome Reviews Génomes complets bactériens (EBI)
Bases de données de familles de gènes développées au labo et/ou en collaboration n Bases de données de familles de gènes protéines ET/OU séquences nucléiques ¨ Familles de gènes/protéines ¨ n n n Applications: ¨ ¨ ¨ n Alignement Arbre phylogénétique (avec évènement de spéciation et duplication) Evolution moléculaire Prédiction de fonction de gène Phylogénie des espèces Cartographie comparée Génétique des populations Utilisation des ressources du centre de calcul de l’IN 2 P 3 (P. Calvat)
Bases de données de familles de gènes générales Familles de gènes homologues n n n Hobacgen Bactéries & levures (G. Perrière) Hogenom Hovergen Vertébrés 250 000 séquences (L. Duret) Ho. Genom Génomes complets 650 000 séquences (L. Duret, S. Penel) § Projet Européen Temblor/Integr 8 (EBI) n Homolens Génomes complets de Ensembl 250 000 séquences
Bases de données plus spécialisées Collaborations au sein du LBBE ou avec labos extérieurs Hoppsigen RTKdb A. Khelifi (LBBE) Familles de retroélements, retropseudogènes n Nurebase (LBBE/ENS-Lyon) Familles de Récepteurs Nucléaires n Polymorphix n Taxo. Bac. Gen n n J. Grassot (LBBE/ Centre de Génétique Moléculaire Familles de Récepteurs Tyrosine et Cellulaire) Kinase E. Bazin ( Laboratoire « Génome Populations Interactions Adaptation » ) Familles de séquences polymorphes G. Devulder (LBBE) Taxonomie des génomes bactériens EMGLib G. Perrière (LBBE) Génomes bactéries et levures, annotations n Gem. Core V. Navratil, (LBBE, INRA) SNi. Ps, cartographie comparée n Futur : n corrigées Familles de gènes homologues de plantes ¨ Fusion Hogenom + Homolens ¨
Accès au banques n query, query_win en local à partir de pbil, biomserv, pbil 2 (M. Gouy) Requêtes sur les banques ¨ Visualisation, extraction de données ¨ n n n query_win en mode client-serveur sur Mac et PC (S. Delmotte, M. Gouy) seqin. R en mode client-serveur (D. Charif, S. Delmotte, J. Lobry) Serveur Web du PBIL (S. Penel, G. Perrière) Requêtes sur les banques ¨ Recherche avec BLAST ¨ Visualisation, extraction de données ¨ n Fam. Fetch (banques de familles): application Java (G. Perrière) Recherche et visualisation des familles ¨ Recherche de motifs dans les arbres (J. F. Dufayard) ¨
Accès au banques n query, query_win à partir de pbil, biomserv, pbil 2
n Serveur Web du Accès au banques PBIL
Conclusions n n n De nombreuses banques De nombreux outils Grosses capacités de calcul (IN 2 P 3) Compétences en modélisation, conception, mise en place et maintenance des banques Favoriser l’utilisation des banques ¨ le développement de nouvelles banques associées à différentes thématiques au sein du laboratoire ¨
- Slides: 10