Présentation
Auteur(s)
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
L'architecture RDISK est un système prototype composé d'un cluster de 48 nœuds spécialisés comprenant chacun un disque dur étroitement connecté à un composant FPGA. L'objectif est de filtrer les banques de données génomiques à la volée, c'est-à-dire sans ralentir la lecture d'information en provenance des disques. En fonction de la nature des requêtes, le système se reconfigure automatiquement.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Bioprocédés et bioproductions
(161 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Contexte
Dominique LAVENIER est professeur à l’ENS Cachan (Rennes) et effectue ses recherches à l’IRISA/CNRS, dans l’équipe-projet INRIA de bioinformatique « Symbiose ».
1.1 Données génomiques
Depuis quelques années, les progrès continus des biotechnologies sont à l'origine d'une masse considérable de données génomiques, notamment avec la possibilité de séquencer toujours plus rapidement des génomes entiers . Cette dernière activité consiste à décrypter l'information génétique contenue dans la (ou les) macromolécule(s) d'ADN présente(s) dans toutes les cellules des organismes vivants. La quantité d'information est mesurée en nombre de nucléotides et varie de quelques millions pour les bactéries, à quelques milliards pour les organismes supérieurs. La figure 1 indique la taille de quelques génomes de divers organismes (la taille du génome humain est d'environ 3,2 × 109 nucléotides).
Sur les génomes
Puces à ADN [RE 6] de P. Soularue et X. Gidrol
Nucléotides
Ce sont les quatre composants de base de l'ADN représentés par les lettres A, C, G et T
Cette information est stockée dans des bases de données (ou banques de séquences) dont la croissance est exponentielle. On estime que leur taille double tous les 16 à 18 mois. Elles contiennent à la fois l'information brute (les séquences d'ADN sous forme de longues chaînes de caractères A, C, G et T) et des annotations diverses relatives à leur production, à leurs fonctionnalités biologiques, aux références bibliographiques, etc. Ces banques de séquences sont alimentées par les chercheurs qui déposent eux-mêmes le résultat de leurs travaux (séquences et annotations), ou par les multiples projets de séquençage...
Cet article fait partie de l’offre
Bioprocédés et bioproductions
(161 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Contexte
BIBLIOGRAPHIE
-
(1) - GENBANK, BENSON (D.A.), KARSCH-MIZRACHI (I.), LIPMAN (D.J.), OSTELL (J.), WHEELER (D.L.) - * - Nucleic Acids Res., 35, (Database issue), D21-5, janv. 2007.
-
(2) - LIOLIOS (K.), TAVERNARAKIS (N.), HUGENHOLTZ (P.), KYRPIDES (N.C.) - The Genomes On Line Database (GOLD) v.2 : a monitor of genome projects worldwide. - Nucleic Acids Res., 34, (Database issue), D332-4, 1 janv. 2006.
-
(3) - NEEDLEMAN (S.), WUNSCH (C.) - A general method applicable to the search for similarities in the amino acid sequence of two proteins. - J. Mol. Biol., 48(3), p. 443-53 (1970).
-
(4) - SMITH (T.F.), WATERMAN (M.S.) - Identification of common molecular subsequences. - J. Mol. Biol., 147(1), p. 195-7, 25 mars 1981.
-
(5) - LAVENIER (D.), GIRAUD (M.) - Bioinformatics Applications. In Reconfigurable Computing : Accelerating Computation with Field-Programmable Gate Arrays. - GOKHALE (M.B.), GRAHAM (P.S.) editor, chapter 9, Springer (2005).
-
...
Cet article fait partie de l’offre
Bioprocédés et bioproductions
(161 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive