1.1 - Historique

Tableau 2
1.2 - Traitement de l'information biologique
1.3 - Grands domaines de la bioinformatique

2.1 - Alignement optimal de deux séquences
2.2 - Matrices d'échange entre acides aminés
2.3 - Recherche de similarités locales entre séquences
2.4 - Recherche de similarité dans les bases de données

3 - ANALYSE DES SÉQUENCES NUCLÉIQUES ET DES GÉNOMES

3.1 - Alignement optimal de deux séquences nucléiques
3.2 - Recherche de similarités dans les bases de données
3.3 - Mise en évidence de motifs
3.4 - Identification des gènes, annotation des génomes

4 - ALIGNEMENT MULTIPLE ET PHYLOGÉNIE MOLÉCULAIRE

4.1 - Séquence des macromolécules comme document de leur histoire évolutive
4.2 - Mise en évidence de motifs conservés
4.3 - Phylogénomique

Figure 13 - Analyse phylogénomique

5 - BIOINFORMATIQUE STRUCTURALE

5.1 - Prédiction de la structure de l'ARN
5.2 - Prédiction de la structure des protéines
5.3 - Recherche d'homologues par similarité structurale

6 - ANALYSE DE DONNÉES MASSIVEMENT PARALLÈLES

6.1 - Puces à ADN
6.2 - Bioinformatique et biologie des systèmes

Bibliographie & annexes

Article de référence | Réf : BIO7050 v1

Analyse de données massivement parallèles
Bioinformatique

Auteur(s) : Jean-Michel CLAVERIE

Date de publication : 10 nov. 2007 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

RÉSUMÉ

Cet article s’intéresse à la bioinformatique dans son intégralité, de ses débuts à aujourd’hui. Cette discipline, visant à analyser l’information biologique, a pour principal objectif l’identification de l’information contenue dans la séquence des macromolécules et leur structure. L’analyse poussée des séquences de protéines, des séquences nucléiques et des génomes (comme l’alignement optimal de deux séquences, la recherche de similarités, etc) est détaillée dans cet article. Liée aux objets d’études de la biologie moléculaire et de la génomique, la bioinformatique a vécu récemment l’arrivée de nouvelles techniques parallèles, comme les puces à ADN.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Jean-Michel CLAVERIE : Professeur, faculté de Médecine de l'université de la Méditerranée et laboratoire « Information génomique et structurale », CNRS (Marseille)

INTRODUCTION

La bioinformatique est la discipline de l'analyse de l'information biologique, principalement contenue dans la séquence des macromolécules (acides nucléiques et protéines) et leur structure tridimensionnelle. C'est une branche théorique de la biologie, largement antérieure à la « révolution génomique » des années 1990.

La bioinformatique n'est pas une simple application des concepts et des outils de l'informatique traditionnelle aux données biologiques. Elle recouvre un ensemble de techniques très spécifiques, intimement liées aux objets d'étude de la biologie moléculaire et de la génomique.

Plus récemment, l'introduction de techniques expérimentales massivement parallèles (exemple : les puces à ADN), produisant une masse de données numériques, a amené les bioinformaticiens à s'approprier des méthodes mathématiques et statistiques plus générales, développées dans d'autres domaines scientifiques confrontés à un grand volume de données (« data mining »).

Enfin, la bioinformatique est indissociable de l'existence de grandes bases de données internationales publiques, de la mise en place de nombreux serveurs internet, et de l'attitude « open access » de ses développeurs.

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-bio7050

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

Accueil > Ressources documentaires > Biomédical - Pharma > Technologies pour la santé > Santé numérique et connectée > Bioinformatique > Analyse de données massivement parallèles

Cet article fait partie de l’offre

Bioprocédés et bioproductions

(159 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Bioinformatique, des pionniers à aujourd'hui

6. Analyse de données massivement parallèles

Malgré les énormes progrès réalisés dans le déchiffrage des génomes, grâce à l'automatisation des protocoles de séquençage de l'ADN, dans les années 1990, les biologistes n'étaient toujours capables que de faire des analyses génétiques sur quelques gènes à la fois, à l'aube des années 2000.

C'est alors que le développement de la technologie des puces à ADN (micro-arrays) a amené une nouvelle révolution, en permettant la mesure simultanée du niveau d'expression de milliers de gènes en une seule expérience [15]. Ce nouveau type de données, obtenues de façon massivement parallèle, a déclenché l'émergence d'une branche radicalement nouvelle de la bioinformatique dédiée à leur analyse. D'autres types d'approches se donnant pour but l'analyse globale des interactions protéines-protéines dans la cellule ont fini de consommer le divorce entre la bioinformatique traditionnelle, vécue comme « réductionniste », et la nouvelle vague de la biologie des systèmes.

Mais, cette nouvelle bioinformatique n'est-elle pas qu'une simple résurgence d'approches informatiques et statistiques, utilisées dans un autre contexte depuis des dizaines d'années ?

6.1 Puces à ADN

Une seule expérience de puce à ADN peut livrer jusqu'à 20 000 points de mesure, dupliqués de 3 à 8 fois, selon la rigueur et la richesse de l'expérimentateur. Les bases de données publiques entreposent d'ores et déjà plusieurs milliers d'expériences de ce type.

À quelles questions les biologistes tentent-ils de répondre à partir de ce genre de données expérimentales ? Elles sont essentiellement de deux types :

quels sont les gènes dont l'expression est significativement différente entre deux conditions d'expérience (malade/sain, chaud/froid, jeune/vieux, etc.) ?
quels sont les gènes dont l'expression est co-régulée ?

Même si elles sont posées par des biologistes, les analyses à mettre en œuvre pour répondre à ces questions n'ont rien de spécifiquement biologique. Il s'agit d'utiliser des tests statistiques, relativement standards, sur de grands tableaux de valeurs...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Bioprocédés et bioproductions

(159 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Analyse de données massivement parallèles

Page
précédenteBioinformatique structurale

BIBLIOGRAPHIE

(1) - NEEDLEMAN (S.), WUNSCH (C.) - A general method applicable to the search for similarities in the amino acid of two proteins. - J. Mol. Biol., 48, p. 443-453 (1970).
(2) - HENIKOFF (S.), HENIKOFF (J.G.) - Amino acid substitution matrices from protein blocks. - Proc. Natl. Acad. Sci. USA, 89, p. 10915-10919 (1992).
(3) - SMITH (T.F.), WATERMAN (M.S.) - Identification of common molecular subsequences. - J. Mol. Biol., 147, p. 195-197 (1981).
(4) - DUMAS (J.P.), NINIO (J.) - Efficient algorithms for folding and comparing nucleic acid sequences. - Nucleid Acids Res., 10, p. 197-206 (1982).
(5) - WILBUR (W.J.), LIPMAN (D.J.) - Rapid similarity search of nucleic acid and protein databanks. - Proc. Natl. Acad. Sci. USA, 80, p. 726-730 (1983).
(6) - LIPMAN (D.J.), PEARSON (W.R.) - Rapid and sensitive protein similarity searches. - Science,...

DANS NOS BASES DOCUMENTAIRES

ANNEXES

1 Sites Internet

1 Sites Internet

Portail BLAST et bases de données du NCBI : http://www.ncbi.nlm.nih.gov/

Autre serveur BLAST rapide (Gigablaster) : http://www.igs.cnrs-mrs.fr/

Site de référence sur les génomes animaux : http://www.ebi.ac.uk/ensembl/

Banque de données de séquences protéiques UNIPROT : http://www.expasy.org/sprot/

Banques de motifs protéiques INTERPRO : http://www.ebi.ac.uk/interpro/

Banques de structures 3D (PDB) : http://www.wwpdb.org/

Serveur d'alignement multiple et de phylogénie : http://www.phylogeny.fr/

Repliement des ARNs : http://www.bioinfo.rpi.edu/applications/mfold/

Localiser les gènes dans les génomes : http://opal.biology.gatech.edu/GeneMark/

Prédictions structurales pour les séquences protéiques : http://www.predictprotein.org/

Bioinformatique structurale : http://bioserv.cbs.cnrs.fr/SITE/index.html

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Bioprocédés et bioproductions

(159 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Analyse de données massivement parallèles Bioinformatique

RÉSUMÉ

Auteur(s)

INTRODUCTION

Cet article est réservé aux abonnés.Il vous reste 92% à découvrir.

L'expertise technique et scientifique de référence

DOI (Digital Object Identifier)

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

6. Analyse de données massivement parallèles

Cet article est réservé aux abonnés.Il vous reste 92% à découvrir.

L'expertise technique et scientifique de référence

BIBLIOGRAPHIE

DANS NOS BASES DOCUMENTAIRES

ANNEXES

Cet article est réservé aux abonnés.Il vous reste 95% à découvrir.

L'expertise technique et scientifique de référence

Analyse de données massivement parallèles
Bioinformatique

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.