Présentation

Article

1 - BIOINFORMATIQUE, DES PIONNIERS À AUJOURD'HUI

2 - ANALYSE DES SÉQUENCES DE PROTÉINES

3 - ANALYSE DES SÉQUENCES NUCLÉIQUES ET DES GÉNOMES

4 - ALIGNEMENT MULTIPLE ET PHYLOGÉNIE MOLÉCULAIRE

5 - BIOINFORMATIQUE STRUCTURALE

6 - ANALYSE DE DONNÉES MASSIVEMENT PARALLÈLES

  • 6.1 - Puces à ADN
  • 6.2 - Bioinformatique et biologie des systèmes

Article de référence | Réf : BIO7050 v1

Alignement multiple et phylogénie moléculaire
Bioinformatique

Auteur(s) : Jean-Michel CLAVERIE

Date de publication : 10 nov. 2007

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais English

RÉSUMÉ

Cet article s’intéresse à la bioinformatique dans son intégralité, de ses débuts à aujourd’hui. Cette discipline, visant à analyser l’information biologique, a pour principal objectif l’identification de l’information contenue dans la séquence des macromolécules et leur structure. L’analyse poussée des séquences de protéines, des séquences nucléiques et des génomes (comme l’alignement optimal de deux séquences, la recherche de similarités, etc) est détaillée dans cet article. Liée aux objets d’études de la biologie moléculaire et de la génomique, la bioinformatique a vécu récemment l’arrivée de nouvelles techniques parallèles, comme les puces à ADN.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Jean-Michel CLAVERIE : Professeur, faculté de Médecine de l'université de la Méditerranée et laboratoire « Information génomique et structurale », CNRS (Marseille)

INTRODUCTION

La bioinformatique est la discipline de l'analyse de l'information biologique, principalement contenue dans la séquence des macromolécules (acides nucléiques et protéines) et leur structure tridimensionnelle. C'est une branche théorique de la biologie, largement antérieure à la « révolution génomique » des années 1990.

La bioinformatique n'est pas une simple application des concepts et des outils de l'informatique traditionnelle aux données biologiques. Elle recouvre un ensemble de techniques très spécifiques, intimement liées aux objets d'étude de la biologie moléculaire et de la génomique.

Plus récemment, l'introduction de techniques expérimentales massivement parallèles (exemple : les puces à ADN), produisant une masse de données numériques, a amené les bioinformaticiens à s'approprier des méthodes mathématiques et statistiques plus générales, développées dans d'autres domaines scientifiques confrontés à un grand volume de données (« data mining »).

Enfin, la bioinformatique est indissociable de l'existence de grandes bases de données internationales publiques, de la mise en place de nombreux serveurs internet, et de l'attitude « open access » de ses développeurs.

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-bio7050


Cet article fait partie de l’offre

Bioprocédés et bioproductions

(161 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation
Version en anglais English

4. Alignement multiple et phylogénie moléculaire

Nous quittons ici le domaine de l'analyse des séquences isolées, pour entrer dans le monde des comparaisons multiples.

Si les méthodes d'alignements de séquences évoquées dans les paragraphes précédents ne tiraient, jusqu'ici, partie que de l'information de similarité, les approches présentées vont maintenant tenter d'interpréter leurs différences ou, tout le moins, le contraste entre leurs différences et leurs similarités.

Si les méthodes d'alignements sont d'autant plus efficaces que les séquences comparées sont proches, celles présentées ici seront d'autant plus informatives que les séquences utilisées, bien que toujours homologues, seront divergentes.

4.1 Séquence des macromolécules comme document de leur histoire évolutive

C'est à Zuckerkandl et Pauling que revient le mérite d'avoir reconnu, dès les années 1960 [10], que la séquence des macromolécules biologiques, en plus de déterminer leur fonction, pouvait aussi servir à documenter leur histoire.

Si nous acceptons l'hypothèse de l'évolution biologique, selon laquelle la diversité des organismes actuels provient d'une radiation à partir d'ancêtres communs, pour la plupart disparus, la présence de caractères communs entre deux espèces est le plus simplement interprétée comme un « héritage » de leur origine commune.

La reconstruction d'une phylogénie nécessite, au départ, l'identification de caractères homologues (au sens de comparables) entre les espèces que l'on veut étudier (exemple, la présence d'une bouche), puis, dans un second temps, la mesure des différences associées à ces caractères (taille de la bouche, position, nombre de dents, etc.).

  • Dans le contexte des séquences de macromolécules, c'est la procédure d'alignement optimal qui va servir, en les mettant en regard, à définir les positions homologues entre deux gènes ou deux protéines. Ces positions correctement alignées (soit celles sans « - ») sont autant de caractères comparables.

    C'est ensuite de la variété des nucléotides ou des acides aminés, occupant chacune de ces positions, que l'on va tirer...

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Bioprocédés et bioproductions

(161 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Alignement multiple et phylogénie moléculaire
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - NEEDLEMAN (S.), WUNSCH (C.) -   A general method applicable to the search for similarities in the amino acid of two proteins.  -  J. Mol. Biol., 48, p. 443-453 (1970).

  • (2) - HENIKOFF (S.), HENIKOFF (J.G.) -   Amino acid substitution matrices from protein blocks.  -  Proc. Natl. Acad. Sci. USA, 89, p. 10915-10919 (1992).

  • (3) - SMITH (T.F.), WATERMAN (M.S.) -   Identification of common molecular subsequences.  -  J. Mol. Biol., 147, p. 195-197 (1981).

  • (4) - DUMAS (J.P.), NINIO (J.) -   Efficient algorithms for folding and comparing nucleic acid sequences.  -  Nucleid Acids Res., 10, p. 197-206 (1982).

  • (5) - WILBUR (W.J.), LIPMAN (D.J.) -   Rapid similarity search of nucleic acid and protein databanks.  -  Proc. Natl. Acad. Sci. USA, 80, p. 726-730 (1983).

  • (6) - LIPMAN (D.J.), PEARSON (W.R.) -   Rapid and sensitive protein similarity searches.  -  Science,...

1 Sites Internet

Portail BLAST et bases de données du NCBI : http://www.ncbi.nlm.nih.gov/

Autre serveur BLAST rapide (Gigablaster) : http://www.igs.cnrs-mrs.fr/

Site de référence sur les génomes animaux : http://www.ebi.ac.uk/ensembl/

Banque de données de séquences protéiques UNIPROT : http://www.expasy.org/sprot/

Banques de motifs protéiques INTERPRO : http://www.ebi.ac.uk/interpro/

Banques de structures 3D (PDB) : http://www.wwpdb.org/

Serveur d'alignement multiple et de phylogénie : http://www.phylogeny.fr/

Repliement des ARNs : http://www.bioinfo.rpi.edu/applications/mfold/

Localiser les gènes dans les génomes : http://opal.biology.gatech.edu/GeneMark/

Prédictions structurales pour les séquences protéiques : http://www.predictprotein.org/

Bioinformatique structurale : http://bioserv.cbs.cnrs.fr/SITE/index.html

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Bioprocédés et bioproductions

(161 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS