Article de référence | Réf : BIO7060 v1

Prédiction bioinformatique de la structure 2D
Bioinformatique structurale - Bases de données et méthodes de prédiction

Auteur(s) : Catherine ETCHEBEST

Date de publication : 10 mai 2016

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais En anglais

RÉSUMÉ

Cet article est dédié à la présentation de différentes méthodes bioinformatiques visant à analyser et à prédire la structure des macromolécules biologiques, protéines et acides nucléiques. Il souligne l’importance de la structure 3D pour comprendre la fonction de ces macromolécules et l’apport des méthodes de prédiction de la structure à partir de la séquence. Il fournit des informations pour comprendre les principes des méthodes de bioinformatique structurale et des recommandations pour la mise en œuvre d’une démarche de prédiction. Une liste non exhaustive d’outils et de bases de données utiles est proposée, associée à une bibliographie récente.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

Structural Bioinformatics - Database and prediction methods

This article presents different bioinformatics approaches dedicated to the analysis and prediction of 3D structures of biological macromolecules, proteins and nucleic acids. It underlines the importance of 3D structures in understanding the function of these macromolecules, and the usefulness of 3D structural prediction methods. It provides information to help gain a better understanding of the main structural bioinformatics methods, and makes recommendation to implement an appropriate prediction strategy. With this aim, an array of tools and databases is suggested, supported by a recent bibliography.

Auteur(s)

  • Catherine ETCHEBEST : Professeur des universités - Responsable d’équipe INSERM Équipe DSIMB, UMR-S1134, Université Paris-Diderot, INSERM, INTS, Labex GR-Ex. Paris, France

INTRODUCTION

La bioinformatique est connue comme la discipline permettant d’exploiter, d’interpréter, d’annoter les données biologiques à l’aide d’algorithmes, c’est-à-dire de méthodes informatiques. Les données les plus fréquemment exploitées sont celles relatives aux séquences des génomes et des protéines. Néanmoins, si la connaissance de cette information est un prérequis pour caractériser une macromolécule biologique, elle ne suffit pas à comprendre la fonction qui lui est associée. Celle-ci dépend en effet de l’arrangement approprié dans l’espace des unités constitutives de ces macromolécules biologiques, par exemple nucléotides, acides aminés. Connaître, analyser la structure 3D des macromolécules se révèle donc une étape nécessaire pour mieux appréhender leur fonction et donc leurs possibles dysfonctionnements. Différentes techniques biophysiques permettent d’accéder à cette information structurale. Le dichroïsme circulaire par exemple peut fournir des indications sur la structuration du squelette polypeptidique des protéines, ou sur les formes adoptées par des séquences d’ADN. La cristallographie couplée à la diffraction des rayons X et la résonance magnétique nucléaire peuvent, quant à elles, renseigner sur la structure à une échelle atomique. L’exploitation de ces données, destinées à mettre en lumière des propriétés caractéristiques de macromolécules, requiert l’utilisation de méthodes informatiques regroupées sous le terme de « bioinformatique structurale » ou aussi « modélisation moléculaire ».

Grâce à l’analyse de l’information disponible sur les structures 3D des protéines, il a été possible de mettre en évidence des relations étroites entre séquence et structure, en particulier une conservation de la structure 3D pour des séquences similaires mais aussi pour des séquences très différentes en particulier celles qui dérivent d’un ancêtre commun (séquences homologues). Cette propriété peut ainsi être utilisée pour prédire la structure 3D d’une macromolécule à partir de sa séquence. Cela constitue un enjeu majeur pour les projets qui ont succédé aux projets de séquençage massif. Il s’agit des initiatives visant à mettre en place et à automatiser les procédures afin d’obtenir la structure 3D des protéines (Protein Structure Initiative). De même, l’impact des mutations en des positions très distantes le long de la séquence peut être mieux compris car la structure 3D peut regrouper dans l’espace ces positions. Connaître la structure permet aussi de mieux comprendre les interactions fines mises en jeu entre des partenaires qui dépendent de leur position relative. Il est ainsi possible de comprendre la spécificité de ligands et ainsi de l’améliorer, voire de potentiellement concevoir de nouvelles protéines (protein design) ou de nouveaux médicaments, enjeu majeur des prochaines décennies.

Enfin, une macromolécule biologique n’est pas un objet rigide, mais au contraire un objet capable de s’adapter à différents environnements, différents partenaires pour accomplir sa fonction. Cette adaptation qui s’effectue au cours du temps peut induire des changements conformationnels relativement limités ou au contraire de grande ampleur et sur des échelles de temps extrêmement différentes, de quelques picosecondes à plusieurs heures. Cette propriété, difficile à caractériser expérimentalement, s’avère accessible grâce à des algorithmes très performants dits de « dynamique moléculaire ».

Dans cet article seront détaillées les caractéristiques des structures 3D de différentes macromolécules biologiques, en particulier les protéines, les principes des méthodes expérimentales fournissant des informations tridimensionnelles, mais aussi les approches bioinformatiques permettant la prédiction de la structure à partir de sa séquence. Enfin, au-delà de la structure sera décrite cette propriété cruciale des macromolécules biologiques à savoir leur dynamique. Seront soulignés les atouts mais aussi les limites de ces différentes approches, ainsi que quelques applications emblématiques dans le domaine. En résumé, cet article renseignera sur le nouveau paradigme, qui relie séquence-structure-dynamique et fonction, et sur les méthodes de bioinformatique structurale et de modélisation moléculaire capables de contribuer à l’élucidation de ces relations.

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

KEYWORDS

bioinformatics   |   biology   |   Biological Macromolecules   |   3D structures   |   Prediction Methods

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-bio7060


Cet article fait partie de l’offre

Bioprocédés et bioproductions

(161 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Version en anglais En anglais

2. Prédiction bioinformatique de la structure 2D

Même si elles sont moins populaires qu’elles ne l’ont été, les méthodes de prédiction du repliement secondaire des protéines se révèlent très utiles pour guider des constructions plus élaborées de modèle structural. Comme pour toutes les méthodes de prédiction, le principe général consiste :

  • à faire l’hypothèse qu’il existe une relation entre la nature de l’acide aminé et sa structure secondaire et ;

  • qu’il est possible de l’identifier grâce à des méthodes statistiques de fouilles de données.

Pour cela, il est nécessaire de disposer d’un jeu d’apprentissage, c’est-à-dire un jeu de structures connues pour lesquelles la structure secondaire a été attribuée à l’aide d’un outil, par exemple DSSP. La performance de la méthode est ensuite évaluée sur un autre ensemble de structures, appelé « jeu » ou « ensemble de validation ». La plupart des outils de prédiction de structures secondaires se limitent à une prédiction à trois états : hélice, boucle, brin. Les méthodes d’apprentissage vont de l’analyse bayésienne à l’utilisation de réseaux de neurones simples ou multicouches, ou de machines à support vectoriel. Les taux de prédiction sont actuellement supérieurs à 80 %. Les progrès les plus significatifs dans les performances de prédiction ont été obtenus lorsque :

  • l’environnement en séquence de l’acide aminé considéré a été pris en compte, c’est-à-dire une fenêtre de séquence centré sur l’acide aminé ;

  • les données évolutives ont été prises en compte, c’est-à-dire en considérant non pas une seule séquence mais un ensemble de séquences homologues.

Cependant, il est nécessaire que les séquences soient suffisamment différentes pour que cette information évolutive soit pertinente. L’information relative à la famille est obtenue en premier lieu par un alignement multiple de séquences, qui peut être établi à l’aide de différents outils tels que MAFFT, Muscle, ClustalO ou encore T-Coffee ...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Bioprocédés et bioproductions

(161 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Prédiction bioinformatique de la structure 2D
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - NARAYANAN (B.C.), WESTBROOK (J.), GHOSH (S.), PETROV (A.I), SWEENEY (B.), ZIRBEL (C.L.) et al -   The nucleic acid database : new features and capabilities.  -  Nucleic Acids Res. gkt980. doi:10.1093/nar/gkt980 (2013).

  • (2) - PETTERSEN (E.F.), GODDARD (T.D.), HUANG (C.C.), COUCH (G.S.), GREENBLATT (D.M.), MENG (E.C.) et al -   UCSF Chimera – A visualization system for exploratory research and analysis.  -  J. Comput. Chem., 25, p. 1605-1612 doi:10.1002/jcc.20084 (2004).

  • (3) - PAULING (L.), COREY (R.B), BRANSON (H.R.) -   The structure of proteins : two hydrogen-bonded helical configurations of the polypeptide chain.  -  Proc. Natl. Acad. Sci., États-Unis, 37, p. 205 (1951).

  • (4) - PAULING (L.), COREY (R.B.) -   Configurations of polypeptide chains with favored orientations around single bonds : two new pleated sheets.  -  Proc. Natl. Acad. Sci., États-Unis, 37, p. 729 (1951).

  • (5) - RAMACHANDRAN (G.N.), RAMAKRISHNAN (C.T.), SASISEKHARAN (V.) -   Stereochemistry of polypeptide chain configurations.  -  J. Mol....

1 Outils et sites Internet

Un site regroupe un très grand nombre d’informations sur les outils disponibles : http://omictoolsom/biomolecular-structure-c1312-p1tml

1. Outils de visualisation graphique associés à de multiples fonctions d’exploration structurales

Chimera : https://www.cgl.ucsf.edu/chimera/

Pymol : https://www.pymol.org/

Rasmol : http://www.openrasmol.org/

VMD : http://www.ks.uiuc.edu/Research/vmd/

Yasara : http://www.yasara.org/

2. Prédiction de structures 3D de protéines

(PS)2 :

Modélisation par homologie http://ps2v3.life.nctu.edu.tw

3D-JIGSAW :

Modélisation par homologie http://bmm.crick.ac.uk/~3djigsaw/

3D-Jury :

Modélisation par homologie, reconnaissance du repliement http://bip.weizmann.ac.il/toolbox/structure/3d.htm

CPHModels :

Modélisation par homologie http://www.cbs.dtu.dk/services/CPHmodels/

ESyPred3D :

Modélisation par homologie http://www.unamur.be/sciences/biologie/urbm/bioinfo/esypred/

FAMS :

Modélisation par homologie http://www.pharm.kitasato-u.ac.jp/fams

FFAS :

Attribution de repliement et de fonction http://ffas.sanfordburnham.org/ffas-cgi/cgi/ffas.pl...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Bioprocédés et bioproductions

(161 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS