HEC Paris, l’Université d’Orléans et le CNRS lancent CASCaD, Certification Agency for Scientific Code and Data, le seul laboratoire public au monde spécialisé dans la certification de la reproductibilité de la recherche scientifique. Cette initiative scientifique sans but lucratif permet aux chercheurs de prouver le caractère reproductible de leur recherche.
Dans la démarche scientifique, les chercheurs appuient leurs travaux sur ceux de leurs pairs. Cependant, plusieurs études récentes indiquent que les chercheurs peinent à reproduire les résultats publiés dans les journaux académiques. Cette situation a des répercussions importantes sur le monde académique et, par voie de conséquence, sur la société et le progrès scientifique.
Christophe Pérignon, professeur à HEC Paris et cofondateur de cascad affirme que deux raisons principales expliquent le faible niveau actuel de reproductibilité de la recherche: « le fait que les codes informatiques et les données partagés par les chercheurs ne soient pas vérifiés, et le fait qu’un nombre croissant de chercheurs analysent des données confidentielles, qui ne peuvent donc pas être partagées. »
Aujourd’hui, la majorité des articles scientifiques dans le domaine de l’économie est empirique et repose sur des traitements informatiques de données. Alors que la part des articles en économie de nature empirique était d’environ 10 % dans les années 1970, elle est aujourd’hui de plus de 75 %.
L’importance du phénomène indique qu’il est devenu urgent de trouver une solution au problème de la non-reproductibilité de la recherche. Le laboratoire cascad a mis au point une procédure de certification permettant de garantir la reproductibilité des résultats présentés dans une publication scientifique à partir des codes informatiques et des données utilisés par les auteurs de l’étude.
Un article récemment publié dans la revue Science indique que la certification cascad peut également être utilisée dans le cas de données confidentielles, telles que des données individuelles de salaires, d’impôts ou de santé. Ce type de données peut uniquement être analysé par des chercheurs formellement accrédités et via des centres d’accès sécurisés aux données.
D’après les auteurs de l’article, le principal défi auquel cascad doit faire face est celui de la confiance de la communauté scientifique. La confiance des producteurs de données rend le processus faisable et la confiance des journaux scientifiques rend le processus utile et digne d’intérêt. « Afin d’établir la confiance et d’accroître sa crédibilité, cascad suit un protocole de certification précis et transparent. La prochaine étape pour nous est de convaincre les chercheurs et les journaux », poursuit Christophe Pérignon.
Bibliographie
Certify reproducibility with confidential data
Christophe Pérignon, Kamel Gadouche, Christophe Hurlin, Roxane Silberman, Eric Debonnel
Science, 12 juillet 2019
source CNRS
Réagissez à cet article
Vous avez déjà un compte ? Connectez-vous et retrouvez plus tard tous vos commentaires dans votre espace personnel.
Inscrivez-vous !
Vous n'avez pas encore de compte ?
CRÉER UN COMPTE