Recherche computationnelle : quand le code devient science
La recherche computationnelle redéfinit la science moderne. Découvrez comment algorithmes et simulations transforment la découverte scientifique et créent de nouveaux paradigmes.
La recherche computationnelle : quand le code devient science
Le 12 novembre 2022, DeepMind annonçait la résolution de la structure tridimensionnelle de pratiquement toutes les protéines connues — une prouesse qui aurait demandé des décennies de travail expérimental. Cet exploit symbolise une mutation profonde dans notre rapport à la découverte scientifique : le code n'est plus l'outil qui transcrit une découverte trouvée ailleurs, il est le lieu même de la découverte.
La recherche computationnelle ne constitue plus un simple appendice à la science expérimentale ou théorique. Elle en est devenue un pilier autonome, avec ses propres méthodologies, ses exigences de rigueur et, surtout, sa capacité à explorer des espaces scientifiques inaccessibles aux approches traditionnelles. Comprendre cette transformation n'est pas un luxe académique — c'est devenu une nécessité pour quiconque prétend naviguer la science contemporaine.
Trois paradigmes scientifiques, pas deux
La science s'est longtemps organisée autour d'une dualité bien établie : la théorie et l'expérience. La théorie propose des modèles mathématiques du monde ; l'expérience les valide ou les réfute. C'est le cœur de la méthode scientifique depuis Galilée.
Mais cette dualité masquait une réalité sous-jacente. Les équations théoriques que nous écrivons — les équations de Navier-Stokes pour la mécanique des fluides, les équations de Schrödinger en mécanique quantique — sont souvent impossibles à résoudre analytiquement. Pendant des siècles, cette limitation a contraint la science théorique à se concentrer sur les systèmes simplifiés, les cas limites où les mathématiques cèdent leurs secrets.
La simulation computationnelle a rompu ce contrat. Elle nous permet de résoudre numériquement ce que nous ne pouvons résoudre algébriquement. Mais ce passage du stylo à l'ordinateur n'est pas qu'une simple accélération. C'est une transformation ontologique.
Lorsque vous simulez le repliement d'une protéine sur ordinateur, vous n'êtes ni en train de faire de la théorie pure — vous manipulez des équations trop complexes pour être traitées à la main — ni de l'expérience au sens traditionnel. Vous construisez un monde virtuel gouverné par des lois physiques, et vous l'explorez. C'est une troisième voie, distincte et irréductible aux deux premières.
La simulation comme fenêtre sur l'invisible
Considérez la climatologie. Prévoir le climat de la Terre en 2100 exige de modéliser l'atmosphère, les océans, la cryosphère et les interactions entre ces systèmes. Les équations gouvernant ces phénomènes sont bien connues depuis le XIXe siècle — ce sont les équations de Navier-Stokes couplées aux équations de transport. Mais résoudre précisément ces équations pour l'intégralité de la planète sur un siècle ? C'est strictement impossible sans ordinateurs.
Pour contourner cette impossibilité, les climatologues ne renoncent pas à la théorie. Ils discrétisent l'espace en millions de petites cellules, ils discrétisent le temps en pas de quelques minutes, et ils demandent aux ordinateurs de calculer itérativement l'évolution du système. Ce n'est pas une simplification de la théorie — c'est une réalisation de la théorie à travers l'approximation numérique.
Cette distinction est cruciale. Les simulations climatiques ne sont pas des boîtes noires empiriques : elles incarnent notre meilleure compréhension théorique, exécutée à une échelle jamais atteinte auparavant. Lorsqu'une simulation prédit un résultat surprenant, ce n'est ni de la magie ni de la chance. C'est une conséquence logique et vérifiable des lois physiques codifiées dans les équations.
Mais il existe une limite importante : les simulations peuvent être fausses. Non parce que le code contient des bugs — bien que ce soit possible — mais parce que nos équations elles-mêmes peuvent être incomplètes ou inadéquates. C'est pourquoi la validation expérimentale reste essentielle. Les simulations climatiques, par exemple, sont constamment confrontées aux observations réelles. Ce qui change, c'est que l'expérience ne détermine plus seule la vérité scientifique : elle dialogue avec la simulation.
Machine learning : quand la science quitte le code pour les données
La simulation computationnelle suppose qu'on connaît les équations gouvernant le système. Mais que faire lorsqu'on ne les connaît pas ?
C'est là qu'intervient le machine learning, et c'est ici que la recherche computationnelle devient vraiment radicale.
Traditionnellement, le scientifique énonce une hypothèse : "Les nuages se forment lorsque l'humidité dépasse un seuil." Puis il conçoit une expérience pour la tester. Le machine learning inverse ce processus. Au lieu d'énoncer une hypothèse, on donne à l'algorithme des milliers ou des millions d'exemples, et on lui demande de trouver lui-même les patterns.
En 2020, des chercheurs ont utilisé le machine learning pour découvrir des lois de conservation nouvelles en physique. Ils ont entraîné un réseau de neurones sur des simulations de systèmes dynamiques, et le réseau a découvert que certaines grandeurs (analogues à l'énergie ou l'impulsion) restaient constantes au cours de l'évolution. Ces lois étaient littéralement invisibles dans les données — c'est l'algorithme qui les a dégagées.
Cette capacité à extraire de la structure à partir du chaos apparent relève d'une forme de science empirique radicalisée. On ne pose plus les questions ; on laisse les données suggérer les questions et les réponses. Cela soulève une question vertigineuse : si une machine découvre une loi de la nature, la comprend-elle ? Et que signifie "comprendre" une loi que personne ne sait exprimer sous forme mathématique classique ?
Le succès de AlphaFold — le système d'apprentissage profond de DeepMind capable de prédire les structures protéiques — illustre bien cette ambiguïté. Le système fonctionne extraordinairement bien : ses prédictions s'alignent avec les structures déterminées par cristallographie aux rayons X avec une précision clinquante. Pourtant, nous ne savons pas vraiment comment il le fait. Les poids des milliards de paramètres du réseau sont une boîte noire pour l'intuition humaine.
Ce n'est pas un problème mineur d'explainabilité. C'est une interrogation profonde sur la nature même de la connaissance scientifique. Si la prédiction est fiable mais incompréhensible, avons-nous vraiment progressé ?
Rigueur et reproductibilité : les défis de la science computationnelle
La science computationnelle hérite des défis de rigueur de l'expérience et de la théorie, puis en ajoute de nouveaux.
Prenez d'abord le problème de la reproductibilité. Un résultat expérimental peut être reproduit en refaisant l'expérience. Un résultat théorique peut être vérifié en revérifiant les calculs mathématiques. Un résultat computationnel devrait être reproductible en réexécutant le code.
Mais dans la pratique, c'est souvent un cauchemar. Les versions de bibliothèques changent, les compilateurs introduisent des optimisations différentes, les architectures de processeurs varient — et tout cela peut altérer légèrement les résultats numériques. Pour la climatologie, ce problème est bien identifié : deux implémentations légèrement différentes du même algorithme peuvent diverger considérablement après quelques années de simulation.
Un deuxième enjeu concerne la validation des modèles. Vous construisez une simulation élaborée : comment savez-vous qu'elle est correcte ? Il faut la tester contre des cas dont on connaît la solution (cas de validation), puis l'appliquer à des problèmes réels et voir si elle prédit correctement ce qui se passe. Mais les données réelles sont souvent parcellaires, bruitées, ou contaminées par des variables non modélisées. Le scientifique computationnel doit naviguer ce tension : comment distinguer les insuffisances du modèle des limitations des données ?
Un troisième défi, moins discuté mais crucial, est la complexité explicative. Une simulation qui marche peut être extrêmement complexe, avec douzaines de paramètres, d'heuristiques et d'approximations numériques. Comprendre pourquoi elle marche exige une analyse minutieuse de chaque couche. Dans le cas de AlphaFold, les chercheurs ont déployé des efforts considérables pour interpréter ce que le réseau apprend réellement. Transformer une boîte noire fonctionnelle en une boîte blanche compréhensible est un travail de science classique, mais amplifié par la complexité.
Exemples concrets : trois domaines transformés
Biologie structurale et repliement protéique. Avant AlphaFold, prédire la structure 3D d'une protéine à partir de sa séquence d'acides aminés était un problème ouvert depuis quarante ans. Des chercheurs avaient construit de laborieux protocoles expérimentaux : cristallographie aux rayons X, spectroscopie RMN. AlphaFold a fait basculer la donne. En 2024, plus de 99 % des protéines humaines ont une structure prédite — une transition entre deux mondes scientifiques.
Découverte de matériaux. Les matériaux du futur — supraconducteurs à haute température, batteries plus denses, panneaux solaires plus efficaces — exigent d'explorer des espaces chimiques gigantesques. Il existe littéralement des milliards de combinaisons d'éléments possibles. La simulation computationnelle permet de filtrer rapidement les candidates prometteuses. Des équipes utilisent désormais des algorithmes d'optimisation pour parcourir cet espace colossal, guidées par des modèles prédictifs. Chaque découverte expérimentale est ensuite validée en laboratoire, mais l'ordre des étapes a inversé : la simulation précède et guide l'expérience, plutôt que l'inverse.
Analyse des données génomiques. Le séquençage du génome humain en 2003 était impossible sans informatique. Mais plus intéressant encore : l'interprétation de ces données exige aujourd'hui des algorithmes sophistiqués capables d'identifier les patterns d'épissage alternatif, les interactions génétiques et les mécanismes épigénétiques. Le biologiste moléculaire moderne doit penser comme un informaticien. La biologie s'est computationnalisée.
Les limites de la science computationnelle
Malgré ses succès spectaculaires, la recherche computationnelle ne peut pas tout.
Elle suppose d'abord que vous pouvez modéliser le système d'intérêt. Or, pour certains phénomènes — la conscience, l'émergence culturelle, les dynamiques socio-économiques complexes — nous n'avons pas d'équations pertinentes. Écrire du code sans fondement théorique adéquat, c'est construire un château sur le sable.
Elle suppose aussi que vous pouvez valider vos résultats. Pour les simulations de cosmologie (qu'était l'univers microseconde après le Big Bang), la validation expérimentale est impossible : l'événement ne peut pas être reproduit. Pour les prédictions climatiques en 2100, nous ne pouvons pas attendre cent ans pour vérifier. Les scientifiques doivent se fier à d'autres méthodes de validation — cohérence logique, compatibilité avec des observations indirectes, robustesse du modèle face à des perturbations.
Enfin, elle souffre de ce qu'on appelle l'overfitting conceptuel. Un algorithme entraîné sur des données passées peut paraître performant, mais complètement échouer sur des données futures si le régime a changé. Cela pose un problème aigu pour la climatologie ou l'épidémiologie : le système sur lequel nous testons est lui-même en mutation.
Vers une science profondément transformée
Nous sommes en train de vivre une transition historique. Le scientifique du XXe siècle était soit théoricien (maniait les équations), soit expérimentateur (concevait des dispositifs). Le scientifique du XXIe siècle doit être hybride : comprendre les équations, savoir coder, interpréter les données, valider contre le réel.
Cette transformation n'est pas terminée. Elle n'a pas embrasse l'ensemble des disciplines — les sciences humaines, par exemple, restent largement pré-computationnelles. Mais dans les domaines qui l'ont adoptée, elle redéfinit la nature même de la connaissance scientifique.
Ce qui rend cette transition fascinante, c'est qu'elle n'élève pas la science computationnelle au-dessus des autres modes de connaissance. Elle les intègre. Une simulation climatique valide doit reposer sur une théorie physique solide (équations de Navier-Stokes), doit être implémentée avec rigueur informatique, et doit être testée contre des observations réelles. Aucun des trois piliers ne suffit seul.
La recherche computationnelle n'est donc pas l'avenir de la science : c'est le présent. Et ce présent exige une compréhension plus fine de ses possibilités et de ses limites. Car la puissance du code — sa capacité à transformer l'abstrait en résultat concret — peut aussi devenir une source d'illusion si on la confond avec la compréhension véritable.
C'est cette tension, entre la puissance prédictive et la compréhension profonde, qui définit le travail du chercheur contemporary. Et c'est aussi ce qui rend la science contemporaine infiniment plus riche, et infiniment plus exigeante.
Auteur
Marcus Détrez
Fondateur d’IMAT137 et de LSI. Consultant en stratégie technologique et formation.
