L'inférence de graphes d'interactions entre les gènes est devenue un cas d'école pour la statistique en grande dimension, tandis que les modèles décrivant l'expression des gènes au niveau moléculaire ont pris tout leur sens avec l'arrivée des données de cellules uniques. Relier ces deux approches semble aujourd'hui crucial, mais le dialogue est loin d'être évident : les modèles statistiques sont souvent jugés trop simplistes voire irréalistes, et les modèles mécanistes sont réputés difficiles à calibrer à partir de données réelles.
Dans cet exposé, je montrerai comment un modèle mécaniste décrivant un nombre arbitraire de gènes en interaction peut être calibré, via une procédure similaire à certaines méthodes classiques d'inférence de réseau, pour produire à la fois un graphe interprétable et un outil de simulation quantitative. Les arrêtes du graphe ont ainsi une définition causale explicite dans un paradigme probabiliste : il s'avère que la variabilité observée dans les données peut s'expliquer par la seule stochasticité biologique, qui joue alors un rôle fonctionnel.
Ce point de vue permet de faire « entrer » Darwin à l'intérieur des organismes multicellulaires, sur une échelle de temps où le hasard n'intervient pas sur la séquence ADN des gènes, mais plutôt sur leur expression dans chaque cellule.
Travail en collaboration avec Elias Ventre, Thibault Espinasse, Gérard Benoit et Olivier Gandrillon.