Le contexte
Avant la pénicilline, avant la cellule, avant le règne des plantes, il y avait déjà des virus. Des virus dans une mer de bactéries, qui les infectaient, les pillaient, les fissuraient. Sur des milliards de générations, quelque chose s’est passé : les bactéries ont appris à se défendre.
Pas avec des anticorps — ça viendrait bien plus tard chez nous. Avec des systèmes de défense moléculaires d’une variété ahurissante, dont nous n’avons commencé à mesurer l’étendue qu’en 2018, et dont le catalogue complet n’a pris forme qu’en mai 2026, sous la plume de l’équipe d’Aude Bernheim à l’Institut Pasteur.
Ce que dit le papier princeps
Bernheim, Mordret, Hervé et al. — Science, 2026, DOI 10.1126/science.adv8275.
Avec un modèle de langage entraîné sur les génomes bactériens (GeneCLRDF), l’équipe a identifié 2,39 millions de protéines candidates réparties dans 478 206 familles. Douze nouveaux systèmes ont été validés expérimentalement chez Escherichia coli et Streptomyces albus — confirmant que l’arsenal connu jusqu’ici ne représentait que la pointe d’un iceberg.
Pour mettre cela en perspective : avant 2018, on connaissait CRISPR, RM (restriction-modification), et une demi-douzaine d’autres mécanismes. Aujourd’hui, les systèmes de défense représentent 8 à 15 % du génome bactérien moyen, soit autant que les gènes du métabolisme central. La défense n’est pas un accessoire — c’est un trait constitutif du vivant procaryote.
Pourquoi ça nous regarde
Parce que la bactérie a déjà résolu, à sa propre échelle, un problème qui nous occupe en clinique : arrêter un virus avant qu’il ne pille la machinerie cellulaire. Les solutions qu’elle a trouvées sont chimiquement réelles, biologiquement fonctionnelles, et — surtout — transposables chez le vertébré quand le mécanisme est conservé.
Deux exemples retenus dans la V1 Bactaegion :
-
CBASS : la bactérie synthétise un nucléotide cyclique en réponse à l’infection, qui déclenche une mort cellulaire abortive. C’est exactement l’architecture de cGAS-STING chez nous. Les analogues chimiques entre les deux systèmes sont déjà à l’étude. Voir la piste Mimétiques cGAMP pour CBASS.
-
Viperines bactériennes : la bactérie convertit ses propres nucléotides en analogues 3’-déshydro qui empoisonnent les ARN polymérases virales. C’est la stratégie chimique du Sofosbuvir (premier traitement curatif de l’hépatite C, blockbuster pharmaceutique). On a donc, dans le génome de Bacillus trouvé au fond d’un lac, un précurseur naturel d’un médicament approuvé chez l’homme. Voir la piste ddhNTP contre les flavivirus.
Ce que la communauté Bactaegion peut faire
Pas grand-chose seule. Tout, ensemble.
Le dataset GeneCLRDF est trop vaste pour qu’un seul laboratoire l’annote manuellement. Chaque protéine candidate doit être inspectée, contextualisée, reliée à ses homologues, testée in silico, et — éventuellement — produite en laboratoire humide pour confirmation. C’est précisément le travail asymétrique de la foule que des plateformes comme Wikipedia, Galaxy Zoo ou Foldit ont prouvé fonctionnel à grande échelle.
Vous pouvez :
- Brancher votre moteur LLM pour analyser une protéine candidate avec votre stack de raisonnement habituelle. Votre clé reste chez vous, vos requêtes ne quittent pas votre navigateur.
- Annoter une séquence en isolant un segment qui vous semble être un domaine fonctionnel. Votre œil détecte les motifs avant que votre intellect ne les nomme.
- Lire les pistes déjà posées et tenter de les falsifier — c’est la contribution la plus précieuse, et la moins coûteuse en temps.
L’objectif n’est pas de remplacer les chercheurs. C’est d’augmenter la surface cognitive disponible pour examiner un corpus que personne ne peut voir entièrement seul.
Pour aller plus loin
- Bibliothèque des 5 cibles V1 — les familles retenues après audit cross-LLM
- Chapitre 2 : Le langage des cycles — histoire des seconds messagers cycliques bactériens et humains
- Federation Hub — comment les laboratoires contribueront à l’entraînement d’un modèle commun sans révéler leurs données primaires