728 x 90



L’IA inonde les conférences informatiques : 24 000 articles submergent ICML

LIA_inonde_les_conferences_informatiques_24_000_articles_submergent_ICML

Depuis novembre 2022, la prolifération des outils IA génère une explosion inédite de soumissions aux grandes conférences informatiques. ICML reçoit 24 000 articles, le double de l’année précédente. arXiv rejette cinq fois plus de contenus. Le système d’évaluation par les pairs, déjà fragile, atteint ses limites face à des textes générés, souvent indistinguibles de la recherche authentique.

Le déluge : chiffres et chronologie

ICML 2026 a reçu plus de 24 000 soumissions — le double de l’année précédente. arXiv rejette désormais 2 400 articles par mois, soit cinq fois plus qu’avant novembre 2022, date du lancement de ChatGPT.

Cette accélération n’est pas une croissance organique de la recherche. Elle résulte de la capacité des outils d’intelligence artificielle à générer des articles complets, certains entièrement fictifs, en quelques secondes.

L’ensemble des soumissions à arXiv en informatique a augmenté de plus de 50 % depuis novembre 2022. Cette progression coïncide précisément avec la démocratisation des grands modèles de langage.

Un article complet en 54 secondes

Raphael Wimmer, chercheur en interaction humain-machine à l’Université de Regensburg, a testé Prism, un outil lancé récemment par OpenAI. En 54 secondes, il a généré un article complet décrivant une expérience qu’il n’avait jamais réalisée.

Cette productivité gagne du terrain. Selon une étude publiée en décembre 2025 dans Science par Kusumegi et ses collègues, la productivité des chercheurs utilisant les assistants IA a augmenté de 89,3 %. Cette hausse reflète à la fois les usages légitimes (génération de code, formulation d’hypothèses) et la production rapide de contenu non validé.

Le cœur du problème : hallucinations invisibles

Seulki Lee, chercheur au KAIST en Corée du Sud, pose le diagnostic : « De nombreux auteurs ne valident ou ne vérifient pas correctement le contenu généré par l’IA. »

Les analyses des soumissions aux grandes conférences montrent que certains articles sont entièrement générés par IA, tandis que d’autres contiennent des hallucinations : des données, résultats ou références inventées par le modèle.

Le vrai défi réside dans l’impossibilité de les détecter. Paul Ginsparg, co-fondateur d’arXiv à Cornell, l’explique sans détour : « Le contenu généré par IA ne peut souvent pas être distingué en regardant simplement l’abstract, ni même en parcourant le texte intégral. »

Les relecteurs ne peuvent plus juger la qualité uniquement sur l’engagement avec la littérature existante, la cohérence méthodologique ou le style. Ginsparg qualifie la situation de « menace existentielle » pour arXiv.

Seulki Lee ajoute : « Si cette question n’est pas résolue, la confiance dans la recherche scientifique, en particulier en informatique, court un risque substantiel d’érosion. »

Les premières réactions des institutions

Face à l’urgence, les conférences réagissent.

arXiv

Renforcement des vérifications d’éligibilité pour les nouveaux auteurs. Interdiction des articles de synthèse en informatique qui n’ont pas d’abord été acceptés par une revue évaluée par les pairs, forçant une première validation.

ICLR 2025

Obligation inédite : quiconque soumet un article doit aussi évaluer les travaux d’autres auteurs. Cette mesure vise à augmenter le pool de relecteurs, devenu critique face au volume. Elle consacre le recrutement de jeunes relecteurs, potentiellement moins expérimentés.

IJCAI

Premier article gratuit, soumissions suivantes à 100 dollars chacune. Les fonds sont redistribués aux évaluateurs, dissuadant les envois massifs.

ICML 2026

Politique anti-plagiat de soi-même : les auteurs déclarent leurs autres soumissions sous peine de rejet global. Mesure contre le « salami slicing », la pratique de diviser un résultat en dix articles différents.

Au-delà des correctifs : repenser la structure

Les mesures immédiates gagnent du temps, mais certains envisagent une refonte plus profonde.

Le modèle journalistique continu

Nancy Chen, responsable du programme à NeurIPS 2024 et chercheuse à A*Star à Singapour, plaide pour abandonner les conférences annuelles au profit d’un système journalistique continu. Avantages : suppression des pics de soumissions et évaluation plus progressive. Risques : perte du prestige des conférences phares et des opportunités de réseautage.

Utiliser l'IA pour détecter l'IA

L’autre piste : employer l’IA elle-même pour détecter l’IA généré, via des outils d’évaluation par pairs assistés. Ces systèmes restent en phase de test, leurs limites demeurant inexplicitées.

L'enjeu structurel

La crise ne menace pas seulement l’efficacité administrative. Elle touche aux fondations de la confiance scientifique. Les outils qui accélèrent la recherche légitime facilitent aussi la production de contenu frauduleux à grande échelle.

Les mesures actuelles — filtres, tarification, obligations de révision — sont des corrections tactiques. Elles n’adressent pas le problème de fond : comment valider la science quand les outils qui la produisent peuvent aussi la simuler ?

Cette question restera centrale pour la communauté informatique dans les années à venir.

FAQ

Pourquoi le nombre de rejets sur arXiv a-t-il explosé depuis novembre 2022 ?

La démocratisation des grands modèles de langage (ChatGPT, etc.) a augmenté les soumissions de 50 % en informatique ; arXiv rejette désormais 2 400 articles par mois (vs 480 avant), nombreux contenant du contenu généré par IA ou des hallucinations.

Comment les articles générés par IA sont-ils quasi indétectables ?

Selon Paul Ginsparg (co-fondateur d’arXiv), le contenu généré par IA ne peut souvent pas être distingué en lisant l’abstract ou le texte complet ; les relecteurs ne peuvent plus juger uniquement sur la cohérence méthodologique.

Quelles mesures les conférences ont-elles mises en place ?

arXiv a renforcé l’éligibilité des auteurs ; ICLR impose l’évaluation d’autres travaux ; IJCAI facture chaque soumission suivante (100 $) ; ICML interdit l’auto-plagiat et le « salami slicing ».

La détection par IA peut-elle résoudre le problème ?

C’est une piste explorée (« combattre le feu par le feu »), mais ces outils restent en phase de test et leurs limites ne sont pas clarifiées.

Quelles réformes structurelles sont envisagées à long terme ?

Nancy Chen propose d’abandonner les conférences annuelles au profit d’un système journalistique continu pour éliminer l’engorgement, bien que cela risquerait de diminuer le prestige et le réseautage.

Laisser un commentaire

Les champs obligatoires sont indiqués par *

Cancel reply

Commentaires

Chargement des commentaires…