Les seniors et les agents IA : quand l’expérience devient obstacle

Dans LLMs
12 févr., 15:29
0 commentaire

Les_seniors_et_les_agents_IA_le_paradoxe_du_determinisme

Un paradoxe traverse 2025 : les juniors déploient des agents IA plus vite que leurs aînés. La raison tient en une phrase : quarante ans passés à éliminer l’ambiguïté du code rendent les seniors allergiques à la nature irréductiblement probabiliste des LLM. Accepter l’incertitude consomme moins de ressources que la combattre.

Les juniors acceptent l’incertitude probabiliste des LLM, tandis que les seniors tentent de l’éliminer par du code déterministe.
Le principal changement de paradigme pour les senior engineers : passer de « éliminer l’ambiguïté » à « gérer la probabilité ».
Le hybrid reasoning combine déterminisme strict pour les tâches zéro-erreur et autonomie probabiliste pour les tâches créatives.
Cinq pièges structurels identifiés : état texte vs structures typées, flux rigide vs navigation autonome, erreurs comme crash vs input, tests unitaires vs évaluations probabilistes, APIs concises vs APIs verbeux-proof.
Instrumenter les agents IA via la fiabilité (Pass^k), la qualité (évaluation par LLM) et la traçabilité (journalisation des décisions).

Le déterminisme contre la probabilité

Depuis quatre décennies, le génie logiciel signifie une seule chose : éliminer l’ambiguïté. Typage strict, interfaces rigides, code prévisible. Input A + Code B = Output C, certitude garantie. Les ingénieurs expérimentés ont construit leur intuition sur cette prémisse.

Les agents IA inversent ce paradigme. Un LLM ne suit pas une instruction ; il la négocie. Il raisonne en probabilités, non en booléens. Il peut emprunter une route détournée, se perdre, ou changer d’avis parce que c’est sa nature.

Philipp Schmid, développeur senior chez Google DeepMind, formule cette rupture avec clarté en novembre 2025 :

« Pour des décennies, l’engineering a signifié enlever l’ambiguïté. Agent engineering est probabiliste. »

La métaphore qu’il propose est révélatrice : « Nous sommes des dispatchers. Nous donnons des ordres à un conducteur (un LLM) qui pourrait prendre un raccourci, se perdre, ou conduire sur le trottoir parce que c’était plus rapide. »

Les juniors, dépourvus d’habitude défensive, acceptent ce modèle sur ses conditions. Les seniors tentent de le coder, non de le gérer. D’où la friction temporelle.

Les cinq pièges structurels

Schmid identifie cinq domaines où l’habitude de déterminisme crée une résistance technique.

État texte contre structures typées

Le logiciel classique code l’état en schémas : is_approved: true, user_status: “active”. C’est binaire, machine-lisible, sans équivoque.

Les agents exigent un état textuel et sémantique : « Approuvé, mais concentrer l’effort sur le marché américain ». Le sens prime sur la structure. Un senior voit du chaos ; un junior, l’information que l’agent comprend naturellement.

Flux de contrôle rigide

Les seniors écrivent chaque chemin d’exécution exhaustivement. Si X, faire Y. Si erreur Z, faire W. C’est prévisible, testable. Schmid le contredit directement : « Faites confiance à l’agent pour naviguer le flux. Si vous codez chaque cas limite, vous ne construisez pas un agent IA. »

Un exemple : un client demande l’annulation d’abonnement. L’agent propose une réduction. Le client accepte. L’intention a pivoté — aucun organigramme prévu cela.

Les erreurs comme input, non comme crash

Le code traditionnel échoue ou lance une exception. L’agent doit intercepter l’erreur, l’intégrer comme nouvelle donnée, et rebondir. Schmid : « Une erreur est juste un autre input. Au lieu de planter, nous capturons l’erreur, la renvoyons à l’agent, et essayons de récupérer. »

Pour un senior, c’est contre-intuitif : l’erreur signale une défaillance du design. Pour l’agent, c’est une opportunité d’apprentissage.

Tests unitaires vs. évaluations probabilistes

Les seniors valident par assertion : cet input produit exactement cet output. Les agents ne garantissent rien d’exact, seulement une probabilité. Schmid propose : « Nous ne pouvons pas faire de tests unitaires sur le raisonnement. Nous devons valider la Fiabilité et la Qualité, et tracer les vérifications intermédiaires. »

Fiabilité (Pass^k) : l’agent réussit-il 45 fois sur 50 ? Qualité : un LLM juge-t-il la réponse acceptable ? Traçabilité : pourquoi cette action ? C’est une gestion du risque, non une certitude.

APIs implicites contre APIs explicites

Les agents exigent des interfaces verbeux et idiots-proof. Au lieu de delete_item_by_uuid(uuid), il faut delete_item_by_user_email_address. La sémantique doit être cristalline. Les seniors, habitués aux APIs concises, voient cela comme du sur-ingéniéring. C’est une friction de surface, mais réelle.

Hybrid reasoning : un cadre d'équilibre

Salesforce, Deloitte et Accenture ont documenté une réponse émergente (octobre-novembre 2025) : le hybrid reasoning. Ne pas choisir entre déterminisme et probabilisme, mais les calibrer par fonction et par risque.

La bimodalité des workloads

Jayesh Govindarajan, EVP AI Engineering chez Salesforce : « Ces agents probabilistes ont besoin d’une épine dorsale déterministe. »

La réalité se divise en deux catégories :

Tâches créatives (recommandations produits, rédaction) acceptent plusieurs bonnes réponses. Tâches zéro-erreur (statut de commande, facturation) exigent rigueur séquencée.

L'approche Salesforce

Les guardrails non-configurables (protections câblées comme le blocage du langage offensant) s’appliquent partout. Au-dessus, le calibrage varie. Une recommandation peut être autonome et créative. Un traitement de paiement doit suivre un protocole strict.

La tension réelle

Matt Fisher, chez Deloitte : « Je vois des cadres dire, ‘Je veux que mon agent ait la totale liberté.’ Puis la conformité et le juridique arrivent et c’est ‘Non, pas tant.’ »

L'escalade sécurisée

Kathy Baxter, Architecte IA responsable chez Salesforce : « Ne traitez pas l’autonomie comme un choix binaire. Escaladez cette capacité en toute sécurité. Appliquez des guardrails déterministes au point d’action, instrumentez tout, et avancez l’autonomie seulement quand vous avez des preuves que cela fonctionne. »

Le principe : « start small, scale safe ». Démarrer minimiste, instrumenter, avancer prudemment. L’autonomie croît avec la preuve.

Trois leviers de transition

Levier 1 : Revoir la mentalité d'ingénierie

Passer de « éliminer la variance » à « gérer la probabilité ». Les rétrospectives ne doivent plus demander « Pourquoi l’agent a-t-il échoué ? » mais « Pourquoi cet échec survient-il 11 % du temps et comment l’accepter ou le réduire ? »

Levier 2 : Instrumenter et évaluer, pas tester

Les métriques changent. Suivre la Fiabilité (Pass^k), la Qualité (évaluation par LLM), la Traçabilité (journalisation). Schmid : « Vous ne pouvez pas coder la probabilité. Vous devez la gérer via des evals et l’auto-correction. »

Levier 3 : Designer l'autonomie en amont

Avant de coder, décider où le déterminisme est non-négociable (transactions, données sensibles) et où l’autonomie crée de la valeur (recommandations, contenus générés).

Conclusion

Le diagnostic de Schmid en novembre 2025 cristallise une tension que les équipes ressentaient depuis des mois. Il n’est pas révolutionnaire — il est utile. Une fois nommé, le handicap peut être adressé.

Les seniors qui embrasseront cette transition plutôt que de la combattre redécouvriront leur avantage : l’expérience du design en conditions d’incertitude complexe. C’est un atout redéfini, pas un atout perdu.

FAQ

Pourquoi les junior engineers déploient-ils plus vite que les seniors ?

Les juniors acceptent l’incertitude probabiliste des LLM, tandis que les seniors tentent de l’éliminer par du code déterministe.

Quel est le principal changement de paradigme pour les senior engineers ?

Passer de « éliminer l’ambiguïté » (40 ans de logiciel) à « gérer la probabilité » (nature des agents IA).

Qu'est-ce que le « hybrid reasoning » ?

Combiner déterminisme strict pour les tâches zéro-erreur (paiements, conformité) et autonomie probabiliste pour les tâches créatives (recommandations, rédaction).

Quels sont les cinq pièges structurels identifiés par Philipp Schmid ?

État texte vs. structures typées ; flux de contrôle rigide vs. navigation autonome ; erreurs comme crash vs. input ; tests unitaires vs. évaluations probabilistes ; APIs concises vs. APIs verbeux-proof.