"Le Travailleur." LLM + boucle + outils.

Un agent observe son environnement, décide quoi faire ensuite, appelle un outil, voit le résultat, et recommence jusqu'à atteindre l'objectif. Puissant, précoce, critique en gouvernance.

Observer. Penser. Agir. Répéter.

La boucle ReAct : observer l'état, raisonner dessus, agir via un outil, lire le résultat, décider la suite. Chaque boucle consomme des tokens et augmente le risque d'erreurs en cascade. Plafonnez le nombre de boucles. Auditez chaque appel d'outil.

Outils, mémoire, là où il gagne sa place.

Outils que l'agent peut utiliser

  • Web search et browsing
  • Code interpreter
  • Lecture et écriture de fichiers
  • Appels API (REST, GraphQL)
  • Requêtes base de données
  • Calendrier et email

Types de mémoire

  • Working : fenêtre de contexte
  • Episodic : conversations antérieures
  • Semantic : vector store
  • Procedural : schémas d'outils

Là où il gagne sa place

  • Recherche multi-étapes (légal, marché)
  • Triage service desk
  • Workflows document-vers-action
  • Assistants codeurs qui testent et exécutent

Pas d'autonomie dans les domaines à enjeu.

Pas d'action autonome en finance, RH, juridique, sécurité, ou engagements client. Human-in-the-loop sur tout appel d'outil avec conséquence réelle. C'est la règle BIITS. Écrivez-la dans la policy avant d'écrire le code.

Quelles actions peut-il prendre sans humain ?

Tout ce qui a une conséquence financière, réglementaire ou visible client : la réponse doit être "aucune". Les actions read-only et draft-only, c'est là que l'agentic AI gagne sa place aujourd'hui.

Vous voulez la version boardroom de ça ?