De l'agent au silicium. Six couches, six décisions.

Chaque couche a un rôle distinct, un profil de coût distinct, et une décision distincte pour toute organisation qui adopte l'IA. En lecture top-down : où se trouve l'utilisateur. Bottom-up : où va la dépense.

Six couches, du haut vers le bas.

1
Agent
Raisonnement autonome, usage d'outils, boucles de planification (ReAct). Au-dessus de tout, orchestre le travail.
2
Orchestration
Mémoire, RAG, prompt chaining, vector retrieval. Connecte le modèle à vos données privées sans réentraînement.
3
Inference Engine
Tokenisation, gateway API, stratégies d'échantillonnage. Chaque token coûte argent et latence.
4
Transformer Model
Attention heads, embeddings, decoder stack. Les 175 milliards à 1 trillion de paramètres qui SONT la connaissance compressée.
5
Training / ML Core
Pré-entraînement, supervised fine-tuning, RLHF, Constitutional AI. C'est là que le modèle reçoit ses valeurs.
6
Infrastructure
Clusters GPU (NVIDIA H100), HBM3 memory, NVLink, InfiniBand. Ne pas construire, acheter. Cloud-first.

Un levier de valeur par couche.

CoucheInsight businessLevier de valeur
AgentAutomatiser le travail de connaissance multi-étapesCoût de processus
OrchestrationRAG sur données privées, sans réentraînementMoat de données
InferenceChaque token coûte. Caching et prompt design pilotent l'OpExContrôle OpEx
TransformerLa capacité est largement fixée. Choisir le bon modèleÉvitement CapEx
TrainingFine-tuning à 1 à 5% du coût de pré-entraînementAvantage concurrentiel
InfrastructureAcheter de la compute, ne pas la posséderDiscipline capitalistique

Sur quelle couche notre dépense est-elle vraiment ?

La plupart des organisations pensent acheter de l'IA. Elles achètent de l'inference (coût par token) et de l'orchestration (infrastructure RAG). Savoir quelle couche porte le coût rend les discussions budget honnêtes.

Vous voulez la version boardroom de ça ?