Van agent tot silicon. Zes lagen, zes beslissingen.

Elke laag heeft een eigen rol, eigen kostprofiel, en eigen beslissing voor elke organisatie die AI adopteert. Top-down lezen: waar de gebruiker zit. Bottom-up: waar de uitgave zit.

Zes lagen, top tot bottom.

1
Agent
Autonome redenering, tool-gebruik, plan-loops (ReAct). Zit bovenop alles en orchestreert het werk.
2
Orchestration
Geheugen, RAG, prompt chaining, vector retrieval. Verbindt het model met uw private data zonder hertrainen.
3
Inference Engine
Tokenisatie, API gateway, sampling. Elke token kost geld en latency.
4
Transformer Model
Attention heads, embeddings, decoder stack. De 175B tot 1T parameters die DE gecomprimeerde kennis ZIJN.
5
Training / ML Core
Pre-training, supervised fine-tuning, RLHF, Constitutional AI. Hier krijgt het model zijn waarden.
6
Infrastructure
GPU-clusters (NVIDIA H100), HBM3 memory, NVLink, InfiniBand. Niet bouwen, kopen. Cloud-first.

Eén waarde-hefboom per laag.

LaagBusiness inzichtWaarde-hefboom
AgentAutomatiseer multi-step kenniswerkProceskost
OrchestrationRAG over private data, geen hertrain nodigData moat
InferenceElke token kost geld. Caching en prompt design sturen OpExOpEx-controle
TransformerCapaciteit is grotendeels vast. Kies het juiste modelCapEx-vermijding
TrainingFine-tuning op 1 tot 5% van pre-training kostConcurrentiële edge
InfrastructureKoop compute, bezit het nietKapitaaldiscipline

Op welke laag zit onze uitgave eigenlijk?

De meeste organisaties denken dat ze AI kopen. Ze kopen inference (kost per token) en orchestration (RAG-infrastructuur). Weten welke laag de kost draagt, maakt budgetgesprekken eerlijk.

De boardroom-versie hiervan?