04 · Voor de vier eigenschappen

Voor de vier eigenschappen. Hoe generative AI zijn karakter krijgt.

Generative AI komt niet kant-en-klaar. Het wordt in twee fases gebouwd: pretraining (een document-completer) en fine-tuning (een assistent-laag erbovenop). Elke fase laat een vingerafdruk achter.

Twee fases, één vingerafdruk

Eén keer gebouwd. Dan opnieuw getraind.

Fase 1

Pretraining

Getraind op enorme hoeveelheden tekst voor één taak: gegeven alles tot nu, voorspel wat volgt. Miljarden keren herhaald. Wat eruit komt, is geen assistent. Het is een document-completer. Vraag het "Wie is de president?" en het kan een lesje in burgerschap voortzetten, een lijst, of een quiz. Geen besef van u, geen besef van helpen.

Fase 2

Fine-tuning

Om van die document-completer een assistent te maken, train je opnieuw. Gecureerde voorbeelden van goed assistent-gedrag, en reward-signalen (RLHF) die richting veilige, behulpzame antwoorden duwen. Hier leert het uw input als verzoek te zien, te antwoorden in plaats van te ratelen, schadelijke verzoeken te weigeren, "ik weet het niet" te zeggen.

Kerninzicht

Getrainde laag

Het assistent-gedrag is een getrainde laag bovenop de document-completer. Daarom zit vloeiende prose naast zelfverzekerde onzin in hetzelfde antwoord. Beide komen uit dezelfde machine.

Waarom dit telt

De laag is dun. Eronder voltooit het nog steeds documenten.

Duw hard op de assistent-laag en de document-completer eronder steekt soms de kop op: ratelen, lijsten, voorspellen hoe een zelfverzekerd antwoord eruit zou zien in plaats van waarheid op te halen. De vier eigenschappen (Steerability, Working Memory, Token Prediction, Knowledge) beschrijven die dubbele aard in operationele termen.

De vraag om te stellen

Welke laag faalde, als het model fout zit?

De assistent-laag (het gaf een zelfverzekerd antwoord dat het had moeten weigeren), of de document-completer eronder (het genereerde plausibel-klinkende onzin). Het noemen van de faalmode is de helft van de oplossing.