Innan AI-agenten skalar behöver den en körjournal

När AI-agenter går från demo till vardag blir frågan mindre glamorös: vem ser vad de faktiskt gjorde?
En agent som söker i Slack, läser filer, kallar på verktyg, ber om godkännande och producerar en rapport behöver mer än en bra prompt. Den behöver en körjournal. Inte för att göra arbetet tungt, utan för att någon ska kunna förstå körningen efteråt: vad var uppdraget, vilka källor användes, vilka beslut togs automatiskt, var stoppade människan, och vad behöver ändras nästa gång?
Det här är särskilt viktigt för organisationer som börjar använda AI i återkommande admin, support, analys, utbildning eller intern rapportering. Där blir agenten snabbt en del av arbetssättet, inte bara ett chattfönster.
Körjournal betyder inte stort observability-projekt
En körjournal är en enkel post per AI-körning. Den ska svara på samma frågor som en bra arbetsanteckning, fast för ett system som kan använda verktyg.
Börja med detta:
- Uppdrag: vad agenten skulle göra, med datum och intern beställare.
- Ägare: vem som ansvarar för resultatet, inte bara vem som skrev prompten.
- Indata: vilka filer, system, kanaler, dokument eller formulär agenten fick läsa.
- Verktyg: vilka kopplingar, API:er eller appar agenten använde.
- Godkännanden: vilka steg krävde mänskligt ja innan agenten gick vidare.
- Utdata: var resultatet hamnade: utkast, rapport, ärende, mejl, CRM-post eller kodändring.
- Tid och kostnad: ungefärlig körtid, väntetid och token- eller licenskostnad om den är synlig.
- Fel och omkörning: vad som gick fel, om körningen upprepades och varför.
- Rättning efteråt: vad en människa ändrade innan resultatet fick användas.
Det räcker långt med ett kalkylblad, ett ärendeformulär eller en Notion-sida i början. Poängen är inte att bygga ett perfekt kontrollrum. Poängen är att sluta tappa bort bevisen.
Varför detta blev mer akut den här veckan
Google gjorde Core Assistant till standardagent i Gemini Enterprise och lade Trace och Metrics i publik förhandsvisning. Där syns bland annat sessionsantal, latens, agentanrop, verktygsanrop, fel, körflöden, varaktighet, indata och utdata när instrumentering finns på plats. Det är ett tydligt tecken: agentarbete börjar behandlas som drift, inte bara som chatt.
Källa: Gemini Enterprise release notes
Anthropic introducerade Dynamic Workflows i Claude Code. Claude kan då orkestrera tiotals eller hundratals underagenter för stora kodbasjobb, revisioner och verifieringsloopar. Det är kraftfullt, men Anthropic varnar också för betydande tokenanvändning och kräver bekräftelse första gången en sådan körning startar. När en körning kan pågå länge och involvera många underagenter blir en efterhandslogg inte byråkrati. Den blir minnet som gör arbetet granskningsbart.
Källa: Introducing dynamic workflows in Claude Code
OpenAI visar samma riktning från kontrollsidan. Admin API:erna används för organisationshantering som användare, projekt, API-nycklar, audit logs, spend alerts, data retention och modellbehörigheter. Det säger något praktiskt: AI-drift handlar inte bara om bättre svar, utan om vem som får använda vilken modell, inom vilken budget, med vilken retention och vilken revisionshistorik.
Källa: OpenAI Admin API-dokumentation
Mistral beskriver Vibe som en agent för längre arbetsflöden över kunskap, appar, filer, kod och kopplingar. Den visar steg, verktygsanrop, resonemangskedjor, indata och utdata, och känsliga åtgärder kräver godkännande. Det är den användarnära versionen av samma mönster: när agenten gör mer än att skriva text behöver någon kunna följa spåren.
Källa: Vibe gets to work
Frågan som avslöjar om ni är redo
Ställ den här frågan efter nästa återkommande AI-körning:
Kan vi, utan att fråga personen som råkade starta den, se vad agenten läste, vad den gjorde, vad den inte fick göra, vad den kostade, vad som blev fel och vem som godkände resultatet?
Om svaret är nej är ni inte nödvändigtvis oansvariga. Ni är bara fortfarande i promptfasen. Det fungerar för enskilda experiment. Det fungerar sämre när AI börjar skriva kundsvar, sammanfatta elevunderlag, analysera ekonomifiler, skapa internrapporter eller föreslå ändringar i system.
En lätt start: logga tio körningar
Välj ett arbetsflöde där AI redan används ofta. Det kan vara veckorapporten, supporttriage, mötesanteckningar, offertutkast, publiceringsplanering eller en intern sökning över dokument.
Gör sedan detta under två veckor:
- Logga de tio första körningarna med samma mall.
- Markera varje körning som grön, gul eller röd.
- Skriv en mening om varför gula och röda körningar behövde mänsklig korrigering.
- Notera varje gång agenten saknade rätt källa, använde fel verktyg eller behövde ett extra godkännande.
- Bestäm en ägare för mallen, inte bara för verktyget.
Efter tio körningar brukar mönstret synas. Ibland är problemet prompten. Ibland är det källorna. Ibland är det att agenten får för mycket behörighet för tidigt. Och ibland är det enklare: ingen har bestämt vad en godkänd körning betyder.
När Hammer kan hjälpa
Det här är ett typiskt Tankesmide- och Verktygssmide-problem. Först behöver ni en rimlig arbetsregel: vilka agentkörningar måste loggas, vem läser loggen och när stoppar ni ett flöde? Sedan kan själva mallen, formuläret eller automationen byggas enkelt.
Om ett AI-flöde börjar upprepas, använder flera system eller kan påverka kunder, elever, ekonomi eller publicering, börja med körjournalen innan ni skalar. Det låter tråkigt. Det är också det som gör nästa steg säkrare.
Smedjans nyhetsbrev
Få nya artiklar i inkorgen
Välj de ämnen som intresserar dig. Inget brus, max ett mejl i veckan.
Vi följer GDPR. Avsluta när du vill.


