AI Enablement Radar vecka 20: gör AI mätbar innan den får fler verktyg

Den här veckan är mönstret ganska tydligt: AI blir mindre "testa en AI-chatt" och mer "koppla in den i ett verkligt arbetsflöde, men mät och avgränsa först". För ett litet nordiskt team betyder det inte att ni ska bygga en egen AI-avdelning. Det betyder att ni behöver välja ett smalt flöde, bestämma vad AI får läsa och göra, och skriva ned hur ni märker om den faktiskt sparar tid utan att skapa nya risker.

Toppsignaler denna vecka

ServiceNow och Robinhood visar varför inbyggd AI slår sidovagnar. ServiceNow säger att AI, data, säkerhet, styrning och arbetsflödeskörning nu ingår i hela portföljen. Robinhood uppger att ServiceNow AI avleder 70 procent av medarbetarärenden innan en människa behöver ta vid, och att 2 200 manuella timmar sparas över 1 300 ärenden per månad.

Källa: ServiceNow press release

Google Cloud pekar på agentdrivna arbetsflöden, inte bara assistenter. Ett agentdrivet arbetsflöde är ett flerstegsflöde där AI kan planera, hämta information och föreslå eller utföra nästa steg under mänsklig kontroll. Google lyfter Telus, Suzano och Danfoss som exempel: Telus rapporterar 57 000 AI-användande medarbetare, Suzano minskade frågetid med 95 procent, och Danfoss minskade svarstid i ordermejl från 42 timmar till nästan realtid.

Källa: Google Cloud 2026 AI Agent Trends Report summary

Databricks gör utvärderingstester och styrning till produktionsfrågor. Utvärderingstester är återkommande tester av AI-svar mot förväntade resultat, ungefär som kvalitetskontroll för ett arbetsflöde. Databricks rapporterar att organisationer med AI-styrning flyttar över 12 gånger fler AI-projekt till produktion, och att organisationer med testverktyg flyttar nästan 6 gånger fler AI-system till produktion.

Källa: Databricks Enterprise AI Agent Trends

Kod-AI blir mer som arbetsytor. OpenAI Codex fick stöd för mobil fjärrstyrning via en Mac som kör Codex-appen, hooks i allmän tillgänglighet, åtkomsttoken och mer administrativ dokumentation. GitHub släppte samtidigt Copilot-appen i teknisk förhandsversion, med isolerade sessioner från GitHub-ärenden, pull requests och tidigare arbete.

Källa: OpenAI Codex changelog

Källa: GitHub Copilot app technical preview

EU och NIST gör riskarbetet mer konkret. EU:s AI Act-sida uppdaterades 11 maj med risknivåer, förbjudna användningar och stödresurser. EU:s GPAI-riktlinjer förklarar vem som omfattas av obligationsregler för generella AI-modeller, medan NIST fortsätter att bygga ut AI RMF med en profil för kritisk infrastruktur.

Källa: European Commission AI Act framework

Källa: European Commission GPAI provider guidelines

Källa: NIST AI Risk Management Framework

Vad företag faktiskt gör med AI

De bästa exemplen den här veckan är tråkiga på rätt sätt. De handlar om ordermejl, interna ärenden, frågedatabaser och rapporter. Det är där ett mindre företag också bör börja.

Google Cloud beskriver hur Danfoss använder AI-agenter för e-postbaserad orderhantering, med 80 procent av transaktionsbesluten automatiserade och svarstid från 42 timmar till nästan realtid. För en svensk grossist, konsultbyrå eller skoladministration är översättningen enkel: välj ett inflöde som redan är repetitivt, till exempel offerter, frånvaroärenden eller supportmejl. Låt AI sortera, sammanfatta och föreslå svar. Låt människan godkänna innan något skickas.

Källa: Google Cloud 2026 AI Agent Trends Report summary

ServiceNow-exemplet med Robinhood är också värt att titta på. Poängen är inte att små team ska köpa en stor plattform i morgon. Poängen är att AI-effekten kommer när verktyget sitter inne i ärendehanteringen, med rätt data, rätt behörigheter och tydlig loggning. Om AI ligger bredvid i en lös chatt får ni ofta snabbare formuleringar, men sämre kontroll.

Källa: ServiceNow press release

Deloitte sätter ett bredare mått på samma problem. Rapporten säger att medarbetares tillgång till AI ökade med 50 procent under 2025, men att AI-skills gap fortfarande är största hindret för integration. Bara en av fem organisationer har en mogen styrmodell för autonoma AI-agenter. Det låter som storföretagsdata, men det är nästan mer relevant för små team: utan vana och regler blir AI snabbt en samling personliga genvägar som ingen annan kan granska.

Källa: Deloitte State of AI in the Enterprise 2026

Verktygslagret: plattformar, agenter och arbetsflöden

Veckans verktygssignal är att agentverktygen börjar anta formen av arbetsrum. GitHub Copilot app handlar om isolerade sessioner: en uppgift får egen branch, filer, konversation och status. Det är en sund riktning. När flera AI-uppgifter kör parallellt vill man kunna se vad som är klart, vad som väntar på människa och vad som aldrig borde slås ihop.

Källa: GitHub Copilot app technical preview

OpenAI Codex pekar åt samma håll från ett annat håll: fjärrstyrning från mobil, hooks, åtkomsttokens och auto-review-dokumentation. Hooks är små regler eller skript som körs vid vissa händelser, till exempel före en ändring eller efter ett test. För små team är det här mer användbart än det låter. En enkel hook kan stoppa AI från att ändra kunddata, köra ett test innan en ändring lämnas vidare, eller påminna om att en människa måste godkänna.

Källa: OpenAI Codex changelog

MCP, Model Context Protocol, är en standard för att koppla AI-verktyg till externa system och datakällor. GitHub visar både möjligheten och risken. Secret scanning via GitHub MCP Server är nu allmänt tillgängligt och kan låta MCP-kompatibla agenter skanna kod efter läckta hemligheter innan commit eller pull request. Bra. Men samma princip säger också att varje anslutning är en ny behörighetsfråga. Vem får AI läsa? Vad får den ändra? Hur loggas det?

Källa: GitHub secret scanning with MCP Server

Styrning och risk: vad som behöver sättas innan skala

AI-governance betyder de beslut, roller och kontroller som avgör hur AI får användas. Det behöver inte börja med en tung policy. För ett litet team räcker det ofta med fyra saker: godkända användningsfall, datagränser, mänsklig granskning och ett enkelt mätkort.

EU:s AI Act använder en riskbaserad modell med förbjudna användningar, högrisk-system, transparensrisker och minimal risk. För skolor är det extra tydligt: AI som påverkar bedömning, antagning eller elevers möjligheter kan hamna i en helt annan riskklass än AI som hjälper en lärare att göra ett första lektionsutkast.

Källa: European Commission AI Act framework

EU:s GPAI-riktlinjer och Code of Practice ger mer klarhet kring generella AI-modeller. De riktar sig främst mot modellleverantörer, men små organisationer bör ändå läsa signalen: dokumentation, upphovsrätt, transparens och säkerhetsrutiner blir upphandlingsfrågor. Fråga leverantören vad modellen får tränas på, vilken data som lagras och hur de hanterar systemrisker.

Källa: European Commission GPAI provider guidelines

Källa: General-Purpose AI Code of Practice

COSO:s vägledning om intern kontroll över generativ AI är inte skriven för små företag i första hand, men kärnan är användbar: riskerna finns i vardagen. Promptmanipulation, otydliga resonemang, modellglidning och snabba konfigurationsändringar kan påverka rapportering, beslut och efterlevnad. Skriv därför ned vem som äger flödet, vem som får ändra prompten och hur fel fångas upp.

Källa: COSO Achieving Effective Internal Control Over Generative AI

Veckans praktiska Hammer-test

Testet tar 30 till 45 minuter och kräver inga nya integrationer. Välj ett verkligt men ofarligt flöde: fem gamla supportmejl, fem gamla elevfrågor, fem inkomna offertförfrågningar eller fem interna ärenden. Ta bort personuppgifter först.

Gör så här:

Välj ett flöde där resultatet alltid ska granskas av människa.
Skriv tre regler: vad AI får läsa, vad den får föreslå och vad den aldrig får göra.
Låt AI sammanfatta varje ärende och föreslå nästa steg.
Mät tre saker: sparad tid, antal fel eller tveksamma förslag, och hur ofta människan behövde skriva om svaret.
Bestäm efter testet: stoppa, justera eller bygg vidare.

Kopiera prompten:

Du hjälper oss att testa om AI kan stödja ett smalt arbetsflöde utan att ta beslut själv.

Material: [klistra in 3-5 anonymiserade exempel]

Regler:
- Använd bara materialet jag ger dig.
- Fatta inga beslut och skicka inget till kund, elev eller leverantör.
- För varje exempel: sammanfatta läget, föreslå nästa mänskliga åtgärd, markera osäkerheter och säg vilken information som saknas.
- Avsluta med ett mätkort: vad sparade tid, vad blev riskabelt, vad bör en människa alltid granska?

Om testet visar verklig tidsvinst och få risker kan det vara ett första Tool Forge/Tekniksmide-spår: inte en stor AI-satsning, utan ett avgränsat arbetsflöde med mätning och mänsklig kontroll. Vill ni bolla ett sådant flöde, börja via kontakt.

Företag och verktyg att hålla koll på

ServiceNow: visar hur AI blir mer användbar när den är inbyggd i ärendehantering och styrning, inte ligger som separat chatt.
Google Cloud och Gemini: bra källa för konkreta agentexempel i kundservice, SQL-frågor och orderflöden.
Databricks: sätter siffror på varför styrning och utvärderingstester är produktionsfrågor.
GitHub Copilot och OpenAI Codex: visar hur kod-AI blir arbetsytor med sessioner, hooks, granskning och fjärrstyrning.
Microsoft Education och OECD: värda att följa för skolor som vill använda AI utan att förväxla snabbare uppgifter med bättre lärande.

Källa: Microsoft Education AI Toolkit

Källa: EU Digital Skills & Jobs: OECD Digital Education Outlook 2026

Smedjans nyhetsbrev

Få nya artiklar i inkorgen

Välj de ämnen som intresserar dig. Inget brus, max ett mejl i veckan.

Vi följer GDPR. Avsluta när du vill.

Relaterat

Nyheter

29 april 2026

AI-nyheterna 29 april: agenternas arbetslager tar form

Dagens AI-produktivitetsbrief: workspace agents, agentplattformar, kodagenter och varför varje agent behöver ett tydligt arbetskontrakt.

Läs mer

AI-brief: agenter går från experiment till drift

Nyheter

30 april 2026

AI-brief: agenter går från experiment till drift

Dagens AI-produktivitetsbrief om Claude Code, Codex, MCP och varför agentarbete nu behöver hanteras som drift.

Läs mer

När AI slutar vara chatbot och blir infrastruktur

Agentisk AINyheter

1 maj 2026

När AI slutar vara chatbot och blir infrastruktur

En kort sammanfattning av ett NotebookLM-avsnitt om hur AI lämnar chatbot-fasen och blir operativ infrastruktur.

Läs mer