AI Enablement Radar vecka 23: bygg en AI-arbetsbänk, inte ännu en chatt

Adam Olofsson HammareAdam Olofsson Hammare
AI Enablement Radar vecka 23: bygg en AI-arbetsbänk, inte ännu en chatt

AI-verktygen tog ett steg närmare vardagsarbetet den här veckan. Inte genom ännu en större modell i sig, utan genom fler kopplingar till appar, databaser, kodverktyg och partnernätverk. För ett litet team är frågan därför ganska jordnära: vilken återkommande uppgift ska AI få hjälpa till med nästa vecka, vilka system behöver den läsa, och vem godkänner innan något går iväg?

Toppsignaler denna vecka

  • Codex flyttar utanför utvecklarteamet. OpenAI skriver att fler än 5 miljoner personer använder Codex varje vecka, och att icke-utvecklare nu står för cirka 20 procent av användarna. Det är en tydlig signal för små team: AI-arbetsbänken kommer inte bara att användas för kod, utan för rapporter, kampanjmaterial, research, dataanalys och interna appar.

Källa: Codex for every role, tool, and workflow, OpenAI

  • OpenAI flyttar in i AWS styrningsmodell. AWS meddelade att GPT-5.5, GPT-5.4 och Codex nu är allmänt tillgängliga på Amazon Bedrock. Det betyder att organisationer som redan använder AWS kan hantera modellåtkomst, fakturering, IAM, VPC-isolering, kryptering, CloudTrail-loggar och guardrails på ett sätt som passar befintlig IT-styrning.

Källa: GPT-5.5, GPT-5.4, and Codex from OpenAI are now generally available on Amazon Bedrock, AWS

  • Partnerkvalitet blir en del av AI-valet. Anthropic lanserade Services Track och Partner Hub för Claude Partner Network. Kraven handlar om certifierade personer, kunder i produktion och publika kundberättelser, inte bara snygga säljtexter. För köpare är det en påminnelse: fråga vem som faktiskt har byggt något som körs.

Källa: Introducing the Services Track and Partner Hub of the Claude Partner Network, Anthropic

  • Agentarbete får API:er och sandlådor. GitHub gjorde Copilot Agent Tasks REST API tillgängligt i public preview för Copilot Pro, Copilot Pro Plus och Copilot Max, och släppte lokala och molnbaserade sandlådor för Copilot. Agentisk arbetsprocess betyder här att AI kan starta, följa och utföra uppgifter i flera steg i en avgränsad miljö, inte bara svara i en chatt.

Källor: Agent tasks REST API, GitHub Changelog och Cloud and local sandboxes for GitHub Copilot, GitHub Changelog

  • MCP blir en praktisk integrationsyta. MCP, Model Context Protocol, är en standard som låter AI-verktyg använda utvalda appar, databaser och åtgärder genom en kontrollerad anslutning. Google Cloud gjorde Remote MCP Server för AlloyDB allmänt tillgänglig, och Zapier beskriver hur deras MCP kan ge AI tillgång till fler än 9 000 appkopplingar och 30 000 åtgärder med OAuth, begränsningar och audit logs.

Källor: AlloyDB Remote MCP Server GA, Google Cloud och Zapier MCP guide

Vad företag faktiskt gör med AI

Det mest användbara den här veckan är att adoptionsexemplen börjar likna riktigt arbete, inte demo-flöden.

Google Cloud lyfter små och medelstora företag som använder Gemini Enterprise för intern sökning, supportmotorer, marknadsresearch, kontraktsanalys och samlad kunskap. Finska Eficode nämns som exempel på ett team som bygger en teknisk supportmotor över komplexa interna wikis. Huge använder agenter för marknadsresearch och kontraktsanalys, där nykundsintag kan gå från flera dagar till minuter.

Källa: How Gemini Enterprise is helping SMBs jumpstart their AI transformations, Google Cloud

OpenAI pekar på något liknande från ett annat håll. När Codex används av analytiker, marknadsförare, operatörer och designers blir det mindre intressant att fråga "kan den skriva kod?" och mer intressant att fråga "kan den göra ett första underlag som teamet faktiskt kan granska?" Zapier använder enligt OpenAI Codex för att hämta kontext ur Slack, Google Docs och Coda och göra postmortems, incidentplaner och ärendebiljetter. NVIDIA nämns för forskningsflöden som idéarbete och scripts för maskininfrastruktur.

Källa: Codex for every role, tool, and workflow, OpenAI

Perplexity riktar sig mer direkt mot växande företag. Deras Main Street AI Accelerator med U.S. Small Business Administration omfattar 25 miljoner dollar i Computer-krediter, upp till 100 000 berättigade företag och kopplingar till fler än 400 verktyg som QuickBooks, Mailchimp, Shopify och Stripe. Programmet är amerikanskt, men mönstret är relevant även här: AI flyttar in där småföretag redan gör ekonomi, marknad, e-handel och betalningar.

Källa: Perplexity Computer for Growing Businesses, Perplexity

Verktygslagret: plattformar, agenter och arbetsflöden

Tre tekniska lager börjar bli praktiska även för icke-tekniska team.

Först: arbetsbänken. Codex, Notion Developer Platform och Perplexity Computer visar samma riktning från olika håll. AI ska inte bara svara i en ruta. Den ska kunna läsa rätt underlag, skapa ett utkast, lägga det där teamet redan arbetar och be om godkännande när det behövs. Notion beskriver till exempel externa agenter, Workers och synk från API-baserade datakällor in i Notion.

Källor: Notion releases och Perplexity Computer for Growing Businesses, Perplexity

Sedan: kopplingen till data. Google Clouds AlloyDB MCP-server är ett tydligt exempel. Den låter agenter läsa färsk operativ data via IAM, begränsa åtkomst till tabeller, scheman eller vyer, använda read-only SQL och logga frågor och verktygsanrop i Cloud Audit Logs. Det är precis den sortens mönster som behövs när AI ska vara användbar utan att få hela nyckelknippan.

Källa: AlloyDB Remote MCP Server GA, Google Cloud

Till sist: sök och kvalitet. Mistral släppte Search Toolkit i public preview för ingestion, retrieval och evaluation i AI-sökflöden. Evals är tester som mäter om AI-systemet hittar rätt underlag och ger användbara svar på exempel som liknar verkligheten. För en skola, byrå eller liten verksamhet räcker det ofta att börja med tio riktiga frågor och kontrollera om AI:n hittar rätt dokument innan den får användas i skarpt läge.

Källa: Introducing Search Toolkit, Mistral AI

Styrning och risk: vad som behöver sättas innan skala

Den praktiska säkerhetsfrågan är inte "ska vi koppla AI till något alls?". Den är: hur kopplar vi AI så att den kan göra nytta med små behörigheter, synliga loggar och tydliga stoppunkter?

EU:s AI Act fortsätter att göra skillnad även för organisationer som inte bygger egna grundmodeller. Kommissionens GPAI-riktlinjer förklarar vilka leverantörer som omfattas av reglerna för general-purpose AI models, när skyldigheterna gäller och att kommissionens verkställighetsbefogenheter börjar gälla den 2 augusti 2026. För köpare betyder det att leverantörsfrågor bör bli mer konkreta: modellkort, träningssammanfattningar, incidentrutiner, dataskydd och vilka underleverantörer som används.

Källa: Guidelines for providers of general-purpose AI models, European Commission

NIST AI Risk Management Framework är fortfarande en bra checklista för organisationer som vill få ordning på ansvar, mätning och uppföljning. Det är frivilligt, men användbart: beskriv användningsfallet, riskerna, vem som äger beslutet, hur kvalitet mäts och hur fel rapporteras.

Källa: AI Risk Management Framework, NIST

OWASP GenAI Security Project påminner om en annan vardagsrisk: AI-appar och agentflöden får nya sårbarheter när de kan läsa data, använda verktyg och ta åtgärder. Praktiska skydd är till exempel miljövariabler eller secret managers i stället för lösenord i promptar, scoped API keys, minsta möjliga behörighet, sandlådor, godkännandesteg, audit logs och redigering av känslig information i utdata.

Källa: OWASP Top 10 for Large Language Model Applications

Veckans praktiska Hammer-test

Testet tar 30 till 45 minuter och passar ett litet team som redan använder flera system men ännu inte vill bygga en full automation.

Välj en återkommande arbetsuppgift: till exempel veckans kundfrågor, en intern supportkö, ett kommande nyhetsbrev, nya offertförfrågningar eller elevfrågor inför en lektion.

Rita arbetsbänken: skriv ner tre saker: vilka källor AI får läsa, vilket utkast AI får skapa och vem som måste godkänna innan något skickas, publiceras eller uppdateras.

Sätt små behörigheter: använd testdata eller en avgränsad vy först. Om verktyg kopplas in, använd scoped API keys, separata testkonton, read-only där det räcker och loggning av varje åtgärd.

Kör fem riktiga exempel: be AI skapa ett första utkast, men låt en människa markera vad som var rätt, vad som saknades och vad som absolut inte får automatiseras ännu.

Spara beslutet: avsluta med en kort regel: "AI får göra detta", "AI får inte göra detta" och "människa måste godkänna här".

Kopiera gärna den här prompten:

Du är vår AI-arbetsbänksdesigner. Hjälp oss välja en återkommande uppgift där AI kan göra nytta nästa vecka.

Uppgift: [beskriv uppgiften]
Källor AI får läsa: [lista system, dokument eller vyer]
Utkast AI får skapa: [t.ex. svar, sammanfattning, offertunderlag, arbetskort]
Saker AI inte får göra själv: [t.ex. skicka till kund, ändra pris, uppdatera register]
Mänsklig granskare: [roll/person]

Ge oss:
1. Ett enkelt arbetsflöde i 5 steg.
2. Minsta behörighet AI behöver i varje steg.
3. Vilka loggar eller kvitton vi bör spara.
4. Fem testfall vi kan köra innan vi skalar.
5. En tydlig stoppregel om AI:n är osäker.

Företag och verktyg att hålla koll på

  • OpenAI Codex: flyttar från kod till fler roller och materialtyper.
  • Amazon Bedrock: gör OpenAI-modeller och Codex lättare att köpa, styra och logga för AWS-organisationer.
  • GitHub Copilot: visar hur agentarbete blir API-styrt och sandlådat.
  • Google Cloud AlloyDB MCP: visar ett konkret mönster för AI med styrd databasåtkomst.
  • Zapier MCP: gör appkopplingar begripliga för team utan egen integrationsavdelning.

Om ni vill göra det här utan att fastna i verktygsval hjälper Hammer Automation gärna till med Tool Forge / Verktygssmide: välj en workflow, koppla den med små behörigheter, bygg in granskning och gör resultatet mätbart. Börja här: kontakta Hammer Automation.

Smedjans nyhetsbrev

Få nya artiklar i inkorgen

Välj de ämnen som intresserar dig. Inget brus, max ett mejl i veckan.

Få nya artiklar i inkorgen

Vi följer GDPR. Avsluta när du vill.