Artikler

Claude Managed Agents: Derfor er harness vigtigere end modellen

88 % af AI-agenter når aldrig produktion — infrastrukturen er flaskehalsen. Claude Managed Agents afkobler hjerne, hænder og session. Lær hvad der ændrede sig, og hvad du selv skal løse.

C
Christian Vinther Daugaard··4 min læsetid

Claude Managed Agents · AI agent infrastructure · agent harness · Anthropic · METR benchmark · AI production deployment

Agenter

Hvad skete der?

Den 8. april 2026 lancerede Anthropic Claude Managed Agents i public beta. Gartner advarer om, at mere end 40 % af enterprise AI-agentprojekter vil fejle inden 2027 på grund af manglende styring og uklar ROI (Gartner via Joget, 2026). Managed Agents rammer direkte ind i infrastrukturgabet: en færdigbygget, konfigurerbar agent-harness, hvor du definerer agentens identitet, og Anthropic styrer eksekveringen.

De vigtigste fakta:

  • Systemet introducerer tre primitiver: Agent (versioneret config med model, tools, skills, MCP servers), Environment (containerskabelon til sandboxet tooleksekvering) og Session (stateful kørsel, der opretter en frisk sandbox pr. eksekvering)
  • Syv SDK-sprog understøttet ved lancering: Python, TypeScript, Java, Go, C#, Ruby, PHP (Anthropic Docs, 2026)
  • Pris: 0,08 USD pr. session-time for aktiv agent-runtime plus standard Claude token-priser (Anthropic Docs, 2026)

"Agent harnesses encode assumptions about what Claude can't do. These assumptions grow stale as Claude gets more capable and can bottleneck Claude's performance." – Lance Martin, Anthropic

Hvorfor betyder det faktisk noget?

Claude Opus 4.5 opnår en 50 %-tidshorisont på ca. 4,9 timer på METR-benchmarket (293 minutter), og den horisont fordobles omtrent hver 4,3 måned (METR, 2026; METR, 2026). Det betyder, at enhver harness, du shippede for seks måneder siden, var designet til en model, der kun kunne håndtere opgaver af halv længde. Harness er ikke en wrapper. Den er performance-laget.

Sebastian Raschkas analyse af kodningsagentarkitektur identificerer seks byggesten, der forklarer, hvad en harness rent faktisk gør: live repo-kontekst, promptform og cache-genbrug, struktureret tool-brug med validering, kontekstreduktion, struktureret session-hukommelse og delegering med afgrænsede subagenter (Raschka, 2026). Det er ikke valgfrie features. Det er grunden til, at Claude Code føles mere kapabel end den samme model i et almindeligt chatvindue.

Her er argumentet, som ingen enkelt kilde fremfører: Managed Agents er kommercielt betydningsfuldt — ikke fordi modellen blev bedre, men fordi harnesses blev dårligere relativt til voksende modelkapacitet. Da Anthropic afkoblede "hjernen" (Claude og dens harness) fra "hænderne" (sandboxes) og "sessionen" (event log), faldt p50 time-to-first-token med ca. 60 %, og p95 faldt over 90 % (Anthropic Engineering, 2026). Den arkitektur er produktet.

Messages API vs. Managed Agents — 5 dimensioner

Fremhævet række = anbefalet tilgang

DimensionMessages APIManaged Agents
Harness-ejerskabDit ansvarAnthropics ansvar
Infrastruktur-ejerskabDit ansvarAnthropics ansvar
Agent-konfigurationSkræddersyet kodeVersioneret YAML
Understøttelse af lange opgaverByg det selv (DIY)Indbygget
Risiko for forældet harnessDit ansvar at håndtereAnthropics ansvar at håndtere
Kilde: agentskills.dk-analyse baseret på Anthropic Docs 2026Fremhævet række = anbefaling

Hvad betyder det for teams, der bygger AI-agenter?

88 % af AI-agenter når aldrig produktion (DigitalApplied, 2026), og 54 % af forsøg på at skalere, der gik i stå, peger på manglende produktionsovervågning som den blokerende faktor (DigitalApplied, 2026). Managed Agents fjerner infrastrukturproblemet. Det fjerner ikke arkitekturproblemet. Her er, hvad der ændrer sig.

Byg-eller-køb-beslutningen er blevet skarpere

Hvis du bygger rene Claude-workflows, eliminerer Managed Agents den runtime, du ellers selv skulle vedligeholde. Men det er kun til Claude. Hvis din stack inkluderer GPT-5, Gemini eller en anden model, bliver du på Messages API. Det er vendor lock-in-overvejelsen, der er værd at vurdere i dette kvartal — ikke afvise.

Opgaver med lang tidshorisont er nu en førsteklasses primitiv

Vi har set, at event-triggerede, planlagte, fire-and-forget- og langkørende mønstre er understøttet fra starten. Med METR's fordoblingstrend bliver dagens "10-timers opgave" til en "ugelang opgave" i 2027. Managed Agents er designet til den bane.

Observerbarhed er stadig dit ansvar

Vores erfaring med agent-workflows viser, at de sværeste problemer ikke ligger i modelkaldet. De ligger i at spore tilstand på tværs af sessioner, tracke omkostninger pr. opgave og forstå, hvorfor en agent valgte vej A frem for vej B. Managed Agents giver et session event log og SSE streaming. Men agentspecifikke traces, omkostningssporing og tilstandsobserverbarhed er stadig dit ansvar. Det, de fleste anmeldelser overser: at overdrage Anthropic din harness er ikke det samme som at overdrage Anthropic din trusselsmodel.

Hvad skal du gøre nu?

Her er tre trin ordnet efter vigtighed, plus to ting du skal undgå.

  1. I dag: Opdater Claude Code ($ claude update) og kør /claude-api managed-agents-onboarding. Den open source-skill virker direkte ud af boksen.
  2. I denne uge: Gennemgå din nuværende harness for forældede antagelser: tool-skemaer bygget til tidligere Claude-versioner, konteksthåndtering uden støtte til 10-timers sessioner, credentials der lever inde i sandboxen.
  3. I dette kvartal: Tag byg-eller-køb-beslutningen. Greenfield-opgaver med lang tidshorisont peger mod Managed Agents. Skræddersyet orkestrering, krav om flere modeller eller regulerede brancher peger mod Messages API.

Lad VÆRE med at:

  • Migrere produktionsharnesses til Managed Agents i dag. Det er stadig public beta, og adfærd kan ændre sig.
  • Antage, at Managed Agents fjerner behovet for at tænke over trusselsmodeller, kontrakter og observerbarhed. De ti ingeniørprincipper fra produktionsagentlitteraturen gælder stadig.

Det store billede

Claudes tidshorisont for opgaver fordobles hver 4,3 måned (METR, 2026). Ekstrapolér fem år, og AI-agenter håndterer opgaver, der i dag tager mennesker en måned. Managed Agents er ikke en bekvemmelighedsfeature. Det er infrastruktur designet til den fremtid.

Arkitekturbeslutningen om at afkoble hjerne, hænder og session er det samme greb, der gjorde containere udskiftelige i Kubernetes. Det signalerer, at Anthropic bygger til årtiet — ikke til sprinten. Danmark har den højeste AI-adoption i EU med 42 % af virksomhederne mod et EU-gennemsnit på ca. 25 % (Digitaliseringsministeriet via Eurostat, 2026). Danske virksomheder, der bygger på Claude, er præcis det publikum, for hvem denne byg-eller-køb-beslutning har umiddelbar forretningsværdi — især med EU AI Acts compliance-lag, der lander i august 2026.

Spørgsmålet for 2026 er ikke, hvilken model. Det er, hvilken harness-arkitektur. Managed Agents er Anthropics svar.

Ofte stillede spørgsmål

Er Claude Managed Agents det samme som Claude Agent SDK?

Nej. Agent SDK var første skridt: en generel harness, du kører på din egen infrastruktur. Managed Agents er andet skridt. Anthropic kører harness og infrastruktur for dig. Du definerer agentens config (model, tools, skills, MCP servers); Anthropic håndterer eksekvering, sandboxing og pålidelighed ved lange tidshorisonter (Anthropic Docs, 2026).

Kan jeg bruge Claude Managed Agents med andre modeller end Claude?

Nej. Managed Agents er kun til Claude. Hvis du har brug for GPT-5, Gemini eller en anden model i dit agent-workflow, skal du bruge Messages API eller bygge din egen harness. Det er den primære vendor lock-in-overvejelse. Strategier med flere modeller kræver, at du bliver på API'et.

Hvad koster Claude Managed Agents?

Standard Claude token-priser gælder for modelinferens plus 0,08 USD pr. session-time for aktiv agent-runtime (Anthropic Docs, 2026). Der er ingen fast pris. Omkostningerne skalerer med forbrug. En 10-timers opgave på p50-niveau koster 0,80 USD i runtime-overhead plus inferenstokens.

Kilder


C

Christian Vinther Daugaard

Forfatter