GLN-7.5

AI-nyheter og innsikt

GLN-7.5

AI-nyheter og innsikt

Tilbake til artikler

Innsiden av Claude Code: Fra tilfeldig CLI til AI-verktøy

26. februar 2026·13 min lesing·2,524 ord

AIClaude CodeUtviklerverktøyProgramvareutviklingVideooppsummering

Boris Cherny diskuterer skapelsen og utviklingen av Claude Code på Y Combinators Lightcone-podkast — Bilde: Skjermbilde fra YouTube.

Nøkkelinnsikt

Claude Code startet som et enkelt terminaleksperiment for å lære Anthropic-APIet — det var aldri ment å bli et produkt
Anthropics designprinsipp er å bygge for modellen seks måneder frem i tid, ikke modellen av i dag
Ingeniørproduktiviteten hos Anthropic skal ha vokst 150 % siden Claude Code ble lansert, målt i pull requests per ingeniør

Publisert 17. februar 2026

Y Combinator / Lightcone

Vertskap:Jared Friedman, Harj Taggar og Diana Hu

Gjest:Boris Cherny (Skaperen av Claude Code, Anthropic)

Les denne artikkelen på English

Kort fortalt

Boris Cherny, skaperen av Claude Code, gjester Y Combinators Lightcone-podkast for å fortelle om verktøyets reise fra et enkelt terminaleksperiment til et produkt som angivelig står bak 4 % av alle offentlige kode-commits (lagrede kodeendringer) globalt. Samtalen dekker hvordan Anthropic bygger for hva modellene kan i fremtiden i stedet for nå, hvorfor terminalformatet overlevde mot alle forventninger, og hvordan ingeniøryrket ser ut når koding i seg selv blir «generelt løst».

150 %

produktivitetsvekst per ingeniør hos Anthropic

4 %

av alle offentlige commits gjort av Claude Code

100 %

av Chernys kode skrevet av Claude siden Opus 4.5

Den tilfeldige opprinnelseshistorien

Claude Code var ikke planlagt. Cherny forklarer at han begynte i Anthropics labs-team, det samme teamet som produserte Claude Code, MCP (Model Context Protocol, en standard for å koble AI-modeller til eksterne verktøy) og desktop-appen, med et vagt mandat om å utforske kodeprodukter (3:02). Ingen ba ham bygge et kommandolinjeverktøy (CLI). Han bygde det rett og slett fordi det var den billigste måten å lære Anthropic-APIet (API, Application Programming Interface, altså måten programmer snakker med en tjeneste på) uten å måtte designe et brukergrensesnitt (4:27).

Gjennombruddet kom da tool use (verktøybruk, altså muligheten for AI-modellen til å kalle på eksterne verktøy) ble lansert. Cherny ga modellen et bash-verktøy, bokstavelig talt eksempelet fra Anthropics dokumentasjon portert fra Python til TypeScript, og spurte hvilken musikk han hørte på. Modellen skrev AppleScript for å spørre Mac-ens musikkspiller og returnerte svaret (5:09).

Dette var Sonnet 3.5, og Cherny beskriver det som sitt første «kjenn kunstig generell intelligens (AGI)»-øyeblikk: modellen ville rett og slett bruke verktøy. Den erkjennelsen formet alt som fulgte.

To dager etter den første prototypen begynte Cherny å dele den med teamet for dogfooding (å bruke sitt eget produkt internt før lansering). Neste morgen brukte allerede en annen ingeniør det til å skrive kode, til tross for at Cherny insisterte på at det ikke var klart (6:13). Da Dario Amodei så den vertikale interne adopsjonsgrafen under lanseringsgjennomgangen, skal han ha spurt om ingeniørene ble tvunget til å bruke det. Det ble de ikke — det hadde spredd seg utelukkende via jungeltelegrafen (6:50).

Hvorfor terminalen overlevde

Cherny innrømmer at han for et år siden ville ha spådd at terminalen hadde tre måneders levetid før noe mer sofistikert tok over (30:17). Han tok feil. Terminalen vedvarer på grunn av et dypere designprinsipp: ethvert brukergrensesnitt teamet kunne bygge ville bli irrelevant innen seks måneder etter hvert som modellene ble bedre (8:41).

Det betyr ikke at Anthropic sluttet å eksperimentere. Claude Code kjører nå på web, i desktop-appen, på iOS og Android, i Slack, i GitHub, og gjennom VS Code- og JetBrains-utvidelser. Men terminalen forblir kjerneflaten.

Å designe for den er vanskeligere enn det ser ut. Cherny beskriver begrensningene: omtrent 80 ganger 100 tegn, 256 farger, én skriftstørrelse, ingen musinteraksjoner (35:37). Terminalspinneren alene gikk gjennom anslagsvis 50 til 100 iterasjoner, der rundt 80 % aldri ble lansert (36:50).

Teamet prototypet musinteraksjoner i terminalen og droppet det fordi virtualisert scrolling skapte avveininger som føltes verre enn begrensningen den skulle løse (35:56). Den underliggende teknologien er fortsatt bygget på escape-koder (spesialtegn som styrer hvordan tekst vises på skjermen) fra spesifikasjoner som daterer tilbake til 1960-tallet.

Bygg for modellen seks måneder fra nå

Dette er Chernys sentrale prinsipp, gjentatt gjennom hele samtalen. Hos Anthropic bygger teamet eksplisitt ikke for hva modellen kan i dag. De bygger for hvor modellen vil være om seks måneder (2:21).

Den praktiske konsekvensen: bruker du ingeniørtid på å bygge stillas (scaffolding, midlertidig hjelpekode som kompenserer for modellens nåværende begrensninger) for å utvide nåværende modellytelse med 10–20 % i et domene, gjør neste modellversjon typisk det stillaset overflødig (8:17). Cherny rammer det inn som en konstant avveining: investere ingeniørarbeid nå for små forbedringer, eller vente et par måneder og få forbedringen gratis fra modellen selv.

Han nevner et innrammet eksemplar av Rich Suttons «The Bitter Lesson» som henger i Claude Code-teamets arbeidsområde. Kjernebudskapet: aldri sats mot modellen (38:22).

Claude Code-kodebasen gjenspeiler denne filosofien. Hver del av den er blitt omskrevet. Verktøy legges til og fjernes annenhver uke. Cherny estimerer at ingen kode i nåværende kodebase eksisterte for seks måneder siden (39:37).

Latent etterspørsel: produktfilosofien bak hver funksjon

Cherny kaller «latent etterspørsel» den viktigste ideen i sin produkttenkning. Konseptet: du kan ikke få folk til å gjøre noe nytt. Du kan bare gjøre det enklere å gjøre noe de allerede prøver på (28:55).

Plan mode er det tydeligste eksempelet. Teamet observerte at brukere ba Claude tenke gjennom ideer uten å skrive kode ennå, noen ganger via nettleserchatten, noen ganger gjennom detaljerte prompts i Claude Code. Fellesnevneren var «gjør en ting uten å kode ennå». Cherny bygde plan mode på 30 minutter en søndagskveld og lanserte det mandag morgen (26:17).

CLAUDE.md fulgte samme mønster. Ingeniører hadde allerede begynt å skrive markdown-filer (enkle tekstfiler med grunnleggende formatering) med prosjektinstruksjoner og la modellen lese dem. Teamet formaliserte det brukerne allerede gjorde (7:51).

Verbose mode gikk gjennom en avslørende iterasjonssyklus. Cherny prøvde å skjule fillesingsutdata for å redusere støy. Interne brukere gjorde opprør i løpet av én dag. Han gjenopprettet det, deretter lanserte en forkortet versjon eksternt. GitHub-brukere protesterte. Teamet la til en verbose-bryter, postet oppdateringen på saken, og folk var fortsatt ikke fornøyde, så de fortsatte å iterere (12:07).

Hva som faktisk står i Boris Chernys CLAUDE.md

Gitt at Cherny skapte funksjonen, er hans egen CLAUDE.md overraskende kort: to linjer (9:04).

Aktiver automerge på PRer (pull requests, altså forslag til kodeendringer), slik at godkjente PRer slås sammen umiddelbart uten manuell oppfølging.
Post PRer til teamets Stamps-kanal, slik at noen kan vurdere og avblokkere ham raskt.

Alt annet lever i teamets delte CLAUDE.md, innsjekket i kodebasen, og bidragsytt av flere teammedlemmer flere ganger i uken. Når en unngåelig feil dukker opp i en PR, tagger Cherny Claude direkte på PRen og ber den legge til fiksen i CLAUDE.md (9:40).

Hans anbefaling til alle med en CLAUDE.md som har blitt for stor: slett den og start på nytt. Modellens kapabiliteter endres med hver utgivelse, så instruksjonene bør være det minimale som trengs for å holde modellen på sporet, ikke en uttømmende manual (10:08).

Sub-agenter, team og fremtiden for agent-topologier

Samtalen avslører at flertallet av Claude Code-agenter i dag angivelig ikke lanseres av mennesker, men av andre Claude Code-instanser, «mama Claude» som oppretter sub-agenter for parallelt arbeid (23:37).

Cherny beskriver konseptet «ukorrelerte kontekstvinduer» (context windows, altså teksten en modell kan «se» om gangen): flere agenter med frisk kontekst som ikke er forurenset av hverandres eller sitt eget tidligere arbeid. Mer kontekst kastet på et problem fungerer som en form for test-time compute (ekstra regnekraft brukt når modellen tenker seg gjennom et problem), og riktig topologi på toppen gjør at agenter kan bygge større ting (22:03). Disse flerstegs agent-løkkene er også der prompt caching blir kritisk — hvert agentsteg gjenbruker mesteparten av forrige kontekst, noe som gjør caching (gjenbruk av tidligere behandlet data) til en naturlig optimalisering for kostnad og ventetid.

Det første store interne beviset: Claude Codes plugins-funksjon ble bygget helt og holdent av en sverm av agenter over en helg. En ingeniør ga Claude en spesifikasjon og sa at den skulle bruke et Asana-board. Claude opprettet oppgaver, startet agenter, og de plukket opp oppgaver autonomt. Den lanserte funksjonen var stort sett uendret fra det svermen produserte (22:52).

Interne arbeidsflyter strekker seg nå utover kode. Chernys Claude sender rutinemessig meldinger til andre ingeniører på Slack for å stille avklarende spørsmål etter å ha sett navnet deres i en git blame (en kommando som viser hvem som sist endret hver kodelinje). Den prøver av og til å legge ut innlegg på hans vegne, selv om han vanligvis sletter dem fordi tonen føles feil (28:08).

Plan modes begrensede levetid

Cherny beskriver seg selv som en ivrig plan mode-bruker: rundt 80 % av øktene hans starter i plan mode. Han åpner flere terminalfaner, starter planer i hver, og bytter deretter til desktop-appens kodefane for å åpne flere (27:03). Når en plan er solid, ber han Claude utføre den, og med Opus 4.5 og senere holder modellen seg angivelig på sporet nesten hver gang.

For seks måneder siden måtte man passe på både før og etter planen. Nå passer man bare på før. Neste steg, antyder Cherny, er at pasningen forsvinner helt. Du gir en prompt og Claude finner riktig plan autonomt (27:42).

Da han ble spurt direkte om plan modes fremtid, er Chernys svar kontant: «Kanskje om en måned» (25:03). Under panseret er plan mode en enkelt setning lagt til i prompten: «vennligst ikke kod». Det er alt det er (25:41).

Ansettelser og det nye ingeniørkompetansesettet

Cherny ser etter to profiler i teamet sitt: ekstreme spesialister og hyper-generalister (18:56).

Spesialistene, som Jared Sumner fra Bun-teamet, har dyp domenekunnskap i JavaScript-runtimes, utviklerverktøy og ytelse. Generalistene spenner over produkt, design, brukerundersøkelser og forretning. Alle på Claude Code-teamet koder, uavhengig av tittel: PMer (Product Managers), designere, engineering manageren, til og med teammedlemmet fra finans (45:22).

Den viktigste egenskapen Cherny siler for er evnen til å gjenkjenne og ta eierskap over egne feil. Han bruker intervjuspørsmålet: «Hva er et eksempel på når du tok feil?» Kandidaten som kan beskrive en feil, ta ansvar og artikulere hva de lærte, signaliserer den førstehåndstenkingen som betyr mest (16:44).

Han deler et avslørende eksempel på utradisjonell ingeniørkunst: en ingeniør ved navn Daisy overførte seg til teamet fordi hun, i stedet for å bare legge til en ny funksjon i Claude Code, først bygde et verktøy som lar Claude teste vilkårlige verktøy og verifisere at de fungerer, og deretter lot Claude skrive selve funksjonen ved hjelp av det verktøyet (19:51).

Produktivitetstallene

Cherny rapporterer at siden Claude Code ble lansert, har produktiviteten per ingeniør hos Anthropic vokst 150 %, målt i pull requests og krysssjekket mot commit-volum og levetid (41:00).

For kontekst refererer han til sin tidligere rolle hos Meta, der han var ansvarlig for kodekvalitet på tvers av alle produkter (Facebook, Instagram, WhatsApp). En 2 % gevinst i produktivitet representerte omtrent ett års arbeid av hundrevis av mennesker. 150 %-tallet er, med hans ord, «fullstendig uhørt» (41:24).

Cherny selv lander angivelig rundt 20 PRer per dag. Han har avinstallert IDEen (Integrated Development Environment, programmet utviklere vanligvis skriver kode i) sin helt. Siden Opus 4.5 er 100 % av koden hans skrevet av Claude Code (43:56). På tvers av Anthropic varierer tallet mellom 70–90 % avhengig av team, med mange individuelle ingeniører også på 100 %.

Han siterer en ekstern statistikk fra Semi Analysis: omtrent 4 % av alle offentlige commits gjøres nå av Claude Code (47:19), og en Mercury-rapport som sier at 70 % av oppstartsbedrifter velger Claude som sin foretrukne modell.

Co-work: Claude Code for ikke-tekniske brukere

Co-work, Claude Codes grafiske brukergrensesnitt (GUI) i desktop-appen, oppsto fra det samme prinsippet om latent etterspørsel. Internt gikk designere, finansteamet og dataforskere gjennom mye styr for å installere et terminalverktøy slik at de kunne bruke Claude Code til ikke-kodeoppgaver (48:28).

Eksternt brukte folk det til å overvåke tomatplanter, gjenopprette bryllupsbilder fra ødelagte harddisker og gjøre finansarbeid.

Løsningen var en lett GUI-visning bygget på den samme agenten under panseret. Felix, en tidlig bidragsyter til Electron (et rammeverk for å bygge desktop-apper med nettteknologi), ledet byggingen, angivelig fullført på omtrent 10 dager, 100 % skrevet av Claude Code (49:04). Det ekstra arbeidet var sikkerhetslag for ikke-tekniske brukere: en virtuell maskin (virtual machine, et isolert datamiljø som hindrer kode i å påvirke det virkelige systemet) for kodekjøring, slettebeskyttelse og tillatelsesforespørsler.

Hvordan koding ser ut når det er «løst»

Cherny trekker det eksponentielle fremover. Han refererer til Dario Amodeis spådom seks måneder tidligere om at 90 % av Anthropics kode ville skrives av Claude — noe som angivelig ble virkelighet (43:45).

Minimumsspådommen: tittelen «programvareingeniør» begynner å forsvinne. Ingeniører blir byggere, produktledere eller generalister som skriver spesifikasjoner, snakker med brukere og delegerer den tekniske gjennomføringen til AI. Alle funksjoner koder — det er ikke reservert for ingeniørteam lenger (45:01).

Maksimumsspådommen er skumlere. Cherny nevner ASL-4 (Anthropics sikkerhetsklassifisering for rekursivt selvforbedrende modeller) og risikoen for katastrofalt misbruk innen biovåpen eller zero-day-angrep (angrep som utnytter sikkerhetshull ingen har oppdaget ennå). Han rammer dette inn som grunnen til at Anthropics misjonsdrevne kultur betyr noe: sikkerhetssamtaler skjer i gangene og lunsjrommene, ikke bare i policydokumenter (45:40). Denne sikkerhetskulturen står nå i sentrum av en reell test: Anthropics nekting av å gi Pentagon ubegrenset tilgang til Claude førte til et føderalt forbud mot selskapets teknologi.

Hva samtalen avslører om å bygge AI-native produkter

Flere prinsipper dukker opp gjentatte ganger i episoden, og de gjelder utover Claude Code.

Observer før du bygger. Alle store Claude Code-funksjoner kom fra å observere hva brukere allerede gjorde og formalisere det. Plan mode, CLAUDE.md, verbose-brytere, co-work — alle fulgte brukerne i stedet for å lede dem.

Stillas er midlertidig. All produktkode som jobber rundt nåværende modellbegrensninger bør behandles som teknisk gjeld (tech debt, snarveier i koden som sparer tid nå men må fikses senere) fra dag én. Den vil bli erstattet av modellforbedringer raskere enn de fleste team forventer.

Prototypehastighet endrer produktkvalitet. Evnen til å generere 20 designprototyper på et par timer, i stedet for 3 prototyper på to uker, endrer fundamentalt hva «godt nok til å lansere» betyr.

Kodens holdbarhet krymper. Hvis hele Claude Code-kodebasen byttes ut hvert par måneder, må tradisjonelle antakelser om kodelevetid, dokumentasjonsinvestering og arkitekturplanlegging revurderes.

Agent-som-kollega-modellen er allerede operativ internt. Claude Code-agenter hos Anthropic skriver ikke bare kode. De sender meldinger til kolleger, oppretter oppgaver, administrerer vurderingsarbeidsflyter og følger endringer til produksjon. Dette er ikke en demo; det er slik produktteamet opererer daglig.

Ordliste

Begrep	Forklaring
ASL-4	Anthropics høye sikkerhetsnivå for svært kraftige modeller. Kort sagt: disse modellene krever ekstra strenge sikkerhetstiltak før lansering.
Bitter Lesson	En kjent idé i AI: mer data og mer regnekraft slår ofte smarte spesialløsninger over tid.
CLAUDE.md	En enkel tekstfil med regler for prosjektet ditt. Claude Code leser den først for å jobbe mer riktig.
Co-work	En enklere app-visning av Claude Code for folk som ikke vil bruke terminal. Den har også ekstra sikkerhet for vanlige brukere.
Dogfooding	Når et team bruker sitt eget produkt selv før lansering, for å finne feil tidlig og se hva som faktisk fungerer.
Latent etterspørsel	Noe brukere allerede prøver å få til, men på en tungvint måte. Godt produktarbeid gjør akkurat dette enklere.
MCP (Model Context Protocol)	En felles "kontaktstandard" som lar AI koble seg til verktøy og data på en trygg og lik måte.
Plan mode	En modus der Claude planlegger først og koder etterpå. Dette gir ofte færre feil og bedre struktur.
Stillas (scaffolding)	Midlertidig hjelpekode du legger rundt modellen for å få den til å prestere bedre akkurat nå. Den blir ofte unødvendig etter neste modelloppgradering.
Sub-agent	En "hjelpeagent" som hovedagenten starter for en deloppgave. Flere slike kan jobbe parallelt.
Test-time compute	Ekstra regnekraft brukt mens modellen svarer, for å øke kvaliteten. For eksempel: mer kontekst eller flere agenter på samme problem.
Ukorrelerte kontekstvinduer	Når flere agenter jobber hver for seg med "rene" kontekster. Det gir flere ulike løsningsforslag før du velger det beste.

Kilder og ressurser

Vil du vite mer? Se hele videoen på YouTube →