90 000 bidrag, én utvikler: Historien bak OpenClaw

Nøkkelinnsikt
- Steinberger bygde OpenClaw i praksis alene med AI-agenter, noe han beskriver som umulig for en enkelt person før AI-kodeverktøy
- Han advarer mot 'den agentiske fellen': å bruke tid på å optimalisere AI-oppsettet i stedet for å faktisk bygge ting
- Pull requests er i ferd med å bli 'prompt requests' der intensjonen betyr mer enn selve koden
Denne artikkelen oppsummerer Builders Unscripted: Ep. 1 - Peter Steinberger, Creator of OpenClaw. Se videoen →
Les denne artikkelen på English
Kort fortalt
Peter Steinberger, en østerriksk utvikler som drev selskapet PSPDFKit i 13 år, brant ut, tok en pause og oppdaget AI-kodeverktøy. I løpet av ett år bidro han til over 120 prosjekter med AI-agenter, inkludert OpenClaw, en personlig AI-agent som startet som en WhatsApp-bot og vokste til et viralt åpen kildekode-prosjekt omtalt i Wall Street Journal. I denne samtalen med Romain Huet hos OpenAI deler Steinberger arbeidsflyten sin, advarer mot vanlige feller, og forklarer hvorfor kodegjennomgang er i ferd med å endre seg grunnleggende. Ifølge videobeskrivelsen var Steinberger i ferd med å begynne hos OpenAI da denne samtalen ble spilt inn.
Fra utbrenthet til skaperglede
Steinberger startet PSPDFKit, et rammeverk for PDF-visning, i 2011. Han drev selskapet i 13 år, solgte det, og brant ut (4:24). Han fulgte med på teknyheter etter pausen, men de tidlige versjonene av ChatGPT og lignende verktøy klarte ikke å engasjere ham. Steinberger beskriver det slik: du må faktisk prøve ny teknologi selv for å forstå kraften i den (5:00).
Da han var klar til å bygge igjen, ønsket han å skifte felt bort fra Apple-teknologi. Overgangen var smertefull. Han hadde bred erfaring med å lage programvare, men uten agentbasert utvikling (agentic engineering, der AI-modeller utfører oppgaver selvstendig) måtte han fortsatt lære mye nytt (5:34).
Vendepunktet kom da han tok et halvferdig prosjekt, lagde én stor Markdown-fil (et enkelt tekstformat med grunnleggende formatering) med all kildekoden, dro den inn i Gemini Studio (Googles AI-verktøy), og ba om en spesifikasjon (en skriftlig beskrivelse av hva programmet skal gjøre). Den spesifikasjonen dro han inn i Claude Code (Anthropics AI-kodeverktøy) og skrev «build» (6:50). Resultatet var fullt av feil, men da han koblet på Playwright (et testverktøy for nettlesere) og ba modellen fikse innloggingen, fungerte det en time senere. Det var øyeblikket som gjorde at han ikke klarte å sove, forteller han, fordi hodet ble fylt av alle tingene han alltid hadde ønsket å bygge (7:44).
Slik gikk OpenClaw fra lekeplass til fenomen
OpenClaw begynte ikke som et planlagt produkt. Steinberger ønsket en personlig AI-agent som kunne se på WhatsApp-meldingene hans og gjøre ting for ham. Han bygde en prototype, men la den til side fordi han regnet med at de store AI-selskapene ville lage noe tilsvarende (9:06).
Da ingen andre bygde det han ønsket, satte han seg ned i november og lagde den første versjonen som ble OpenClaw på omtrent en time (9:42). Prosjektet klarte det som sjelden skjer: vennene hans ville ha det med en gang, selv om det ikke var laget for dem (10:34).
For å vise folk hva verktøyet kunne, opprettet Steinberger en Discord-kanal (en gruppesamtale-plattform) og la boten sin rett inn, uten noen form for sikkerhet. Han bygde OpenClaw med OpenClaw, rett foran fellesskapet (14:16). Prosjektet spredte seg videre derfra. Wall Street Journal omtalte det (0:32). Fellesskapet arrangerte ClawCon i San Francisco med rundt 1 000 deltakere (1:20), og et treff i Wien hadde allerede 300 påmeldte (1:46).
Talemeldingen som beviste at AI kan løse problemer
En av de mest avslørende anekdotene i samtalen handler om en talemelding. Steinberger brukte OpenClaw via WhatsApp daglig, og sendte på et tidspunkt en talemelding. Han forventet ikke at det skulle fungere, fordi han aldri hadde programmert støtte for lyd (10:52).
Men modellen svarte. Da han spurte hvordan, forklarte den hvert steg den hadde tatt: filen fra WhatsApp hadde ingen filendelse, så modellen undersøkte filhodet (de første bytene som forteller hva slags fil det er) og fant at det var Opus (et lydformat). Den brukte FFmpeg (et verktøy for å gjøre om lyd og video) til å gjøre filen om. Deretter trengte den å transkribere lyden, men hadde ikke Whisper (en talegjenkjenningsmodell) installert. Så den fant en OpenAI-nøkkel i miljøvariablene, brukte cURL (et kommandolinjeverktøy for å sende nettverksforespørsler) til å sende filen til OpenAIs API (Application Programming Interface, altså måten programmer snakker med en tjeneste på), og fikk teksten tilbake (11:00).
Steinberger understreker at nøkkelen var plassert i miljøet med vilje, nettopp for at agenten skulle kunne bruke den. Ifølge ham viser dette noe viktigere enn kodeferdighetene til modellen: den er god til å løse problemer generelt (11:04).
90 000 bidrag og null team
Huet påpeker at Steinbergers GitHub-profil viser 90 000 bidrag (contributions) på tvers av over 120 prosjekter det siste året (18:22). Rundt halvparten av disse prosjektene er brukt i OpenClaw (8:16).
Det som er spesielt med grafen, ifølge Huet, er at den starter hvit og lysegrønn tidlig på året, men blir mørkegrønn rundt oktober og november. Forklaringen, sier Steinberger, er at han byttet til Codex (OpenAIs kodeverktøy) (18:43). Han startet med Claude Code (2:59), men gikk over til Codex da verktøyet ble kraftig nok.
Steinberger understreker at dette ikke ville vært mulig for noe enkeltmenneske uten AI-verktøy. Han har noen vedlikeholdere nå, og mottar pull requests (PR-er, altså forslag til kodeendringer), men i bunn og grunn bygde han prosjektet alene (17:52).
Folk som kontakter ham spør etter hans administrerende direktør eller HR-avdeling. Svaret hans: det finnes ingen. Det er bare ham som koder fra hjemmekontoret (17:33).
«Den agentiske fellen» og hvordan unngå den
Steinberger har et navn for en vanlig feil blant utviklere som begynner med AI-verktøy: «den agentiske fellen» (the agentic trap) (20:06). Det handler om å bruke tid på å optimalisere oppsettet i stedet for å faktisk bygge ting. Det føles produktivt, men det gjør deg ikke mer produktiv, ifølge ham.
Hans egen metode er overraskende enkel. Han bruker ikke worktrees (en Git-funksjon for parallelle arbeidskopier). I stedet har han rett og slett ti ulike utsjekkinger av koden og fokuserer på forskjellige problemer i hver (21:33).
Det viktigste rådet hans er å snakke med modellen som en samtale. Ikke som parprogrammering, men som en dialog der du forklarer hva du ønsker og alltid spør: «Har du noen spørsmål?» (20:37). Ifølge Steinberger gjør modellen ofte antagelser som ikke stemmer, fordi den er trent på mye gammel kode og starter hver økt uten noen forhistorie. Ved å be den stille spørsmål først, unngår du at den tar feil avgjørelser tidlig.
Han sammenligner det å lære agentbasert koding med å lære gitar: du er ikke god første dagen, og folk som prøver én gang og gir opp, går glipp av noe verdifullt (19:12). Steinberger kaller begrepet «vibe coding» for et skjellsord, og mener det undervurderer ferdighetene som kreves (19:05).
Når pull requests blir prompt requests
OpenClaw har rundt 2 000 åpne PR-er (23:49). Steinberger beskriver en grunnleggende endring i hvordan kodegjennomgang fungerer. Tidligere leste man PR-en fordi det var verdi i selve koden som var skrevet. Nå kaller han dem «prompt requests», fordi det er intensjonen bak forslaget som betyr mest, ikke koden i seg selv (24:04).
I praksis gjør han det slik: han ber modellen forstå intensjonen bak PR-en. Er dette den beste løsningen? Oftest sier modellen nei. Da utforsker han om det er et arkitekturproblem, om feilen gjelder flere plattformer enn bare WhatsApp, og om de i det hele tatt ønsker denne funksjonen (25:22). Disse samtalene med modellen tar gjerne 10-15 minutter, ofte via tale fordi det er lettere å gi sammenheng muntlig (25:52).
Mange bidragsytere har sendt sin aller første PR til OpenClaw, nettopp fordi agenten sitter i kildekoden og kan endre seg selv. Det gjør terskelen lavere, men det betyr også at mange PR-er mangler forståelse for helheten i systemet (24:51).
Sikkerhet, åpen kildekode og voksesmerter
OpenClaw fikk tidlig oppmerksomhet fra sikkerhetsmiljøet. Prosjektet fikk en CVSS-score på 10.0 (høyeste mulige alvorlighetsvurdering for en sikkerhetssvakhet) fra forskere (28:37). Problemet var at en innebygd webserver, opprinnelig ment for feilsøking i lokale nettverk, kunne gjøres tilgjengelig på det åpne internett. Steinberger påpeker at han eksplisitt advarte mot dette i dokumentasjonen, men brukere ignorerte advarselen (28:16).
Steinberger har nå hentet inn en sikkerhetsekspert som jobber med prosjektet (28:47). Fokuset er å hindre folk i å skade seg selv, uansett hvordan de bruker verktøyet.
Agenten har også en fil kalt «mysoul.md» som definerer Steinbergers verdier og personlighet for AI-en. Denne filen holder han hemmelig (15:00). Da han satte boten i en offentlig Discord-kanal, prøvde folk å lure den med prompt injection (en teknikk der noen forsøker å overstyre AI-ens instruksjoner). Modellen nektet å samarbeide og lo av forsøkene, ifølge Steinberger (15:16).
Han innrømmer likevel at han hadde en skummel opplevelse: etter å ha slått av boten og gått og lagt seg, hadde han glemt at en LaunchDaemon (en macOS-tjeneste som automatisk restarter programmer) startet den igjen. Da han våknet, hadde den svart på 800 meldinger på egen hånd (15:32). Heldigvis hadde den ikke gjort noe skadelig.
Et annet eksempel på ressurssterk AI: da Steinberger satte agenten i en tom Docker-kontainer (et isolert miljø for å kjøre programmer) og ba den besøke en nettside, fantes det ikke engang cURL (et nedlastingsverktøy). Modellen bygde sin egen versjon av cURL fra C-kode ved hjelp av en kompilator (et verktøy som gjør programkode om til kjørbar programvare) som lå i kontaineren (16:55). Det fungerte.
Steinberger kaller Mac Studio-en sin for «The Castle» (16:33), og agenten er ifølge ham stolt av å bo der.
Hvordan tolke disse påstandene
Samtalen er inspirerende, men flere av påstandene fortjener nyanser.
Overlevelsesfordel
Steinberger er en svært erfaren utvikler med 13 års erfaring fra å lede et selskap. Historien hans viser hva som er mulig med AI-verktøy, men den gjelder ikke for de fleste utviklere. Folk uten hans brede tekniske grunnlag vil sannsynligvis ikke oppnå samme resultater bare ved å kopiere oppsettet hans.
Kodekvalitet er ukjent
90 000 bidrag er et imponerende tall, men det sier lite om kvaliteten. Steinberger innrømmer selv at han sender kode han ikke leser (22:39), og at mange PR-er mangler forståelse for systemets helhet. For et prosjekt som gir AI-agenter full datatilgang, er dette en vesentlig usikkerhetsfaktor.
Prosjektet er fortsatt tidlig
OpenClaw fikk CVSS 10.0 fra sikkerhetsforskere og har 2 000 åpne PR-er. Steinberger jobber aktivt med sikkerhet og har hentet inn ekspertise, men prosjektet gikk fra personlig lekeplass til offentlig verktøy på svært kort tid. Visjonen om at «mamma kan installere det» (26:55) er foreløpig langt fra virkeligheten.
Hva ville styrket påstandene
Uavhengige tester av kodekvalitet over tid, brukertall som viser at folk faktisk blir, og sikkerhetsrevisjoner fra tredjeparter ville gjort påstandene mer overbevisende. Foreløpig bygger det meste på Steinbergers egne beskrivelser.
Praktiske konsekvenser
For utviklere som starter med AI-verktøy
Steinbergers hovedråd er å nærme seg det lekent: bygg noe du alltid har ønsket å lage (30:12). Unngå den agentiske fellen der du bruker mer tid på oppsettet enn på selve byggingen. Snakk med modellen som en kollega og spør alltid: «Har du noen spørsmål?»
For de som vedlikeholder åpen kildekode
2 000 åpne PR-er viser at tradisjonell kodegjennomgang ikke strekker til i en verden der bidragsytere bruker AI. Steinbergers metode med å vurdere intensjonen bak en PR i stedet for koden kan bli relevant for mange prosjekter fremover.
For erfarne utviklere
Steinberger siterer Jensen Huang (lederen av Nvidia): du kommer ikke til å bli erstattet av AI, men av noen som bruker AI (30:31). Hans erfaring tyder på at ferdighetene i å styre AI-agenter er noe som tar tid å bygge opp, og at de som avskriver det som «vibe coding» kan gå glipp av et viktig skifte.
Ordliste
| Begrep | Forklaring |
|---|---|
| Agentbasert utvikling (agentic engineering) | En arbeidsmetode der AI-modeller utfører oppgaver selvstendig, ikke bare foreslår kode. Du gir agenten et mål, og den finner veien selv. |
| API (Application Programming Interface) | En måte for programmer å snakke med hverandre. Når OpenClaw-agenten brukte OpenAIs API, sendte den lydfilen til en tjeneste som returnerte tekst. |
| CVSS (Common Vulnerability Scoring System) | Et poengsystem for å rangere alvorligheten av sikkerhetssvakheter. 10.0 er høyeste mulige score. |
| cURL | Et kommandolinjeverktøy for å laste ned eller sende data over nettet. Brukes ofte til å snakke med API-er. |
| Docker-kontainer | Et isolert miljø for å kjøre programmer, som en slags virtuell boks der programmet tror det har en hel datamaskin for seg selv. |
| FFmpeg | Et verktøy for å gjøre om lyd- og videofiler mellom ulike formater. |
| LaunchDaemon | En macOS-tjeneste som sørger for at et program alltid kjører. Hvis programmet krasjer eller stoppes, starter den det automatisk igjen. |
| Prompt injection | En teknikk der noen forsøker å overstyre AI-ens instruksjoner ved å sende tekst som later som den er systemkommandoer. |
| Pull request (PR) | Et forslag til kodeendring i et åpen kildekode-prosjekt. Andre utviklere kan se over endringene før de godkjennes. |
| Whisper | En talegjenkjenningsmodell fra OpenAI som gjør tale om til tekst. |
Kilder og ressurser
Vil du vite mer? Se hele videoen på YouTube →