Fra	Til
Deterministisk (samme input gir alltid samme output)	Probabilistisk (basert på sannsynligheter, kan gi ulike svar)
Statisk (oppfører seg likt over tid)	Adaptivt (lærer og endrer seg basert på tilbakemeldinger)
Kode først (skriv oppskriften, sett opp løsningen)	Evaluering først (mål resultatene, se om de treffer målet)

Begrep	Forklaring
AI-agent	Et autonomt system som forstår sammenhengen, vurderer mål og tar handlinger gjennom verktøy. Tenk på det som en digital medarbeider som jobber selvstendig.
Angrepsflate (attack surface)	Alle punktene der en angriper kan forsøke å komme inn i systemet. Jo flere verktøy og tilkoblinger, jo større angrepsflate.
Angrepsforsterker (attack amplifier)	En overtatt agent som forsterker skaden fordi den handler på egen hånd og i maskinens tempo.
AI-brannmur / gateway	Et mellomledd som sitter mellom brukere og AI-modellen, og inspiserer trafikken for trusler som promptinjeksjon og datalekkasje.
DevSecOps	Utviklingsmetodikk der sikkerhet (Security) er integrert i hele livssyklusen, fra utvikling (Development) til drift (Operations).
Etterlevelsesdrift (compliance drift)	Når et system gradvis beveger seg bort fra gjeldende retningslinjer og regelverk over tid.
Konfigurasjonsdrift (configuration drift)	Når systeminnstillinger endrer seg uventet over tid, for eksempel fordi agenter modifiserer egne parametere.
LLM (Large Language Model)	Stor språkmodell. AI-modeller som GPT og Claude som forstår og lager tekst. De er hjernen i AI-agenter.
MCP (Model Context Protocol)	Protokollen som lar AI-agenter kommunisere med verktøy og tjenester. Utviklet av Anthropic.
Menneske i løkken (Human in the Loop)	Prinsippet om at et menneske skal ha tilsyn og mulighet til å gripe inn i agentens beslutninger.
Modelldrift (model drift)	Når en AI-modells oppførsel endrer seg over tid på uventede måter, for eksempel fordi den lærer av nye data.
Prinsippet om minste privilegium (Least Privilege)	Gi kun den tilgangen som trengs for oppgaven, og fjern den med en gang den ikke trengs lenger. Som å gi noen nøkkelen til ett rom i stedet for hele bygningen.
Promptinjeksjon (prompt injection)	Et angrep der noen injiserer kommandoer i systemet for å ta kontroll over AI-modellen utenfra. Den vanligste trusselen mot LLM-er.
RBAC (rollebasert tilgangsstyring)	Å tildele roller som styrer hva agenter og brukere kan gjøre. Akkurat som stillingsbeskrivelser på en arbeidsplass definerer hvem som har tilgang til hva.
Sandkasse (sandbox)	Et isolert miljø der agenten opererer. Hvis noe går galt, kan ikke skaden spre seg utenfor sandkassen.
Tidsbegrenset tilgang (just-in-time access)	Tilgang som gis kun når den trengs og fjernes etterpå. Kan vare minutter, timer eller dager.

Nøkkelinnsikt

Kort fortalt

Hva er en AI-agent?

Paradigmeskiftet: Fra kode til evaluering

Utviklingslivssyklusen for agenter

Planlegg

Kode

Test

Feilsøk

Distribuer

Overvåk

De syv sikkerhetstruslene

1. Utvidet angrepsflate

2. Overdreven tilgang

3. Privilegieeskalering

4. Datalekkasje

5. Promptinjeksjon

6. Angrepsforsterking

7. Etterlevelsesdrift

Systemkontroller og designprinsipper

Tre systemkontroller

Ni designprinsipper

Sikkerhetsrammeverket i praksis

1. Identitets- og tilgangsstyring

2. AI-brannmur for data og modell

3. Trusseldeteksjon

Sanntidsovervåking (reaktivt)

Trusseljakt (proaktivt)

Risikovurdering

4. Overvåking og drift

Sjekkliste: Vanlige feil ved sikring av AI-agenter

Praktiske implikasjoner

For nybegynnere

For team som bygger produksjonsagenter

For organisasjoner med regulatoriske krav

Test deg selv

Ordliste

Kilder og ressurser