5 OpenAI API‑begreber alle virksomhedsejere bør kende i 2025

Reasoning • Verbosity • Prompt Cache Key • Predicted Outputs • Service Tier


Bemærk (14. aug. 2025): Funktioner og parametre ændrer sig løbende. Verificér altid mod den nyeste OpenAI‑dokumentation, og test i Playground før produktion.

Indflyvning: Hvorfor dette lige nu?

AI er flyttet fra eksperiment til drift. Små justeringer i hastighed, pålidelighed og omkostninger kan flytte KPI’er som konvertering, NPS* og sagsbehandlingstid.

I dette overblik får du fem praktiske begreber fra OpenAI‑økosystemet – forklaret i let sprog, med forretningsbrug, mini‑eksempler og links, så du kan dykke dybere.

Ord markeret med * er forklaret i ordforklaringen nederst.


1) Reasoning (AI, der planlægger og løser)

Hvad er det? Reasoning er en kapacitet i de avancerede modeller (fx GPT‑5), som via prompting og relevante API‑parametre (fx en evt. reasoning_effort) kan løse flertrins‑opgaver: analysere input, planlægge handlinger og levere et begrundet resultat – mere som en dygtig kollega end en autocomplete.

Hvor giver det værdi?

Mini‑eksempel (prompt‑skabelon)

Mål: Kategorisér kundemail i {kategori} og foreslå svar.
Krav: Returnér JSON med felterne {kategori, begrundelse, svar_kladde}.
Begrænsninger: Følg toneguiden "venlig, præcis". Ingen rabatter uden godkendelse.
Test: Giv 1 eksempel som du er 60% sikker på og 1 du er 90% sikker på.

Den lidt tekniske vinkel

Dyk ned: Reasoning – guide · Prompting – bedste praksis

2) Verbosity (styr længden og detaljeniveauet)

Hvad er det? En officiel parameter i GPT‑5‑API’et, der kontrollerer hvor kort eller langt svaret er (typisk værdier som low, medium, high). Lav værdi = mere kortfattet; høj værdi = mere udfoldet. Det påvirker latens* (hurtighed) og tokenforbrug*.

Hvor giver det værdi?

Mini‑eksempel (JSON‑anmodning, pseudokode)

{
    "model": "gpt-5",
    "input": "Opsummer kundens mail i 2 sætninger og giv 3 næste trin.",
    "verbosity": "low"
}

Den lidt tekniske vinkel

Dyk ned: Brug af den nyeste model – Verbosity · API reference (verbosity)


3) prompt_cache_key (hurtigere svar ved gentagne prompts)

Hvad er det? En stabil nøgle, du kan sende sammen med din prompt, så platformen bedre kan genbruge (cache) arbejde for lange, uændrede prompt‑dele. Det giver lavere latenstid og omkostninger i flows med meget standardiseret kontekst.

Hvor giver det værdi?

Mini‑eksempel (idé)

const systemPrefix = load("tone_guide_v7.md");
const cacheKey = hash(systemPrefix); // fx SHA‑256
await client.responses.create({
    model: "gpt-5",
    input: [{ role: "system", content: systemPrefix }, userMessage],
    prompt_cache_key: cacheKey,
});

Den lidt tekniske vinkel

Note: I nogle opsætninger starter cache‑fordele først ved ca. ~1k tokens uændret kontekst; verificér gældende grænser i jeres region/plan.

Dyk ned: Prompt caching – guide · API reference – Responses


4) Predicted Outputs (forudsig kendte dele af svaret)

Hvad er det? Hvis du ved, at store dele af svaret ofte er det samme (fx skabelon‑tekst eller JSON*‑nøgler), kan du sende en “forudsigelse” af output. Modellen kan så strømline genereringen – ofte hurtigere og billigere.

Hvor giver det værdi?

Mini‑eksempel (idé, pseudo‑struktur)

{
    "model": "gpt-5",
    "input": "Udfyld denne kundeservice‑skabelon baseret på sagen",
    "prediction": {
        "type": "text",
        "content": "Hej [navn], Tak for din henvendelse … Med venlig hilsen, [brand] Support"
    }
}

Den lidt tekniske vinkel

Tip: En simpel fallback er at genkøre forespørgslen uden prediction hvis validering fejler, og logge hændelsen til senere tuning.

Dyk ned: Predicted Outputs – guide


5) Service Tier (Standard, Flex, Priority)

Hvad er det? En måde at styre behandlingstilstand for dine kald:

Hvor giver det værdi?

Mini‑eksempel (fallback‑strategi)

// Prøv Priority først, fald tilbage til Flex/auto ved fejl eller kvote
try {
    await client.responses.create({ service_tier: "priority" /* ... */
    });
} catch (e) {
    await client.responses.create({ service_tier: "auto" /* ... */
    });
}

Den lidt tekniske vinkel

Tilgængelighed: Ikke alle modeller/regioner understøtter alle tiers. Tjek docs/prisside for aktuel dækning og differencer (Priority kan koste op til ~2× Standard).

Dyk ned: Priority processing · Flex processing


Sådan omsætter du det pragmatisk (4–8 uger)

  1. Vælg ét use case tæt på penge eller kunderejse (fx refund‑sager) og skriv succeskriterier (kvalitet, latens, omkostning).
  2. Definér guardrails (målformat, tone, do/don’t, eskalation, PII‑politik).
  3. Byg en pilot: brug verbosity målrettet UI vs. batch, prompt_cache_key på jeres systemprompt, og vælg service_tier efter SLA/budget.
  4. Canary‑udrulning til en lille procent af brugere.
  5. Mål løbende: p95 latens, CSAT*, cost per case, cache hit‑rate, fejl.
  6. Skalér først når KPI’er er opfyldt og drift/overvågning er på plads.

Udflyvning: Perspektiver og næste skridt


Risici, etik og governance (kort)

Hvis du vil sparre om et konkret flow (kundeservice, onboarding, videnssøgning), så skriv en kommentar – jeg deler gerne skabeloner.


Samlede ressourcer

Ordforklaring

Ord Kort forklaring
NPS Net Promoter Score – kundernes anbefalingsvillighed (‑100 til 100).
Triage Hurtig prioritering af sager efter hastegrad/risiko.
SOP Standard Operating Procedure – fast arbejdsgang/guide.
RAG Retrieval‑Augmented Generation – hent dokumenter før generering.
JSON Letvægts dataformat med nøgler/værdier, nemt for maskiner.
Latens Den tid det tager fra anmodning til svar.
Token Tekstenhed i modeller; bruges til at måle længde/omkostning.
SLA Service Level Agreement – aftalte mål for fx oppetid/latens.
CSAT Customer Satisfaction – kunders tilfredshedsscore.
Idempotency key Nøgle der sikrer, at retrier ikke skaber dubletter.
p95 95‑percentil – den tid 95% af svar er hurtigere end.
A/B‑test Sammenlign to varianter for at måle effekt.