altitudes® Cloud · Platform · AI Amsterdam · Rotterdam --:--
[DIENST]OPS4–8 weken initieel, continue verbetering
[07] / DIENST — OBSERVABILITY

SLO's waar het team het mee eens is. Alerts die on-call vertrouwt.

Observability is geen dashboards. Het is het runbook dat het dashboard triggert. We bouwen observability die gedrag verandert: SLO's waar het team het mee eens is, alerts die de on-call vertrouwt, AI-calls inbegrepen als first-class telemetrie.

[01] / CAPACITEITEN _

Wat zit er in een observability-opdracht.

Vijf signaaltypes, één gecorreleerde context — zo komen metrics, logs, traces, profiles en events samen in het beeld dat je nodig hebt.

[FIG.10 / OBSERVABILITY · PILLARS] VIJF PIJLERS — ÉÉN CONTEXT
  • [01] / SLO

    Service Level Objectives

    Per service, afgesproken met het team. Geschreven in taal die een CFO kan lezen. Maandreview.

  • [02] / TELEMETRIE

    OpenTelemetry-first instrumentatie

    Traces, logs, metrics. Vendor-portable. Geen lock-in op één APM.

  • [03] / ALERTS

    Alerts die on-call vertrouwt

    Wij verwijderen meer alerts dan we toevoegen. Elke alert linkt naar een runbook. Pager-fatigue is een metric.

  • [04] / AI

    AI-telemetrie, first-class

    Token, latency, kwaliteit, kosten per use case. Hallucinatieklasse als signaal.

  • [05] / RUNBOOKS

    Runbooks die het dashboard triggert

    Elke alert ships met een runbook. Geüpdate na elk incident. Kwartaalreview.

  • [06] / EVIDENCE

    Evidence pack voor audit

    Dezelfde telemetrie die het platform draait, voedt DORA, ISO 27001 en SOC 2 evidence. Eén bron van waarheid.

[INFORMATIESTROOM · 5 STAPPEN _]

De volledige telemetrie-pipeline, van begin tot eind: van instrumentatie in je workload tot de alert die je engineer om twee uur 's nachts wakker maakt.

[FIG.11 / OBSERVABILITY · INFO FLOW]
01 / INSTRUMENTATIE

Data begint in de applicatie

De OpenTelemetry SDK emiteert metrics en distributed traces vanuit je code. Gestructureerde JSON-logs dragen een correlatie-ID dat één verzoek volgt door elke service-grens heen — geen agent, geen sidecar, geen bolt-on.

02 / COLLECTIE

Eén tier reinigt het signaal

Elke telemetriestroom passeert één collectielaag vóór opslag. Hier wordt gesampled om volume te beperken, verrijkt met deployment-metadata en doorgestuurd naar de juiste backend — zodat stores schone, gelabelde data ontvangen in plaats van een ruwe firehose.

03 / OPSLAG

Doelgerichte stores, niet één database

Metrics, logs en traces hebben verschillende queryvormen. PromQL voert bereiksamenvoeging uit op Mimir. Loki beantwoordt volledige-tekstzoekopdrachten. Tempo doorloopt trace-grafieken. Alles in één store stoppen betekent langzame queries of verspild geld.

04 / CORRELATIE

Eén venster, drie stores, geen handmatig zoeken

Grafana wordt het enkelvoudige toegangspunt. Eén dashboard verbindt een latency-piek van Tempo met de logregels van Loki en de metric-alert van Mimir — gecorreleerd in context, zonder wisselen van tools of kopiëren van ID's tussen tabs.

05 / ACTIE

De pipeline eindigt in een beslissing

SRE-dashboards tonen SLO-verbrandingssnelheden in realtime. On-call alerting vuurt precies wanneer een foutbudget overschreden wordt — niet een minuut eerder, niet een minuut later. Elke alert is herleidbaar naar een specifieke query en een specifieke eigenaar.

[02] DE WERKWIJZE _

Hoe een observability-opdracht verloopt.

Van audit tot overdracht4–8 weken initieel, continue verbetering
[01] / AUDIT

Pager-fatigue-audit, 1 week.

We meten de alert-noise-floor en de on-call-load. Baseline op papier.

⏱ 1 wk
[02] / ONTWERP

SLO's en dashboards.

Per service, afgesproken met het team. Beoordeeld door je SRE-lead.

⏱ 1 wk
[03] / BOUW

Instrumentatie, 4–6 weken.

OpenTelemetry, runbooks per alert, AI-calls inbegrepen. Paired coding.

⏱ 4–6 wkn
[04] / OVERDRACHT

Je SRE-team bezit het.

Gedocumenteerd, instrumented, met een kwartaalreview-template die je zelf draait.

⏱ 1 wk
[RELATED · GERELATEERD]OPLOSSINGEXCELLENCE & BENCHMARKING

Excellence & Benchmarking.

Observability-baseline plus benchmark tegen EU mid-market peers. Pager-fatigue-index, SLO-dekking, runbook-kwaliteit gescoord. Resultaat: een volwassenheidscijfer dat je kunt verdedigen, en een gericht verbeterplan.

Bekijk de oplossing

Vragen over observability.

[01] Welke vendor? +

Wij zijn OpenTelemetry-first. Backend is jouw keuze: Grafana-stack, VictoriaMetrics, Tempo, OpenSearch. We kiezen op signaalkwaliteit en exit-kosten, niet op logo.

[02] Kunnen jullie onze bestaande stack houden? +

Vaak ja. De opdracht gaat meestal over wát je instrumented en hóe je alert, niet over de backend. We vervangen backends alleen wanneer de datavorm verkeerd is.

[03] Hoe meten jullie AI in de stack? +

Tokencount per call, latency, output-kwaliteit (auto-evaluated waar mogelijk, human-scored waar niet), en kosten. Gekoppeld aan dezelfde trace als de rest van de service.

[04] Wat met de kosten van observability zelf? +

Maandelijks getracked. We reduceren observability-spend routinematig met 30 tot 40 procent tijdens de opdracht door ruis te verwijderen en sampling aan te passen. Netto van onze fee, betaalt de opdracht zichzelf meestal terug.

[VOLGENDE STAP]

Klaar om over observability te praten?

Boek de Platform Read Of mail hello@altitudes.cloud

Eén gesprek, één geschreven samenvatting, ongeacht de uitkomst.