1. Názov metódy
Blameless Postmortem (Post-mortem bez obviňovania)
2. Alternatívne názvy
Incident Review, Post-Incident Review
3. Krátky popis
Je to špecifický typ Lessons Learned stretnutia, ktoré sa koná po nečakanom zlyhaní alebo incidente (napr. výpadok systému). Kľúčovým princípom je, že analýza sa zameriava na identifikáciu systémových a procesných príčin zlyhania, nie na hľadanie ľudského vinníka. Vychádza z presvedčenia, že ľudia robia chyby, ale príčinou sú zlé systémy, nie zlá vôľa.
4. Účel / Kedy použiť
Používa sa primárne v IT a technologických firmách (spopularizoval to Google SRE) po každom významnom incidente. Cieľom je maximalizovať učenie, predchádzať opakovaniu rovnakých zlyhaní a budovať kultúru psychologického bezpečia.
5. Postup / Ako ju aplikovať
1. Zvolaj stretnutie čo najskôr po incidente, kým sú spomienky čerstvé.
2. Začni s "Prime Directive" (podobne ako pri retrospektíve), aby si nastavil bezpečné prostredie.
3. Vytvor časovú os udalostí: Detailne a fakticky zrekonštruujte, čo sa stalo, kto čo urobil a aký bol dopad. Zamerajte sa na "čo", nie "kto".
4. Analyzuj príčiny: Použite techniky ako 5 Why na odhalenie systémových príčin (napr. chýbajúci monitoring, nejasný postup, technický dlh).
5. Definuj akčné kroky: Vytvorte konkrétne, merateľné nápravné opatrenia zamerané na zlepšenie systému (napr. "Pridať alert na využitie CPU", "Zlepšiť dokumentáciu pre krízové situácie"). Priraďte vlastníkov a termíny.
6. Zdieľaj report: Výsledný post-mortem report je verejne zdieľaný v celej organizácii, aby sa z neho mohli poučiť aj ostatní.
6. Príklad z praxe
Po výpadku e-shopu sa tím stretne na Blameless Postmortem. Zistia, že výpadok spôsobil chybný kód nasadený novým kolegom. Namiesto obviňovania nováčika sa pýtajú: "Prečo náš systém dovolil, aby sa chybný kód dostal do produkcie?". Identifikujú príčiny: nedostatočné automatické testy a chýbajúci proces code review pre juniorov. Akčné kroky sú zamerané na zlepšenie týchto procesov.
7. Výhody
- Buduje kultúru psychologického bezpečia a dôvery.
- Podporuje úprimnosť a rýchlejšie riešenie problémov (ľudia sa neboja priznať chybu).
- Vedie k robustnejším a odolnejším systémom.
- Maximalizuje učenie sa z chýb.
8. Riziká / Limity
- Vyžaduje si absolútny záväzok manažmentu k "blameless" princípu. Akýkoľvek náznak hľadania vinníka zničí dôveru.
- Môže byť zneužitá ako ospravedlnenie pre nedbalosť, ak nie je správne pochopená. Nejde o absenciu zodpovednosti, ale o zameranie na systémovú zodpovednosť.
9. Tipy z praxe
- Oddeľte vyšetrovanie incidentu od riešenia personálnych otázok, ak je to naozaj nevyhnutné.
- Automatizujte tvorbu časovej osi z logov a komunikačných nástrojov.
- Zamerajte sa na "prispievajúce faktory", nie na jednu "koreňovú príčinu", pretože komplexné zlyhania majú málokedy len jednu príčinu.