A Netflix káoszmajom és ellátási lánca

Nemrég beszélgettem Carlos Crespo-val, a Zara anyavállalatának, az Inditexnek az operatív igazgatójával, amelyben megemlítette a Netflix által több mint egy évtizede létrehozott szoftvereszközt a rendszer rugalmasságának intézményesítésére. A név fülbemászó, és az ellátási lánc vezetői számára, akik megpróbálják újra feltalálni ellátási hálózataikat a viharos időkre, ez ellenállhatatlan. És mégis egy GoogleGOOG
az „ellátási lánc káoszmajom” keresése pontosan adott eredményt egy idézet, 2012-ből.

Miért nem alkalmazzuk ezt az ötletet az ellátási lánc ellenálló képességére?

Mi az a Káoszmajom?

Ez egy szoftver eszköz, és tágabb értelemben egy mérnöki elv, amely véletlenszerűen leállítja egy összetett rendszer egyes részeit, és arra kényszeríti a kezelőket, hogy élesben helyreálljanak. Olyan, mint egy meglepetés tűzoltógyakorlat, de naponta, véletlenszerű módokon és helyeken. Az ötlet az, hogy a rendszerproblémák gyors megoldásában való jó tanulás egy tanulási folyamat, amelynek hasznára válhat a meredekebb tanulási görbe.

A háttértörténet arról szól, hogy a Netflix hogyan bővítette streaming üzletét az Amazon Web Services szolgáltatáson, miközben áttért a DVD-k szállításáról az ügyfelek küszöbére. Első ránézésre ez egy logikus megközelítés a rendszer-redundancia tervezésében, mint amit a NASA-tól várnánk, de a gyakorlatban kihasználja a Netflix kulturális normáját, amely lehetővé teszi az egyes közreműködők számára, hogy megoldják saját problémáikat. Ahogy a krónikás "KáoszmérnökCasey Rosenthal és Nora Jones 2020-as könyve, akik úttörői voltak a Netflixnél, öt alapelvre bontakozik ki:

  • Állítson fel hipotézist az állandósult állapotú viselkedés körül
  • Változtassa meg a valós eseményeket
  • Futtasson kísérleteket a termelésben
  • Automatizálja a kísérleteket a folyamatos futtatáshoz
  • Minimalizálja a robbanás sugarát

A kultúra és a folyamatok ötvözete a Netflixnél azért fontos, mert elősegítette és kihasználta a nyílt forráskódú problémamegoldó megközelítést, miközben a véletlenszerű leállások szisztematikus forgatása felgyorsítja a tanulást a kiterjesztett csapatban.

Supply Chain Resilience and Chaos Engineering

Digitális átalakítás Az ellátási láncban az idei év nagyon meleg volt, mert segít az ellátási láncoknak új üzleti modellek támogatásában és a fenntartható működés felé való elmozdulásban (lásd a BCG X tanulmányt), hanem azért is, mert „rugalmasságot” ígér. Sajnos a digitális átalakítás gyakorlati alkalmazásai az ellátási lánc rugalmasságát még mindig általában a jobb „láthatóságot” biztosító platformokra csapódnak le, amelyeket számos hagyományos taktika támogat, mint például a készletpufferelés és a kettős beszerzés. Ezt a megközelítést az elemző munka egy másik rétege támasztja alá felépülési idő David Simchi-Levi az MIT-n, és egy digitális ikreket használó szimulációs hullám. Mindez nagyszerűen hangzik, de hiányzik minden szisztematikus módszer a valódi ellátási lánc kudarcával való kísérletezéshez, hogy megtanuljuk, hogyan lehet a gyakorlatban a legjobban helyreállítani.

Chaos Monkey alkalmazása az ellátási láncokra

Az orvosok leteszik a Hippokratészi esküt, mielőtt felvágnának minket, beleértve a híres „először ne árts” szót. Nem rossz ötlet, ha valaki a Chaos Monkey elveit alkalmazza az ellátási láncokban, ami azt jelenti, hogy véletlenszerűen le kell kapcsolni egy valódi gépet valahol. Ez nem triviális, és amennyire én tudom, még sehol nem történik meg.

  • A fent idézett első elv szerint a belső attribútumok helyett a rendszerkimenetekre kell összpontosítani. Ellenőrizze, hogy a rendszer működik-e, ahelyett, hogy megpróbálná megérteni, miért működik.
  • A második alapelv azt mondja, hogy különféle dolgokat reális módon törjünk össze. Nincs szükség globális termonukleáris háború szimulálására, csak kapcsolja ki a kapcsolót, vagy veszítse el a rendelést, és tanulja meg, melyik megoldás működik a legjobban.
  • A harmadik alapelv szerint a legjobb hely a tanulásra a termelés. A cselekvés általi tanulás jobb, mint a szimulációval való tanulás – azaz a digitális ikrek nagyszerűek, de nem biztos, hogy elegendőek a rugalmasság kultúrájának kialakításához.
  • A negyedik alapelv intézményesíti a káoszmajom elveit, mert lehetővé teszi a kísérletezési folyamat skálázását, ami meredekebb tanulási görbéhez vezet. Használjon adattudományt a tűzoltásban.
  • Végül minimalizálja a robbanás sugarát. Ez azt jelenti, hogy „ne árts”, és valamiféle pufferelést jelent (készlet, átfutási idő, gyorsított szállítás), hogy megóvjuk az ügyfeleket attól, hogy érezzék a kísérletet. Tanuld meg kezelni az irányított robbanásokat.

Lehet vitatkozni, hogy az elmúlt három év Covid, háború, munkás zavargások, és a gazdasági zűrzavar egy nagy káoszmajom-szárazság volt mindenki számára. A Netflix tanulsága az volt, hogy ezt a fajta válságot nem csak tervezni kell, hanem az élet állandó tényeként kell elsajátítani.

A tökéletes vihar talán soha nem ér véget, ezért talán meg kellene tanulnunk együtt élni vele.

Forrás: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/