Teruggaan

Waarom probleemdiagnose automatisering zo moeilijk is

by Lingping Gao 7-2022-XNUMX

Am 7. Dezembere, In 2021 had Amazon AWS een grote storing die begon met een storing in Noord-Virginia en zich snel over het hele land verspreidde. Het duurde niet lang of veel zakelijke sites zoals Google, Netflix, DoorDash en Southwest Airlines werden getroffen door de storing. Op het hoogtepunt waren meer dan 600 mensen van AWS op een telefonische vergadering om het probleem op te lossen. De storing duurde ruim 8 uur. Denk aan de zakelijke implicaties op de lange termijn van een storing van 8 uur.

Voor de maand ging AWS door met nog 2 storingen.

Het roept de vraag op: kan het beter?

Het kan. AWS is in feite een van 's werelds meest geautomatiseerde netwerken, maar deze storing is gebaseerd op de post-mortem samenvatting door AWS, duurde zo lang om te isoleren omdat de storing zelf invloed had op de toegang tot de geautomatiseerde diagnosefunctie.

In onze moderne IT-wereld moet probleemdiagnose worden geautomatiseerd, ook al is dat heel moeilijk om te doen. Een onderzoek uit 2021 door NetBrain aan honderden van onze klanten onthulde dat 2/3 van deze netwerkingenieurs geen automatiseringsmogelijkheden hebben tijdens het oplossen van problemen. Wat gebruiken ze? De gewone oude opdrachtregelinterfaceconsole. Wat eronder lijdt, is de tussentijdse reparatie en langdurige uitval, samen met veel langetermijneffecten op klanttevredenheid en -behoud, waarderingen, reputatie, enz.

Voor de ondernemingen die automatisering wilden gebruiken voor probleemdiagnose, was de reis erg zwaar. RCA-tools (root cause analysis) trokken 20 jaar geleden veel aandacht, maar de resultaten waren verre van bevredigend. De meeste innovators zijn opgeslorpt door grote spelers op het gebied van IT-oplossingen en stopten simpelweg met verdere innovatie. Meer recentelijk proberen AiOps-oplossingen deze leemte op te vullen met een black-boxbenadering. Alle AiOps-oplossingen maken gebruik van machine learning of traditionele op statistieken gebaseerde AI-functies om hoofdoorzaken van grote hoeveelheden machinegegevens te ontdekken. Maar voor de meeste IT-problemen is het erg moeilijk om aan een set schone gegevens te komen, naast vele andere uitdagingen, waaronder een PH.D om zo'n tool te bedienen. Als een van NetBrain's klanten zeiden het toen ze hun vroege inspanningen met AIOps bespraken, ze wachtten zes maanden voordat hun eerste probleem werd gediagnosticeerd via hun AiOps-tool, en dat was een heel eenvoudig probleem. (De naam van de tool is hier weggelaten om verwarring te voorkomen)

Niet zonder moeite blijft de automatisering van probleemdiagnose vandaag de dag de grootste onopgeloste IT-uitdaging. NetBrain begon meer dan 10 jaar geleden aan dit probleem te werken, met behulp van een Whitebox-aanpak waar alles om draait Network Intent. De zogenaamde intent-based Next-Gen kan worden gekoppeld aan de meeste ITSM-tools, waardoor deze problemen kan oplossen zodra ze zich voordoen. Het kan meer dan 95% van de netwerkproblemen aanpakken die naar IT-systemen komen en mogelijk van invloed zijn op de bedrijfsapplicaties van de organisatie, en helpt ook veel terugkerende problemen te voorkomen. In de komende blogs leggen we de innerlijke werking van uit NetBrain's Intent-based automation systeem voor hybride netwerken in meer detail.

Verwant