戻る

マルチベンダー ネットワーク環境でのトラブルシューティング ワークフローを自動化するためのベスト プラクティス

著者注 by ヴァレリー・ディマルティーノ 2024 年 3 月 27 日

正直に言うと、ハイブリッド ネットワークのトラブルシューティングを手動で行うのは面倒で時間がかかります。すべての問題は、あたかもその問題が以前に発生していないかのように対処され、さまざまなネットワーク エンジニアが、専門知識と経験に基づいて、同様の問題に対して異なる解決策を適用します。その結果、今日のネットワークのトラブルシューティングは科学というよりも芸術のようなものになり、それ自体が重大な問題になります。さらに悪いことに、エスカレーション エンジニアの数は限られており、限定されたコンテキスト、ワークフローの課題、さまざまなアプローチのため、担当する場合は初期調査の手順を繰り返す必要があります。

適例: ある有名な電気自動車メーカーは、他の IT 部門からの特定のネットワーク データに対するサービス リクエストに圧倒されていました。たとえば、セキュリティ チームや IT インフラストラクチャ チームは、多くの場合、カメラなどの特定のデバイスが接続されているスイッチ ポートを把握したり、追加のデバイスを導入できるように使用されていないポートを見つけたりする必要がありました。次に、毎週のデバイス変更リクエスト、パスワードのローテーション、ハードウェアの更新を常に把握することが困難でした。他の IT 部門からの絶え間ない要求の流れに対応しながら、これらすべてを実行し続けてビジネスをサポートすることは、大変な作業でした。

現在、サービス チケットの量が膨大であり、それらを処理する NOC 担当者の数が横ばいになっているため、さらなる自動化が必要です。予算は厳しく、熟練した人材も限られています。そして、アプリの速度が遅いことが報告されたり、接続が切断されたりするたびに対応できる、熟練したネットワーク エンジニアが必ずしもあふれているわけではないこともわかっています。多くは、診断ツールさえあれば、レベル 1 の操作で簡単に対処できる、一般的な繰り返しの問題に当てはまります。ただし、トラブルシューティングは、手動応答プロトコルを使用したチームの取り組みとみなされます。

👨‍💻 レベル 1 エンジニア診断 > 🎫 チケット エスカレーション > 👨‍💼 レベル 2 エンジニア診断 など。

さらに、モニタリング ツールからは誤検知が発生し、バタバタのようにゴーストを無限に追いかけることになります。これらの一時的な問題をフィルタリングする方法があればいいのですが。

自動化はトラブルシューティングを迅速化するために長い間望まれてきたソリューションですが、これらの取り組みのほとんどは開発者主導のプロジェクトとなり、十分な結果をもたらすことができません。また、草の根自動化を試みると、ユーザー固有のスクリプト作成という形になり、これも効率化の目標を達成できません。これらのアプローチはいずれも、組織の中核となる参照ワークフローを変革するものではありません。どちらのアプローチも組織全体で再利用することはできず、 MTTR、マルチベンダー ネットワークに拡張し、コラボレーションを強化し、問題の再発を防止し、何らかの大幅な方法で効率を最大化します。

これらの運用上の欠点に対処するには、まったく新しいマシン中心のアプローチをネットワーク運用に実装する必要があります。それには、あらゆる業務におけるネットワークの自動化を含め、ネットワーク エンジニアの運用に対する考え方を根本的に変える必要があります。これを行うには、すべてのエンジニアリング リソースが利用できる (コードを必要とせずに) 自動化プラットフォームが必要です。これらの熟練したエンジニアは、問題の解決方法をすでに知っています。彼らは、深い問題解決の経験をキャプチャし、インフラストラクチャのどこにいても同じトラブルシューティング状況に対処したい人がそれをマシンで実行できるようにする簡単な方法を必要としています。適切なプラットフォームがあれば、すべてのエンジニアが、大小を問わずあらゆる問題に対して数か月ではなく数分でネットワーク自動化を作成できるネットワーク自動化エンジニアになります。

ネットワーク自動化を調査する際に考慮すべきベスト プラクティス:

関連記事