エンジニアブログ サービスやインフラの性能監視、出来ていますか?
NETSCOUT SA製品で実現するきめ細やかな性能監視

お客様に提供するサービスや社内に提供している自社インフラサービスの性能監視は出来ていますか?
NETSCOUT社のSA(サービスアシュアランス)製品では、様々なダッシュボードやモニター機能により性能劣化をいち早く検知し、重大な障害になる前に防ぐことが可能です。
本ブログでは、NETSCOUT SA製品の動作の仕組みや実際の監視の方法などについてご説明していきます。

坪島 英昭

セキュリティ分野のITアーキテクトとして従事。
Linux/OSSをベースに置きつつ、最近は専らネットワークセキュリティ製品に関わるエンジニアとして活動している。

1. はじめに

NETSCOUT社はDDoS対策における世界トップシェアとして有名ですが、実は古くからSA(サービスアシュアランス)カテゴリにおいて、特に4G LTE/5Gといったモバイルテレコム業界で多数の実績を持っています。
モバイルテレコムというと特殊なプロトコルをベースにした世界と思われがちですが、実はNETSCOUT社のSA製品は一般的なIPインフラにおける性能監視でも有用となっています。

2. 性能監視の重要性

新型コロナウィルスによるパンデミック以降リモートワークが増える中、テレビ会議の活用が増え、ビジネスアプリケーションも様々なクラウドサービスを利用するようになりました。サービスプロバイダのトラフィック量は急激に増加する一方、回線品質向上の顧客ニーズも高まっている傾向があります。従来はサービスプロバイダも帯域拡張によってサービス品質向上を行ってきましたが、ビジネストラフィックが増える中でその回線品質自体を向上させる取り組みにシフトしてきています。

サービスに対して不満を感じている層のうち、96%は特に苦情を申告することなくサービスの利用をやめていくと言われています。
つまり、回線品質向上の取り組みが遅れてしまうとユーザは他サービスに乗り換えてしまい、売上の減少につながってしまう可能性があります。
顧客満足度向上の取り組みは企画部門だけでは難しい場合が多く、実際のネットワークを運用する担当者の視点も加えながら行っていくことが望ましいです。ネットワーク上に潜む遅延、エラー数、再送率などにKPIを定め、常時性能監視を行ってKPI達成のための改善活動を継続していくことが重要です。

3. NETSCOUT SA製品の構成

では、NETSCOUT社 SA製品ではこの性能監視をどうやって実現しているのでしょうか。実際の構成を見ていきましょう。

product
こちらの図はSA製品における主なコンポーネントを示しています。

  • nGeniusOne
    • SA製品の中心となり、Web UIで各種サービスダッシュボード、性能監視などを行います
  • InfiniStream NG
    • 実際にネットワークからトラフィック収集を行い、内部にパケットキャプチャを一定期間保存しながら中枢であるnGeniusに対して統計情報やKPIデータを送信します
    • トラフィックは主にネットワークスイッチ/ルータやTAPからのミラーパケットを取り込む形となります
  • オプション製品
    • nGenius Session Analyzer (nSA)
      • エンドツーエンドで通話のフローを可視化します。ボイスデータの再生も可能です
    • nGenius Business Analytics (nBA)
      • ビッグデータ分析プラットフォームです。大量のデータを効率よく分析する際に使用します
    • Truecall
      • 無線ネットワークにおける最適化ツールです。端末の位置情報などを細かく管理します

各コンポーネントが保持する各種データやお互いの間でのやりとりについて、もう少し細かくみてみましょう。

internal

各種データは以下の流れでやりとりされていることがわかります。

  1. トラフィックがInfiniStream NGのNICに着信する
  2. InfiniStream NG内部で、(A) 統計情報、(B) セッション情報、(C) パケット生データの3種類に分割保存される
  3. (A) 統計情報については、中枢であるnGeniusOneに送信され、SQLに保存されサービスダッシュボードやサービスモニターでの表示に使われる
  4. (B) セッション情報、(C) パケット生データについてはInfinistream NG内部に保管され、必要に応じてnGeniusOneやnGenius Session Analyzer、nGenius Business Analyticsからの要求に応じてデータをオンデマンドで送付し、セッションサマリーやパケットデコードの表示に使われる

4. サービスダッシュボードや各種モニター

サービスダッシュボードや各種モニターは段階的にドリルダウンしていく形で確認ができます。

drilldown.png

サービスダッシュボード
サービスダッシュボードでは、システム全体の性能監視におけるKPIを一覧で表示することができます。
システム全体としての稼働状況をひと目で見渡し、把握することができます。

servicedashboard

サービスモニター
サービスダッシュボードでいずれかの項目を選択すると、サービスモニターに遷移します。
選択した項目について、サマリ情報やプロトコル上での成功/失敗、発生しているエラー状況や遅延、スループットの具体的な時系列での数値を確認できます。

servicemonitor

セッション解析
サービスモニターのセッションサマリでいずれかのセッションを選択すると、セッション解析に遷移します。
個々のセッションについて、時系列でエンドツーエンドでどういったデータがやりとりされているか、ラダー形式で表示できます。

sessionanalyzer

パケット解析
セッション解析でいずれかのパケットを選択すると、パケット解析に遷移します。
個々のパケットについて、Wiresharkのような形式で分析ができます。

packetanalyzer

このように、全体を俯瞰した状態から各段階の粒度を経て、最終的に1つ1つのパケットまでつぶさに解析できるところがNETSCOUT SA製品の大きな特長となっています。

5. サービスモニターの実例

サービスモニターの実例として、ここではDNSモニタリングについてご紹介します。
DNSモニタリングでは、まずDNSサーバ毎の遅延、リクエスト数、失敗数を一覧で表示できます。
DNSサーバのいずれか、もしくは複数を選択すると、それらの合計として下段に各種情報を表示できます。

dns2-2

次にDNSモニタリングにおけるフィルタの機能についてご説明します。
解析したい対象として特定のエラーコードの発生状況を調べるなど、絞り込みを行うことができます。
以下では、DNSプロトコルにおけるエラーコード03: NXDomainについて絞り込みを行っています。

dns2

そうすると、該当のエラーコードを含んだセッションのみが一覧として表示されます。
該当のDNSサーバと通信している対向のクライアントIPアドレスや、問い合わせされたクエリ内容も表示できます。
セッションはラダー形式で時系列を追ってどのようなやり取りが行われたかを表示できますし、パケット詳細についてもドリルダウンができます。

dns4

そして一番細かい粒度として、パケット解析となります。
パケットのヘッダー情報のみでなく、実際のペイロードにどういったデータが載っているかについても表示できますので、性能劣化の原因などについて最小の単位であるパケットレベルでの解析ができます。

dns5

6. おわりに

いかがでしたでしょうか?

通信回線における性能監視の重要性やNETSCOUT SA製品の構成、ドリルダウン形式による様々な粒度での解析、そして実際のモニター画面の実例についてご紹介しました。

NETSCOUT製品にご興味のある方や、実際に性能監視システムの導入をご検討されている方がいらっしゃいましたら詳しくご案内が可能です。ぜひお問い合わせをお待ちしております!
NETSCOUT SA製品資料ダウンロード

エンジニアブログ

Stech I Labに関するお問い合わせは、
こちらのフォームからご連絡ください。