エンジニアブログ Arista:MLAG ISSUで実現する高可用性

Arista NetworksのMulti-Chassis Link Aggregation(MLAG)環境におけるIn-Service Software Upgrade(ISSU)は、ネットワークのダウンタイムを最小限に抑えつつEOSソフトウェアをアップグレードする強力な機能です。このブログではMLAG ISSUの概要、具体的なアップグレード手順、検証結果について解説します。

柳下 雄飛

入社2年目のネットワークエンジニア
Aristaのプロダクトを担当しています。

1. MLAG ISSUとは?

MLAG ISSUは、Arista機器のEOSソフトウェアを稼働中にアップグレードする機能で、高可用性が求められる環境において重要な役割を果たします。MLAGを構成する2台の装置では、一方の装置をアップグレードする際、もう一方の装置が通信を引き継ぐことで、サービスへの影響を最小限に抑えます。アップグレード中、対象装置を経由していた通信は自動的にもう一方の装置に切り替わり、ネットワーク全体の可用性を維持します。これにより、データセンターやエンタープライズ環境など、サービスの中断が許されない場面でも、計画的なメンテナンスを最小限の通信影響で実施することが可能になります。

MLAGの詳細については、弊社の別記事でも解説していますので、ぜひそちらも参考にしてください。
Multi-Chassis Link Aggregation(MLAG)を用いたネットワーク冗長設計について | STech I Lab | 双日テックイノベーション(STech I)

※EOS(Extensible Operating System)は、Arista Networksが開発したネットワークOSで、同社のスイッチやルーターに搭載されています。

 

2. 検証構成と手順

検証構成

 

今回は、L2ベースのMLAG構成におけるOSアップグレードの影響について検証を行いました。

以下に、使用した機器及び検証環境の詳細を記載します。

 

機器

 ・Arista DCS-7010TX-48-F:2台(バージョン4.31.0Fから4.32.5Mへのアップグレードを実施)

 ・Juniper QFX5100:2台

 ・Spirent Tester
 

トラフィック条件

 ・方向:双方向通信

 ・フロー:送信元MACアドレスをインクリメントすることで、10フローを生成

 ・パケットレート:10000pps(1フロー当たりは1000pps)

 

ネットワーク構成

 本検証では、Aristaスイッチ2台をMLAGペアとして構成し、Juniperスイッチとの間でL2接続を行いました。

 Spirent Testerを用いて、双方向にトラフィックを流し、各リンクに均等に分散させることでパケット損失の有無を確認しています。

 

 

Arista_test_toplogy

 

 

アップグレード手順

 

本検証では、MLAG ISSUを用いたEOSのアップグレードを以下の手順で実施しました。

 

 1.MLAGステータスの確認
 2.新しいEOSイメージの指定
 3.ISSUの互換性と構成整合性の確認
 4.再起動によるアップグレードの実施
 5.アップグレード後の状態確認

 

1.MLAGステータスの確認

 

sh-mlag-before

 
stateが「Active」であることから、Arista#2とMLAGのピアが張れていることが確認できます。

「Active-full : 2」のステータスはMLAGを構成する2台のArista機器と対向機器で正常にLAGが確立できていることを示しています。

 

2.新しいEOSイメージの指定

 

boot-system_1

 

コンフィグレーションモードにて、新EOSイメージを指定し、次回の再起動時に指定イメージから起動するように設定します。

 

3.ISSUの互換性と構成整合性の確認

 

sh-mlag-issu-warning

sh-mlag-issu-config

 

"show mlag issu warning"コマンドを使用して、ISSUを実施する際の警告を確認します。コマンド出力では、現在のEOSバージョンとアップグレード対象バージョン間でMLAG ISSUがサポートされているかどうかを確認するよう促されます。また、"show mlag config-sanity"でMLAGピアであるArista#2と構成の不一致がないことが確認できます。
 

※MLAG ISSUの互換性は、Arista社が提供する「MLAG ISSU Check」で確認できます。
 現在のEOSバージョンと対象バージョンを入力することで、互換性の有無を判定できます。

 互換性がない場合は、中間バージョンを経由してアップグレードする必要があります。

 

 

4.再起動によるアップグレードの実施

 

reload

 

指定したEOSイメージで再起動を実施し、スイッチのバージョンアップを行います。

 

5.アップグレード後の状態確認

 

show-version-4.32

 

"show version"でEOSがバージョン4.32.5Mに正常にアップグレードされていることを確認します。

 

 

sh-mlag-reload

 

バージョンアップ後、MLAGのreload-delayタイマーが作動し、Arista#1がMLAGを再構築して通信を復旧するまで待機します。この間、MLAGポートは「Active-partial:2」となり、JuniperスイッチとのLAGはArista#2のみで構成されている状態です。

 

sh-mlag-after

 

reload-delay(300秒)が経過した後に MLAGの状態が「Active-full: 2」であることを確認します。

通信の復旧が確認できたら、同様の手順でArista#2のアップグレードを実施します。

※reload-delayタイマーのデフォルト値は、使用しているプラットフォームによって異なります。


3. 検証結果

Arista#1 バージョンアップ時

Arista1_reload-1_toplogy
 

Arista#1再起動時に同機器を経由していたトラフィックが、Arista#2に切り替わることで通信が継続されています。
 

Arista1_reload_%E3%83%8F%E3%82%A4%E3%83%A9%E3%82%A4%E3%83%88

 

Arista#1の再起動時には、同機器を経由するトラフィックの影響は1秒未満でした。
一方、Arista#2経由のトラフィックには影響はありませんでした。 

  

Arista#2 バージョンアップ時
Arista1_reload-2_toplogy

Arista#2再起動時に同機器を経由していたトラフィックが、Arista#1に切り替わることで通信が継続されています。

 

Arista2_reload_%E3%83%8F%E3%82%A4%E3%83%A9%E3%82%A4%E3%83%88

 

Arista#1経由のトラフィックには影響はありませんでした。

一方、Arista#2再起動時には同機器を経由するトラフィックの影響は1秒未満でした。

 

 

※ご注意

この結果は、あくまで一つの参考値としてご覧ください。

テストは限られた条件で行っており、実際の運用環境(利用装置、対向装置、利用OS、負荷状況)が変われば、

結果もそれに伴い大きく変動する可能性があります。

4. まとめ

MLAG ISSUは、Aristaスイッチの冗長構成を活用し、EOSアップグレード時の通信断を最小限に抑える高可用性機能です。今回の検証では、MLAGピアの片側を再起動しても、もう一方のスイッチがトラフィックを処理し続けることで、ネットワークの継続性が保たれることを確認しました。この仕組みにより、ミッションクリティカルな環境でもサービスを止めることなく、計画的なアップグレードが可能になります。ただし、MLAG ISSUの挙動は使用するプラットフォームや環境によって異なる場合があるため、導入前には事前検証が不可欠です。Arista社が提供する「MLAG ISSU Compatibility Check」などのツールを活用し、バージョン間の互換性や構成の整合性を確認したうえでアップグレードを行うことが推奨されます。MLAG ISSUは、今後のネットワーク運用において、より安定したアップグレード手法としての活用が期待されます。




  • #AristaNetworks
  • #ネットワーク

おすすめ記事

関連ソリューション・製品

エンジニアブログ

Stech I Labに関するお問い合わせは、
こちらのフォームからご連絡ください。