My Home NW Lab

逸般の誤家庭のネットワーク

Meraki MXの間接リンク障害の検知時間は約300秒 (5分)

概要

Meraki MXは間接リンク障害の検知に約300秒 (5分)かかります。
間接リンクとは、Meraki MXと直接接続がない機器やリンクの障害となります。

f:id:myhomenwlab:20220227210500j:plain
間接リンク障害とリンクダウンによる検知

Meraki MXのUplinkに直接接続されている隣接機器の障害や、 接続ケーブルの障害であればUplinkのリンクダウンが伴うため直接的な検知が行えて、即時的な切り替えに繋げられます。

しかしながら、間接リンクの障害の場合は、UplinkはリンクアップしたままとなるためMeraki MXは直接的に障害を知るすべがありません。 そのため、Meraki MXはInternet側の障害状況をモニタリングするために、何種類かの疎通確認を定期的に行っています。

f:id:myhomenwlab:20220227211620j:plain
間接リンク障害 - 通常時

下記の図では、ISP-A網 - Internet間で障害が起きており、Meraki MXは直接的に障害を知るすべがないため、 疎通確認によるモニタリングに障害検知の時間が依存します。

f:id:myhomenwlab:20220227211631j:plain
間接リンク障害 - 障害時

間接リンク障害の検知時間に関する仕様

障害検知に用いられるテストは何種類かありますが、間接リンク障害の検知に用いられるテストは、障害と認識するまでに約300秒 (5分)の時間を要します。
疎通確認のポーリングが失敗すると、ポーリング間隔を短くする挙動はありますが、あくまでも障害と認識するまでの時間は変わりません。

本仕様に関するドキュメントは下記となります。

documentation.meraki.com

間接リンク障害に関するドキュメント上の該当記述は下記になります。

When both the HTTP and ICMP tests have been unsuccessful for a period of time that exceeds 300 seconds, the uplink will be failed over. Therefore, it can take approximately five minutes for failover to occur in the event of a soft failure (where the physical link is still up but provides no internet access).

検知時間の短縮化は不可能

あまりにも間接リンク障害の検知時間が長すぎるため、検知タイマーの短縮化方法をサポートに確認しましたが、 Meraki側でも個別の設定変更はできないと回答を得ています。(2021年11月頃の情報です。)
そのため、Meraki MX導入時に障害時間に厳しいSLAが求まれる場合は、本仕様のたった1つで導入プロジェクトが頓挫する可能性があるので十分に留意してください。

補足情報

Auto VPNトンネルには個別に障害検知のタイマーがあります。
そのため、Auto VPNを通らないUnderlayの断時間は長いものの、Auto VPNトンネルを介した通信の断時間は短くなる可能性があります。
よって、障害時間の確認テストを行う際は、UnderlayとAuto VPN経由の両方で疎通確認先を用意すべきです。

f:id:myhomenwlab:20220227210622j:plain
間接リンク障害とAuto VPNトンネル経由の通信

Auto VPNトンネルのダウン検知時間に関しては、下記の記事に記載しております。

myhomenwlab.hatenablog.com