今週月曜日、Facebook とそのすべてのサービス (WhatsApp、Instagram、Facebook Messenger を含む) の崩壊により、世界中の何十億もの人々と何百万もの企業が部分的に遮断されました。
半島時間午後5時40分、 Facebookはインターネットから消えた。 WhatsApp を介したメッセージの送受信が停止し、Facebook および Instagram アプリケーションでは入力時にエラーが表示されました。完全に終わったこの秋で驚くべきことは、その期間です。世界最大かつ最も強力な企業の 1 つのサービスが 6 時間もアクセスできないなんて、どうしてあり得るでしょうか?これは誰もが自問してきた疑問です。技術的なことを隅々まで理解していないユーザーの頭の中では、インターネットは実際ほど脆弱であるはずがありません。
Facebook崩壊の鍵
会社のアプリケーションとサービスにアクセスできなくなるとすぐに、 Cloudflare は、自社のドメイン ネーム システム (DNS) が IP アドレス インフラストラクチャとともに機能しなくなったことを発見しました。 「誰かがサーバーのケーブルを引っ張ったようなものだ」と同社はブログで述べている。
DNS は、Web ページの名前を実際のアドレス、つまり IP アドレスに変換する一種のインターネット電話帳です。これは、ユーザーが facebook.com のような単純な名前の代わりに一連の数字を覚えないようにするために使用されます。ユーザーが Web サイトにアクセスしたい場合、DNS は宛先を見つける責任を負います。これらは、人間が理解できるアドレスをマシンが理解できるアドレス (クライアント-インターネット-サーバー) に変換する責任があります。
サービスは IP アドレス経由でも追跡できないため、問題は上位層にありました。
ただし、サービスは IP アドレス経由でも追跡できないため、問題は上位層にありました。これはボーダー ゲートウェイ プロトコル (BGP) にありました。 BGP は、インターネット ネットワークを接続する自律システムの背後にある鍵です。その役割は、通過可能なルートを常にリストすることです。つまり、DNS はどこに行きたいかを示し、BGP はどこに行くかを示します。すべてを機能させる大きなインターネットルーターは、たどるべきルートのリストを常に更新しています。 BGP により、ネットワークのネットワークが可能になり、Facebook ネットワークがインターネット上に存在し、世界中のどこからでもアクセスできるようになります。
Facebookは設定ミスのため、新たなルートを発表した。これらにはアクセスできず、実際的な目的のために、同社はインターネットから切断されました。この問題は、新しい設定を元に戻せばすぐに解決できたかもしれませんが、Facebook ネットワーク全体が機能していないためにそれは不可能でした。サーバーには物理的にアクセスする必要がありました。しかし、何人かのジャーナリストが報告しているように、オフィス内の出入りのアクセスさえもネットワークに依存していました。
解決策は?押し入る
世界最大手の企業の 1 つのオフィスは、社内通信ネットワークを使用できず、変更を元に戻すことができるコンピューターにアクセスできない状態で何時間も過ごしていました。データセンターに物理的にアクセスできるようになるまでは。
最初の情報は、事件解決の担当者が部屋にアクセスするためにロタフレックスまたはアングルグラインダーを使用する必要があることを示していました。この情報はニューヨーク・タイムズのジャーナリスト、マイク・アイザック氏によってすでに否定されており、訂正を発表しているが、フェイスブックが望んでいる可能性のある公の場で匿名で発言した従業員の証言である。同社がここ数日さらされている厳しい監視の真っ只中に、悲惨で滑稽な状況を認識するのは適切ではない。公式には「物理的安全」による困難があったと認められている。
同社は問題解決から数時間後に原因を説明する次の声明を発表した。
「この障害の根本的な原因は、私たちが日常業務で使用している多くの内部ツールやシステムにも影響を及ぼし、問題を迅速に診断して解決する試みを複雑にしました。
当社のエンジニアは、データセンター間のネットワーク トラフィックを調整するルーターの構成変更により、この通信を中断する問題が発生したことを知りました。このネットワーク トラフィックの中断は、データセンターの通信方法に連鎖的な影響を及ぼし、その結果、サービスが中断されました。これらはオンラインに戻り、通常の動作に戻すために積極的に取り組んでいます。
現時点では、この機能停止の根本原因は不完全な構成変更であると考えていることを明確にしておきたいと思います。 「また、この機能停止の結果、ユーザーデータが侵害されたという証拠もありません。」
世界が 1 つの企業に依存しているとき
ロタフレックスのおかげで何千人もの人々が再び通信できるようになった、あるいはビジネスを継続できるようになったというのが本当かどうかは別として、この状況は重要な議論を再び始めている。つまり、インターネットのほぼ全体、ひいては社会がロタフレックスを中心に展開するのが適切なのかということだ。単一の会社ですか?
明らかになりつつある複数の研究によれば、二極化が促進する明白な問題やユーザーの精神的健康への悪影響だけではなく、徐々にFacebook がユーザーが見ているものの所有者になってきているという事実もある。そして国民はインターネットや世界最大の通信チャネルである WhatsApp を介して消費しています。
ひいては、それに依存する企業がますます増えています。サービスをコンテンツへのゲートウェイとして使用するデジタル メディア、サービスをショーケースとして使用する店舗、またはメッセンジャーを介して注文を管理するレストランのオーナー。過去にそれらが提供していた利便性と即時的な利益は、今ではたとえ 6 時間であっても数百万ドルの損失となり、私たちの生活の多くは不適切に配置された数行のコードに依存しているのではないかという感覚に変わります。
参考資料一覧
- https://unsplash.com/@gregbulla?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
- https://twitter.com/MikeIsaac/status/1445196576956162050
- https://unsplash.com/@brett_jordan
- https://blog.cloudflare.com/october-2021-facebook-outage/
- https://engineering.fb.com/2021/10/04/networking-traffic/outage/
- https://unsplash.com/s/photos/facebook?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText
