今は固定回線だけでなくスマホの無線通信が主流になっているインターネット。
とはいえ、ISPや携帯キャリアのネットワークオペレーションセンター(NOC)の中はどうなっているのか、具体的に語られることは少ないです。
特にITや通信は「秘密」のウエイトが大きい。
メディアの取材に応えて内部の写真が公開されることはありますが中の状況はよく分かりません。
今回は、NOCの作業経験がある筆者がNOCで何が行われているのか、作業内容や雰囲気を解説します。
もちろん書くことができる範囲は限られますが、ユーザーが普段使っているネット運用管理の実際はどうなのかイメージできると思います。
目次
ネットワークオペレーションセンターの中はどうなっている?
NOCの中はどうなっているのでしょうか。
NOCの話をする人は少ない
メディアのNOC取材はわりとあって、ドコモは結構プレス向けの見学会をやっていますね。
先日も「NTTドコモがネットワークオペレーションセンターをメディアに公開」の記事がありましたし、NOCの画像を検索すれば出てきます。
とはいえメディアの取材では分からないことが多い。ITインターネットの分野は情報の秘匿に気を遣うし情報漏洩に敏感ですからね。
NOCの雰囲気
筆者が参画していたNOCは固定回線の運用で、雰囲気は普通のオフィスと同じ。静かに作業をやっています。
ディスプレイでモニタリングしている現場はNOCらしいですね。作業と管理事務は別々のフロアでした。
中の人はネットワークエンジニアだったり、技術的ではない仕事だったり色々。
今のNOCは運用のためにSNSをしっかりチェック。ユーザーの皆さんのポストはしっかりとNOCの監視対象になっていますので。重要度高めの業務。
作業端末には障害時に光るパトライトが設置されていることもあります。緊急車両で使われるあれですね。
普段は運用と計画作業をやっている
NOCがやっていることはたくさんありますが、ネットワークを計画断→ネットワーク機器へのコンフィグ投入といった作業をよくやります。
コンフィグとはCiscoルーターやスイッチに設定するデータのことで、running-configやstartup-configと呼ばれるもの。
計画的に回線を止めて事前に作ったコンフィグをTera Termなどのターミナルソフトで流し込む作業をします。
影響が小さな箇所は夜間ではなく昼でも作業。
そして物理的な工事はベンダーがやっていて、NOCが電話で指示しながら工事します。
日常的にはコマンドでチェック作業とか。多くの現場がUNIX/LinuxとCiscoなどのネットワーク機器を使っています。
障害発生時は空気が変わる
普段は落ち着いて作業していますが、障害が発生すると空気が変わる。
電話しながら状況をエスカレーションしたり、監視に使う作業用端末に人が集まって対応する状況は蜂の巣をつついたようになります。
ここでエスカレーションされた内容を元に何が問題なのか把握して対応。機器の再起動はよくやる手段ですね。
この状況は社員がキツい。協力会社の人間とは責任が違うので対応をミスするわけにいかないからです。
ヒューマンエラーが起こると会議
ヒューマンエラーとは、つまりオペレーションの操作ミスなど人間が起こす事故のことですね。
どうしても作業でミスが出る。1年間で何件ヒューマンエラーが発生したか貼り紙を貼って注意喚起しています。
ヒューマンエラーで事故が起こると会議を実施。この会議が重く、グループの前でエラーを起こした担当者が事故の原因を説明しないといけません。
こういうことは通信キャリアだけでなく一般的な業界でもやっていると思います。日本の品質管理は厳しく、いい加減な作業はできませんからね。
NOCのおかげでユーザーの日常がある
スマホやクラウドでトラフィックが増えたので以前より運用がシビアになっていると思います。
特にモバイルネットワークは大規模通信障害を起こすと社会に与える影響が大きいですよね。緊急通報がやりにくくなるなど、ユーザーからのクレームも大きくなる。
とはいえ普段NOCと協力会社がネットワークを運用してくれているので、ユーザーがWebを見たり買い物したりする日常があります。
インターネットだけじゃないですけどね。救急医療やコンビニのようなインフラを誰かがやってくれているので便利な社会ですよね。
KDDIのNOCは新宿から多摩に移動
かつてKDDIのNOCは新宿のKDDIビルにありましたが現在は多摩に移転したようです。
新宿KDDIビルは築年数も古いですし高層でフロアも多く複雑。エレベーターは長時間待たないといけません。
多摩は最新型のビルで広々として環境も良さそう。
運用はかなり自動化したようです。対応が属人的になると知識経験がある人がいなければ対応できないので自動化は必然的な流れ。
とはいえ、2022年夏にあったauの大規模なネットワーク輻輳(ふくそう)はシビアな状況だったと思います。本当にお疲れ様でした!
NOCありがとう
なかなかNOCで働く機会がある人は少ないと思うので貴重な経験でした。個人的には当時まったく別の問題で感情的になってしまってやめたのですが。
今はトラフィックが多くなり自然災害も多くなりといった状況。運用自体も自動化を進めて変わりました。
つまりユーザーがお茶を飲みつつネットができるのは、NOCの中の人、ベンダーの中の人、協力会社が頑張っているからですね。
現在はシビアな状況になっているので大変だと思われます。特にヒューマンエラーがキツいですね。
なのでユーザーは通信キャリアのNOCに感謝し、NOC含めてネットワーク時代を生き残れるようにこれからも頑張りましょう。