イーロン・マスク最高経営責任者(CEO)が全従業員7500人のうち半数をレイオフ(一時解雇)したわずか数時間後、ツイッターの異変を示す小さな兆候が一部のユーザーに目撃されていた。
異変が起きたのは「リツイート」だ。ツイッターは2009年に公式リツイート機能を導入した。「RT(リツイートの略)」という文字の後に他人のユーザー名とツイートをコピーしたものを貼り付けるという、すでにユーザー間で自然発生的にされていた慣行を、ソフトウェアの機能として追加したのだ。それ以来、リツイートとその仲間である「引用ツイート」(2015年4月に開始)は、ツイッターでよく使われる2大機能となった。
だが、11月4日にリツイート・ボタンを押した少数のユーザーは、時が2009年にさかのぼるのを目にした。「手動リツイート」と呼ばれていたものが復活したのだ。
手動リツイートの復活は、マスクCEOがユーザーを喜ばせるために実装した最新の試みではない。初めて公然となったツイッターの巨大なコード基盤における亀裂であり、今後大地震が発生することを警告する地震計の微動のようなものだ。
ツイッターのような巨大テック・プラットフォームは、相互依存する非常に多くのパーツで成り立っている。「壊滅的な大規模障害の方が興味をそそりますが、最大のリスクは小さなパーツが劣化し始めることです」と語るのは、テック業界で20年以上のキャリアを持ち、サイト信頼性エンジニアリング(SRE)が専門のベン・クルーガーだ。「プラットフォームは非常に大規模で、非常に複雑なシステムなのです」。クルーガーによると、ツイッターのスタッフによる2017年のあるプレゼンテーションの中に、ツイッターのバックエンド・インフラの半分以上がデータの保存に特化されていることを示す統計があったという。
マスクCEOに対して批判的な人の多くは、ツイッターが水素爆弾の爆発レベルの破壊を経験することを望んでいるかもしれないが、ツイッターのような巨大プラットフォームの崩壊は徐々に起こる。分かっている人にとっては、徐々に起こる障害は、より大きなクラッシュが差し迫っている可能性を示す不吉な兆候だ。そして今、それが起きているのだ。
小さな問題
手動リツイートが一瞬表示された後、ゆっくりと標準的な表示形式へと変わったり、ツイッター・アプリがフォローしていると思っている人たちの意志とは無関係にフォロワー数を増減させたり、あるいは単に読み込み拒否のリプライが届いたりなど、ツイッターの端々に小さなバグが発生している。さらに、マスクCEOが11月7日にリンクを貼ったツイッターのルールでさえ、数百万人の注目を集めたことによる負荷で一時的にオフラインになった。要するに、ツイッターの信頼性が低下しているのだ。
「おかしな通知が届くことがありませんか?」 現在もツイッターで働くあるエンジニアは言う。このエンジニアは、ツイッターの円滑な運営に従事していた同僚たちが大量にレイオフされた後、同社のプラットフォームの反応に懸念を抱いている(このような内容のため、以降、ツイッターで現在も働いているこのエンジニアを匿名エンジニアと呼ぶ)。(かつて処理能力の限界を超えたときに表示していた)「クジラ時代」にダウンタイムに悩まされた後、ツイッターは最終的にSREチームのおかげで称賛されるようになった。しかし、SREチームはマスクCEOの買収直後に大幅縮小された。「現時点では小さな問題です。しかし、安定とは小さな問題の解決の積み重ねなのです」と匿名エンジニアは話す。
何か問題があるというちょっとした気配は、時間の経過とともに増幅するだろうと匿名エンジニアは予測している。というのも、この問題を処理するために残された最小限のSREスタッフでは、すぐに燃え尽きてしまうからだ。「24時間体制の作業は品質に悪影響を及ぼします。すでにその悪影響が現れているようです」と匿名エンジニアは言う。
ツイッターに残ったエンジニア・チームは、新CEOとなったマスクがコード基盤を維持するスタッフの大規模削減を決定したため、この数日間はサイトの安定を保つことを主な任務としてきた。しかし、同社が表面的には平常に戻ろうとする中、エンジニア・チームの時間の多くは、既存のものを動かし続けるよりも、新しい製品や機能に関するマスクCEOの(しばしば負担になる)気まぐれに対応するために費やされている。
その点が特に問題だとクルーガーは考えている。ツイッターのようなサイトでは、ユーザーのトラフィックや関心が不定期に急上昇することがあるからだ。クルーガーは、ブラック・フライデーのようなトラフィックが急増するイベントをある程度予測して備えられるネット通販サイトになぞらえてツイッターを説明する。「ツイッターの場合、いつ何時でもブラック・フライデーのようなイベントが起こる可能性があります。ある日突然、ツイッター上の会話に大きな影響を与えるようなニュースが起こる可能性があるのです」。SREスタッフが最大80%レイオフされると、その対応は難しくなる。クルーガーによると、この80%という数字は業界内でよく言われている数字とのことだが、MITテクノロジーレビューは確認できていない。匿名エンジニアは、80%は「妥当」な数字だろうと同意している。
匿名エンジニアは、レイオフを撤回する以外に、この問題から抜け出す道はないと考えている(同社はすでに、レイオフの一部撤回を試みていると報じられている)。「もし会社が猛烈なスピードで(レイオフや新機能の搭載を)押し進めていくのであれば、(プラットフォームは)壊れてしまうでしょう。それを回避する方法はありません。技術的負債は以前よりもはるかに急速に蓄積されており、金融負債の蓄積とほぼ同じ速さで進んでいます」。
バックログが長くなる
匿名エンジニアは、保守作業と修正の未処理が多くなり、問題が山積みになる暗黒の未来を示す。「障害が発生します。障害の頻度は増え、その期間は長くなります。そして、より深刻な障害が発生するようになるでしょう。すべてが悪化し、最終的には使えなくなってしまうでしょう」。
匿名エンジニアは、ツイッターが崩壊して使い物にならなくなるのはまだ先の話だと言うが、プロセスが腐敗し始めていることを示す明確な兆候はすでに現れている。それは小さな問題から始まる。「使っているクライアントのあらゆる部分に、使おうとしているバックエンドのあらゆるサービスに、バグがあります」と匿名エンジニアは話す。「最初はささいな厄介事ですが、バックエンドの修正が遅れれば遅れるほど、やがて人々に見放されてしまうまで蓄積されるでしょう」。
クルーガーによると、ツイッターが瞬く間に消えることはないだろうが、読み込まれないツイートが増え、アカウントが気まぐれに作成されたり削除されたりするようになる可能性があるという。「バックエンドでデータを書き込んでいるものに、速度低下、タイムアウト、その他数多くの微妙で分かり難い種類の障害が発生すると思います」とクルーガーは言う。「そして、こうした障害は目立たずに悪化することが多いのです。また、一般論として、問題の追跡と解決にはより多くの労力が必要です。十分な数のエンジニアがいない場合、大きな問題になります」 。
手動リツイートの見え隠れやフォロワー数が少なく表示されるのは、この現象がすでに起きていることを示している。ツイッターのエンジニアたちは、機能が完全にオフラインにならないよう、代わりに縮小版を提供できるフェイルセーフ設計をしていた。現在目にしているのはその縮小板だ、とクルーガーは話す。
匿名エンジニアは、小さな不具合に加えて、1日最大300万ドルを回収しようという試みの一環として、ツイッターのクラウド・コンピューティング・サーバーの負荷の軽減というマスクCEOのコスト削減を推し進める動きのおかげで、近いうちに大きな障害が起こるだろうと考えている。マスクCEOの作戦本部から出されたこのプロジェクトは、「ディープ・カット・プラン(Deep Cuts Plan)」と呼ばれているとロイター通信は報じている。ロイター通信の情報筋の1人はこれを「妄想じみた」計画と評している。英国サリー大学でサイバーセキュリティを研究するアラン・ウッドワード教授は、「現在のシステムを大幅に過剰なスペックにしていない限り、論理的に考えれば容量と可用性が低下するリスクは当然あります」と述べている。
頭脳流出
一方、物事がうまくいかず問題が発生したとき、すぐにその問題を修正できるような組織的な知識は、もはや社内にはない。「私が見たところ、11月4日以降にツイッターを去った人の多くは、テック企業としては異例の長さになる、9年、10年、11年と働いてきた人たちです」と匿名エンジニアは言う。このような経験を積んだ人たちがツイッターを去ったとき、システムの仕組みに関する数十年もの知識も一緒に消えたのだ(ツイッター社内や外部で見守っていた人は以前、ツイッターの知識基盤は一握りのプログラマーの頭脳に過度に集中していると主張しており、そのうちの何人かは今回解雇されている)。
残念ながら、ツイッターに残ったチームによると、骨抜きにされたチームの中には、テクニカルライターのチームも含まれているそうだ。「(テクニカルライター・チームのおかげで)ツイッターは優れたドキュメントを作成できていました」と匿名エンジニアは言う。もう、それは期待できない。問題が発生したとき、何が起こったのかを突き止めるのが難しくなる一方だ。
同様に、外部とのやり取りも難しくなっている。MITテクノロジーレビューが取材したコミュニケーション・チームの元メンバーによると、80~100人いたチームのメンバーは、わずか2人にまでに減らされたそうだ。匿名エンジニアは、「(現在の)コミュニケーション・チームはやらなければならないことがあまりに多すぎますし、マスコミに対処するのに十分な言葉も持っていません」と言う。
MITテクノロジーレビューは、この記事についてツイッターに問い合わせのメールを送ったが、返信はなかった。
「マストドン(Mastodon)」に対するマスクCEOの最近の批判には、自らの欠点を忘れて他人を批判すべきではないと言える要素がかなりある。マスクCEOがツイッターを掌握してから数日間でユーザーが激増したマストドンは、ツイッターの代替手段となるオープンソース・ソフトウェアだ。マスクCEOは、「もし、ツイッターがもう嫌なら、『Masterbatedone(原文のママ)』という素晴らしいサイト(原文のママ)があります」とユーザーに伝える投稿をツイートし、すぐに削除した。その投稿には、ノーベル経済学賞を受賞したニューヨーク市立大学大学院センターのポール・クルーグマン教授のノートPCに表示された、マストドンへの投稿を何度も試みていることが分かる画面を撮影した写真が添えられていた。マスクCEOがマストドンの信頼性の低さを強調しようとしたにもかかわらず、マストドンの成功は目覚ましく、マスクCEOがツイッターを買収して以来、50万人近くがこの連合型ソーシャルネットワーク・サービスに新規登録している。
ツイッターの構造に最初の亀裂が現れ始めたのと同時に、そうした動きが起こっている。それはほんの始まりにすぎないとクルーガーは考えている。「6カ月以内に、ツイッターのテクノロジーの重大な問題に、一般ユーザーが気づき始めると思います」とクルーガーは言う。「6カ月というのは、甘い見積もりのようにも思いますがね」。