データセンターのネットワーク変革における第2のサイン(兆候)は、コア&ポッド型の設計原理を取り入れたトポロジです。ポッドはそれ自身にコンピューティング、ネットワーク、およびストレージを包括しており、完結型のユニットで、“ポッドネットワーク”と同意義です。一方、従来型のネットワーク設計のほとんどはN列のラックから成る(N-tier)階層型トポロジ(下図参照)がベースとなっており、20年間に及ぶアーキテクチャを前提に基盤が作られてきました。データセンターネットワークにおけるトラフィック処理がEast-Westのものにシフトするにつれて、N-tierアーキテクチャは極めて過剰収容(オーバーサブスクライブ)の高いネットワークとなり、アプリケーションのパフォーマンスに影響を与えると共に、悪夢のような耐障害性の低さで、時間のかかる複雑なトラブルシューティング作業が発生してしまうようになりました。そこで巨大クラウド企業は、次のような課題に向けて別のモデルが必要だと考えたのです。

  • 高パフォーマンスでオーバーサブスクライブされない、あるいはバイセクションバンド幅(bisectional bandwidth)のネットワークの導入
  • 運用の簡素化と耐障害性の向上
  • 現実的なスケールアウト設計
  • ポッド単位で迅速なイノベーションの実行
  • 供給ベンダーの選択

巨大クラウド企業は、次の2つのアーキテクチャ原則(下図参照)を採用することで、これらの課題に取り組んでいます。

  • リーフ/スパイン型CLOSファブリックをベースとしたポッド設計により、オーバーサブスクリプションを極力排除し、トラフィックの需要予測性を向上させ、耐障害性を確保する強力なマルチパス処理能力を備えること。そして、ファブリックトポロジは、スパインまたはリーフスイッチを追加するだけで容易に拡張可能なこと。

“スパインコア”とも呼ばれるコアを介したポッド間の相互接続により、ポッドを追加するだけでデータセンター全体のスケールアウトが容易に実現できること。

N-Tier Graphic 

 

コア&ポッド型設計を採用した巨大クラウド企業のデータセンターの実例はあるのか?

FacebookのAltoonaデータセンターについて、「次世代Facebookデータセンターネットワークであるデータセンターファブリックの導入」を参照(URLリンク:英語)いただくとわかるように、48個のリーフスイッチと4個のスパインスイッチを束ねたポッド設計(下図参照)を採用しています。

Top Switches 

同様に、Googleは10年以上にわたって多層CLOSファブリックアーキテクチャに関するイノベーションを行い、最新の第5世代Jupiterデザインも公開しています(参照:「Open Networking Summit 2015での講演記録」、および2015年に公開された論文「Jupitar Rising」、その論文の“サマリー記事”)。

 

この第2のサインは次の観点からネットワーク変革であるといえるか?

  • 技術やアーキテクチャを構築するための土台になっているか

これは、明らかにアーキテクチャについてです。

  • 大きな変化を起こそうとしているか?

コア&ポッドは確立された設計であり、従来のN-tierアーキテクチャよりもはるかに優れています。

  • 市場の牽引性があるか?
数千社の顧客がすでにデータセンターの本番環境でこの設計を採用しています。

 

多くのIT組織でもコア&ポッド型設計が採用されているのか?

すべてではないにしてもデータセンター刷新のほとんどのケースで、コア&ポッド型設計への移行が進んでいます。4ラック程度の新しいアプリケーション環境の構築でも、その多くが既存のL3コアに接続されたポッドとして導入されています。市場調査会社もまた、巨大クラウド企業が実践するデータセンターネットワーク設計をお客様が取り入れるように提言しています。Gartnerは、2020年までに世界の企業の40%がWebスケールのネットワーク構想を持つようになると予測しています。

PODベースの設計は、DC障害ドメインの限定にどのように役立つのか?

各ポッドは明確な障害ドメイン(またはBlast Radius:障害の影響範囲)が決まっているため、障害によってデータセンター全体が停止することはありません。ポッドのサイズによって、障害の影響範囲が決まります。例えば、16ラックのポッドが32個のリーフスイッチ(ラックごとに2重のリーフスイッチ)と2~4個のスパインスイッチ(オーバーサブスクリプションのレベルに基づいて)を持つとします。この設計では、600台以上のサーバー(ラックごとに40台のサーバー)と18,000台以上の仮想マシン(サーバあたり30台の仮想マシン)をサポートしています。多くのIT組織では通常、200~500台のサーバー、または5,000~10,000台の仮想マシンを障害影響範囲(Blast Radius)の規模としています。

コア&ポッド型設計によって、迅速なイノベーションとベンダー選択を実現できるか?

ポッドはネットワーク単位の完結型ユニットであるため、その時点で利用できる最新のテクノロジーを採用した設計をすることもできます。場合によっては、異なるネットワーキングベンダー製品で異なる世代のポッドが、同じデータセンター(前図参照)に存在し、同じコアネットワークに接続されます。最新技術を取り入れた新しいポッドは、ブラウンフィールドのデータセンターでも簡単に設置できます。コア&ポッド型設計により、他のデータセンターアプリケーションに影響を与えることなく、ポッドを撤去することも容易です。結果として、7年にも及ぶ旧来のN-tier型設計によるロックインがなくなり、そしてかつ、大きなイノベーションの欠乏の問題と、ネットワークの発展の障害を解消することになるのです。

Big Switchはポッドベースのアーキテクチャをどのように採用しているのか?

Big Switchのデータセンター向けスイッチングファブリックであるBig Cloud Fabric(BCF)は、オープンネットワーキングスイッチをベースとしたポッドファブリックとして、設計・開発されています。その設計は、Big Switchのクラウドファーストネットワーキングを第一とする哲学の一環として行われています。BCFは1つのリーフスイッチから構築することができ、最大128個のリーフスイッチと12個のスパインスイッチからなる非常に大きなポッドファブリックに拡張できます。さらに100%ゼロタッチ運用を実現しており、スイッチをラックに取り付けてケーブル接続し、電源を入れるだけで簡単に完了できます。BCFはファブリック内のすべてのスイッチにNOS(ネットワーク オペレーティングシステム)ソフトウェアを自動インストールし、L2/L3ファブリックを自動形成し、トラフィックを転送できるようにスイッチを自動的に構成します。140台で構成されるスイッチファブリック全体のソフトウェアアップグレードでも、アプリケーションを中断することなく約15分で完了できます。

データセンターで新規のネットワークを構築する場合、コア&ポッド型の設計は必須になるでしょう。それがなければ、データセンターのネットワーク変革に対する投資を正当化するのは難しいでしょう。


 

プラシャント・ガンジー(Prashant Gandhi)

Big Switch Networks, Inc.

副社長 兼 最高製品責任者(Vice President & Chief Product Officer)

 

プラシャント・ガンジーは、Big Switchのプロダクトマネジメント、製品マーケティング、技術パートナーシップ/ソリューションおよびテクニカルマーケティングなど、クラウドファーストネットワーキングを実現する同社の製品ポートフォリオ全体の戦略を指揮しています。これまでも、主力製品であるBig Cloud FabricとBig Monitoring Fabricの製品戦略・開発に貢献してきました。また、Big Switch Networks主導のオープンソースイニシアティブ、Open Network Linux(ONL)の責任者として、オープンネットワーキングの普及とユーザー企業のハードウェア選択肢の拡大を目指しています。