オブジェクトストレージ vs ファイルストレージ: 何が違うのか?

ファイルストレージにおいて、ファイルはディレクトリとサブディレクトリで階層構造に整理されます。容量が増えるにつれて、ファイルモデルは2つの理由から厄介になります。まず、パフォーマンスが一定の容量を超えると低下します。 NASシステム自体の処理能力は限られているため、プロセッサがボトルネックになります。容量の増加に伴う大規模なデータベース(ファイルルックアップテーブル)もパフォーマンスに影響します。オブジェクトストレージは、基本的にメタデータ・タグと一意の識別子とともにデータ自体をバンドルします。メタデータはカスタマイズ可能です。つまり、データごとに多くの識別情報を入力できます。これらのオブジェクトは、フラットなアドレス空間に格納されているため、リージョン間でデータの検索と取得が容易になります。このフラットなアドレス空間はスケーラビリティにも役立ちます。ノードを追加するだけで、ペタバイトを越えて拡張できます。

オブジェクトストレージは、90年代半ば以降から存在していますが、比較的新しく、ブロックやファイルストレージなど、他のストレージタイプとの違いについて混乱が生じることがあります。

ファイルストレージとは?

ファイルストレージは、オブジェクトストレージよりもかなり歴史が古く、ほとんどの人がよく知っているものです。ファイル/データに名前を付けてフォルダに配置し、多くのフォルダを作り経路を設定することができます。このようにして、ファイルはディレクトリとサブディレクトリで階層構造に整理されます。各ファイルには、ファイル名、作成日、最後に変更された日付などに関連付けられたメタデータも含まれています。

これはあるところまでは非常にうまく機能しますが、容量が増えるにつれて、ファイルモデルは2つの理由から厄介になります。まず、パフォーマンスが一定の容量を超えると低下します。 NASシステム自体の処理能力は限られているため、プロセッサがボトルネックになります。容量の増加に伴う大規模なデータベース(ファイルルックアップテーブル)もパフォーマンスに影響します。

 

それでは、オブジェクトストレージとは?

オブジェクトストレージは、基本的にメタデータ・タグと一意の識別子とともにデータ自体をバンドルします。メタデータはカスタマイズ可能です。つまり、データごとに多くの識別情報を入力できます。これらのオブジェクトは、フラットなアドレス空間に格納されているため、リージョン間でデータの検索と取得が容易になります。

このフラットなアドレス空間はスケーラビリティにも役立ちます。ノードを追加するだけでペタバイトを越えて拡張できます。

 

オブジェクトストレージとファイルストレージの違いは?

オブジェクトストレージとファイルストレージ、それぞれの基礎を理解したので、主要な違いのいくつかを見てみましょう。

まず、オブジェクトストレージは、ファイルストレージが直面する多くの制限がありません。ファイルストレージを倉庫と考えてください。最初、そこにファイルの箱を置くときには、十分なスペースがあります。しかし、データ需要が高まるにつれて、気が付けば倉庫は一杯になってしまいます。一方、オブジェクトストレージは、屋根の無い倉庫のようです。データを無限に追加し続けることができます。空の広さが限界です。

主に小規模または個別のファイルを読み出すのであれば、ファイルストレージはパフォーマンスを発揮します(特に、データ量が比較的少ない場合)。しかし、一旦規模が大きくなると、「必要なファイルをどうやって見つけようか?」と考え始めることでしょう。

オブジェクトストレージはバレットパーキングと考えることができますが、ファイルストレージはセルフパーキングに似ています。小さな駐車場に車を停車していれば、車がどこにあるのかが正確にわかります。しかし、その駐車場が何千倍も大きかったと想像してください。車を見つけるのは難しいですよね。

オブジェクトストレージにはカスタマイズ可能なメタデータがあり、すべてのオブジェクトはフラットなアドレス空間に存在するため、車の鍵を駐車係に渡すのと同じです。あなたの車はどこかに保管され、それが必要なときには、駐車係が車を運んできます。車の到着に少し時間がかかるかもしれませんが、探し回る心配はありません。

 

オブジェクトストレージのメタデータ

メタデータが役立つ現実的な例を、X線で説明しましょう。 X線の「ファイル」では、作成日、所有者、場所、サイズなど、関連するメタデータが限られています。一方、X線の「オブジェクト」は、豊富な種類のメタデータ情報を持つことができます。

そのメタデータには、患者の名前、生年月日、怪我の詳細、ファイルの同じタグに加えて、身体のどの領域がX線であったかなどが含まれます。これは、医師が関連情報を参照するために非常に便利になるはずです。

IoT+ビッグデータ+AI連携についてJDMC 2017で講演しました

3月8日に目黒雅叙園で開催された「データマネジメント2017~データが繋ぐ共創社会~」で講演をしました。クラウディアンはストレージ製品を開発提供している会社です。そのため、いつもは「ストレージ」をテーマにしたイベントやセミナーに出展し、講演することが多いのですが、今回は「データマネジメント」がテーマです。

クラウディアンが電通様と実施したIoT+AIを使った実証実験や米国カリフォルニア州モンテベロ市における市営バスに設置されたビデオカメラ映像をリアルタイムでストレージする採用事例などをご紹介し、これからは「IoT、ビッグデータ、AI」が相互連携してゆくことは必然というメインのメッセージをお話ししました。

それは、IoTはモバイルネットワークが整備され、デバイスが小型化・多様化し、インダストリー2.0のように産官学で普及を促進しています。このIoTは人間が生み出すデータと違い、24時間365日休まず送り続けられるセンサーのログや監視・モニターカメラからの映像や画像です。そのため、従来の想定をはるかにこえるデータ量、すなわちビッグデータとなります。このビッグデータは人間が扱える量を越える規模です。そのため、このビッグデータを分類整理するためAIを活用するようになります。

すなわち、IoTはビッグデータを生み、AIがビッグデータを使い易いスマートなデータにするということです。

しかし、AIのなかでも最近注目を集めるディープラーニング(深層学習)は、従来のマシンラーニング(機械学習)とは異なり、大量のデータを学習することで、高い認識精度を得ることができるようになります。つまり、AIにはビッグデータが必要なのです。そして、当然のことながら、ビッグデータを集めるためにはIoTが不可欠です。

このように、IoT、ビッグデータ、AIは、これからの時代それぞれが相互依存し切り離せないものになるということです。

ここまでの内容をご紹介したのが、このスライドです。

本講演は、ITLeaders記事でも紹介されています。ぜひご覧ください。

http://it.impressbm.co.jp/articles/-/14382