オブジェクトストレージ vs ファイルストレージ: 何が違うのか?

ファイルストレージにおいて、ファイルはディレクトリとサブディレクトリで階層構造に整理されます。容量が増えるにつれて、ファイルモデルは2つの理由から厄介になります。まず、パフォーマンスが一定の容量を超えると低下します。 NASシステム自体の処理能力は限られているため、プロセッサがボトルネックになります。容量の増加に伴う大規模なデータベース(ファイルルックアップテーブル)もパフォーマンスに影響します。オブジェクトストレージは、基本的にメタデータ・タグと一意の識別子とともにデータ自体をバンドルします。メタデータはカスタマイズ可能です。つまり、データごとに多くの識別情報を入力できます。これらのオブジェクトは、フラットなアドレス空間に格納されているため、リージョン間でデータの検索と取得が容易になります。このフラットなアドレス空間はスケーラビリティにも役立ちます。ノードを追加するだけで、ペタバイトを越えて拡張できます。

オブジェクト ストレージは 90 年代半ばから存在していますが、比較的新しく、ブロック ストレージやファイル ストレージなどの他のストレージ タイプとの違いについて混乱することがあります。

ファイルストレージとは何ですか?

ファイル ストレージはオブジェクト ストレージよりもはるかに古く、ほとんどの人がよく知っています。ファイル/データに名前を付けてフォルダーに配置したり、多くのフォルダーを作成したり、パスを設定したりできます。このように、ファイルはディレクトリとサブディレクトリに階層的に編成されます。各ファイルには、ファイル名、作成日、最終更新日などのメタデータも関連付けられています。

これはある程度までは非常にうまく機能しますが、容量が大きくなると、2 つの理由でファイル モデルが厄介になります。
まず、特定の容量を超えるとパフォーマンスが低下します。
NAS システム自体の処理能力は限られているため、プロセッサがボトルネックになります。 容量が増加するにつれて大規模なデータベース (ファイル参照テーブル) もパフォーマンスに影響します。

 

オブジェクトストレージとは?

オブジェクト ストレージは基本的に、メタデータ タグと一意の識別子と共にデータ自体をバンドルします。メタデータはカスタマイズ可能です。これは、各データに対して多くの識別情報を入力できることを意味します。これらのオブジェクトはフラットなアドレス空間に格納されるため、リージョン間でのデータの検索と取得が容易になります。
このフラットなアドレス空間は、スケーラビリティにも役立ちます。ノードを追加するだけで、ペタバイトを超えて拡張できます。

 

オブジェクトストレージとファイルストレージの違いは何ですか?

オブジェクト ストレージとファイル ストレージの基本を理解したところで、主な違いをいくつか見ていきましょう。

まず、オブジェクト ストレージには、ファイル ストレージが直面する多くの制限がありません。ファイル ストレージを倉庫と考えてください。ファイルの箱を最初にそこに置くと、十分なスペースがあります。しかし、データの需要が高まるにつれて、倉庫がいっぱいになることに気付くでしょう。一方、オブジェクト ストレージは、屋外倉庫のようなものです。無期限にデータを追加し続けることができます。限界は空の大きさです。
小さなファイルや個別のファイルを主に読み取る場合、ファイル ストレージは適切に機能します (特に、データ量が比較的少ない場合)。しかし、規模が大きくなると、「必要なファイルをどのように検索すればよいか」と考えるようになります。
オブジェクト ストレージはバレット パーキングと考えることができますが、ファイル ストレージはセルフ パーキングに似ています。車を小さな駐車場に駐車すれば、自分の車がどこにあるか正確にわかります。しかし、駐車場が何千倍も大きいと想像してみてください。車を探すのは大変です。
オブジェクト ストレージにはカスタマイズ可能なメタデータがあり、すべてのオブジェクトはフラットなアドレス空間に存在するため、車のキーを係員に渡すようなものです。車はどこかに保管され、必要なときに係員が車を持ってきてくれます。車が到着するまで時間がかかる場合がありますが、周りを気にする必要はありません。

 

オブジェクト ストレージ メタデータ

X 線を撮影して、メタデータが役立つ実際の例を説明しましょう。 X 線の「ファイル」には、作成日、所有者、場所、サイズなど、関連するメタデータが限られています。一方、X 線の「オブジェクト」は、さまざまなメタデータ情報を持つことができます。
そのメタデータには、患者の名前、生年月日、怪我の詳細、ファイル内の同じタグ、さらに身体のどの領域が X 線で撮影されたかなどが含まれます。これは、医師が関連情報を参照するのに非常に便利です。

IoT+ビッグデータ+AI連携についてJDMC 2017で講演しました

3月8日に目黒雅叙園で開催された「データマネジメント2017~データが繋ぐ共創社会~」で講演をしました。クラウディアンはストレージ製品を開発提供している会社です。そのため、いつもは「ストレージ」をテーマにしたイベントやセミナーに出展し、講演することが多いのですが、今回は「データマネジメント」がテーマです。

クラウディアンが電通様と実施したIoT+AIを使った実証実験や米国カリフォルニア州モンテベロ市における市営バスに設置されたビデオカメラ映像をリアルタイムでストレージする採用事例などをご紹介し、これからは「IoT、ビッグデータ、AI」が相互連携してゆくことは必然というメインのメッセージをお話ししました。

それは、IoTはモバイルネットワークが整備され、デバイスが小型化・多様化し、インダストリー2.0のように産官学で普及を促進しています。このIoTは人間が生み出すデータと違い、24時間365日休まず送り続けられるセンサーのログや監視・モニターカメラからの映像や画像です。そのため、従来の想定をはるかにこえるデータ量、すなわちビッグデータとなります。このビッグデータは人間が扱える量を越える規模です。そのため、このビッグデータを分類整理するためAIを活用するようになります。

すなわち、IoTはビッグデータを生み、AIがビッグデータを使い易いスマートなデータにするということです。

しかし、AIのなかでも最近注目を集めるディープラーニング(深層学習)は、従来のマシンラーニング(機械学習)とは異なり、大量のデータを学習することで、高い認識精度を得ることができるようになります。つまり、AIにはビッグデータが必要なのです。そして、当然のことながら、ビッグデータを集めるためにはIoTが不可欠です。

このように、IoT、ビッグデータ、AIは、これからの時代それぞれが相互依存し切り離せないものになるということです。

ここまでの内容をご紹介したのが、このスライドです。

本講演は、ITLeaders記事でも紹介されています。ぜひご覧ください。

http://it.impressbm.co.jp/articles/-/14382