オブジェクトストレージで賢いAI(人工知能)を創る

AI(人工知能)や機械学習の登場は、PCが行った過去20年間のように、ビジネスの世界をまったく違う姿にするでしょう。企業は膨大なデータを集め、保存し、機械学習に使い、ビジネスや消費者ニーズに正確にマッチしたリアルタイムな決定をするAI活用型に変貌してゆきます。私たちは、既にアマゾンのようなショッピングサイトにおけるリコメンデーションや、東京で行われている車種にマッチした広告を配信するデジタルビルボードで、この事例を目にしています。しかし、これは単なる始まりに過ぎません。これからAIがビジネスの世界をどう変革するかは、誰もわかりません。それは、PCが引き起こしている、限りない変化と同じことです。

トレーニングデータがAI対応の鍵

AIと機械学習はトレーニングデータの質と量で決まります。図書館で育てられたIQの高い子供は、情報が与えられず育つよりも遥かに知識が多いでしょう。ビジネスに価値あるAIのために、ストレージ業界は重要な役割を果たします。よりインテリジェントな技術に力を入れるということは、膨大な非構造化データを蓄えておかねばならないことを意味するからです。AIソフトウェアを搭載した強力なコンピューターは、トレーニング過程のデータを処理します。トレーニング終了後、AIソフトウェアが創造した「知能モデル」は効率性が検証されます。それを改良する次のトレーニングを実行するためには、追加データを集め、既存データを再構成します。

ひとつの例ですが、特定の車種を自動認識するディープラーニングのソフトウェアをトレーニングするためには、数千枚の画像に車種名のタグを付けなければなりません。同じくらい重要なことは、他の車種は違うと教えるために、他の車種数千枚の画像にもタグ付けをすることです。つまり、学習の効率性は、完全にトレーニングデータに依存するのです。

同様に、ビジネスのノウハウや知財といったデータは、AIの世界における重要な差別化要因になります。ビジネスにおいては、トレーニングデータを他の重要機密情報と同様に保護しなければなりません。

そのため、AI対応する企業は、以下が必要です。
1. 膨大な非構造化データを経済的に保存できる
2. データの追加と変更を簡単にできる
3. トレーニングに役立つ属性情報をデータにタグ付けする
4. AIツールがサポートする業界標準API経由でデータにアクセスできる

完全S3互換のスケールアウトオブジェクトストレージは、この要求を完全に満たしています。

多くの企業にとって、AIと機械学習は真新しいものです。しかし、データを保管し増やし続けることは、いまから始めることが重要です。AI技術を活用する体制ができたとき、トレーニングに使える数年に及ぶ履歴データがあれば、ゼロから始める企業のはるかに先行します。そのデータが、すでにS3互換スケールアウトオブジェクトストレージにあれば、全く保存していない、若しくは伝統的なストレージサイロに保管されたデータよりも、迅速にAI技術の恩恵を得られます。

オブジェクトストレージの優位性

スケールアウトオブジェクトストレージは、機械に学習させるデータの保存・管理に優れています。低コストで単一のネームスペースに全てのデータを保管できます。オブジェクトストレージであれば、データにメタデータでタグ付けできます。このことは、機械学習において重要な要素です。さらにS3 API互換性があれば、新しいツールをオープンに利用できます。

AIと機械学習の技術は、PCが促進した電子メール、オフィスの生産性向上アプリ、インターネット、クラウドのように、私たちが今日には想像もできなかったユースケースの本流となります。インターネットや検索エンジンはすでに私たちが何が欲しいか考えて検索語を探します。それは、検索と購買履歴、すなわち何を検索し、結果として購入したかを知っているからです。

5~10年後、AI対応していない企業は、PC採用が遅れた企業のような末路を辿るでしょう。AIは新たな規範となり、顧客に関する重要なビジネスインテリジェンスとアプローチ方法を提供します。

AIか機械学習の取り組みにおいては、企業活動における履歴データが将来における最大の差別化要因になります。履歴データの学習は、明日のAIエンジンを育てます。それはデータが保管され、簡単に利用できることが条件です。ITの世界は常に動いており、AIに使い易いデータを持っていることが勝者への道なのです。

本投稿は、2017年4月14日のinside BIGDATAにおけるMichael Tsoへのインタビュー記事の抄訳です。