NetAppとAWS-広島大学との実証実験
本記事は、Amazon Web Serviceブログで公開された「NetApp ONTAP を使用してオンプレミスのデータを活用するための RAG ベース生成 AI アプリケーション」に関して、ネットアップ合同会社の視点での説明を行うものです。
前後編の2本立てとなっており、前編では前述のブログに関する補足として、企業でよく使われているファイルサーバー上にあるデータをどのように生成AIで活用するのか、また、そのデータをどのようにセキュアに守るのか、国立大学法人広島大学(以下、広島大学)ならびにアマゾン ウェブ サービス ジャパン(以下、AWSジャパン)と取り組んだ実証実験の背景、および情報インフラの指針について解説します。
後編では、広島大学との実証実験の中でAWSジャパンと共同で開発したソリューションについて、主にNetApp ONTAPの機能と共にご紹介します。
2022年11月にOpenAIが開発したAIによるチャットサービスChatGPTが公開されてから、生成AIに関する話題は尽きることがなく、最近も新しいモデルが登場したことや、高度な目標に基づいて複雑なタスクを自律的に推論、計画、実行するように設計された Agentic AIに関する動向など、インターネット上では毎日がお祭り騒ぎの様相です。従来から、画像分析やスパムメールの判定など、AIの技術の応用は一部では使われていたのですが、生成AIはなぜここまで盛り上がりを見せているのでしょうか。
一般的に、これまでのAI技術は特定の問題解決に特化したものを、専門のエンジニアやサイエンティストが開発したモデルをアプリケーションに組み込む形となり、どちらかと言えば専門性が高い領域でした。しかし、ChatGPTに代表されるようなTransformerモデルの場合、莫大な量のデータを学習させることで一般的な知識に基づく様々なタスクを扱うことができるようになりました。結果として、ChatGPTのような誰でも触って試せるUIが人気を集め、現在ではあらゆる人がAIを利用できる環境(=AIの民主化)が実現されたことが、一つの大きな理由でしょう。
また、Transformerモデルは、データ量・パラメーター数・計算量を増やしていけば、モデルの性能が上がっていくというスケーリング測が提唱されており、多くのIT企業がモデル開発に乗り出しています。今できないことであっても、1年後、いえ、数ヶ月後に出てくるモデルならできるようになっているという期待も、生成AIの盛り上がりの一助になっていると考えられます。
このように盛り上がりを見せる生成AIですが、一方で、企業での活用を見据えると、一般的な知識だけでは上手く活用できないというユースケースも多くあることが分かってきています。AIは作るにも、使うにも、データが必要となるものであり、企業内に含まれるデータをどのように活用すれば良いのか、悩まれている方々も多いことかと思います。
さらには、生成AIを企業内で活用することを考えると、セキュリティに関しても意識をする必要があります。実際、OWASPという団体が公開している「OWASP Top10 for LLM Application」や、経済産業省が公開している「AI事業者ガイドライン」においても、以下のような生成AIに関するリスクへの警鐘を鳴らしています。
本Blogでは、企業でよく使われているファイルサーバー上にあるデータをどのように生成AIで活用するのか、また、そのデータをどのようにセキュアに守るのか、広島大学ならびにAWSジャパンと取り組んだ実証実験をもとに、掘り下げていきます。
前述のとおり、生成AIの時代 においてはAIモデルの開発ならびにその利活用という2つの軸がありますが、そのどちらにおいても、インターネットに公開されていない社内情報などのいわゆるクローズドデータの重要度が増しています。
企業や組織のデータが蓄積されているのは社内のファイルサーバもしくはセキュリティ対策が施されたクラウド上であり、蓄積する場所に求められる課題としては、「ただデータを備蓄する・守るための容器としての役割であること」とともに、「AIの取り込みを素早く・燃費良く・安全に進めるためにデータを連携する供給装置としての役割であること」と考えます。
広島大学内においても、これら課題の重要性を認識されておりました。
これらの課題を踏まえて、広島大学 情報メディア教育センター 准教授 渡邉 英伸先生は、今後の大学における情報インフラが求められることとして、以下の点を挙げられています。
これらの方針については、VUCAと呼ばれる複雑かつ予測不能な現代において、各企業や組織が情報インフラに対して取り組む際の指針としても参考にしていただけるのではないかと考えています。
このような課題やこれからの情報インフラの指針をもとに、広島大学との実証実験を進める中で、データを既存のオンプレミスのストレージに保持したままAWS が提供する生成 AI 機能にてデータを活用するためのソリューションを AWSジャパン と NetApp の 2 社で開発しました。
開発にあたって考慮した点は、以下の2点です。
後編では、共同開発ソリューションならびにソリューション内で活用するNetApp ONTAPの機能についてご紹介します。
また、このソリューションの構築・利用を体験するためのハンズオンコンテンツも作成しています。ソリューションのデプロイに関するお問い合わせや、ハンズオンのご要望などがありましたら、以下よりご連絡をお願いいたします。
本ソリューションに関するお問い合わせ: https://www.netapp.com/ja/forms/sales-contact/
*コメント欄に本ブログを見て問い合わせしたとご記入いただけますようお願いいたします。
井上耕平
前職SIerにて、IoT/AIに関わるシステムの提案からデリバリーまで幅広く経験。現在は、AI/IoTシステムをストレージの観点から支援するソリューションを担当。
川端 卓
これまでにサーバー/ストレージのベンダーにてプリセールスからポストセールスまで経験。現在は西日本のお客様に向けてAI/生成AIやサイバーレジリエンスのソリューションを中心に提案活動・ハンズオンなどを担当。
小寺 加奈子
AWSパートナーにてクラウド事業の責任者を経て、ネットアップではSales SpecialistとしてAWSへのマイグレーションを中心に、導入支援やマーケティング活動等に従事。
JAWSクラウド女子会運営メンバー。
前職ではネットワークエンジニア、AWSエンジニアを経験。AWS Japanから2024 AWS Japan Top Engineerの認定を受けており、AWSのユーザコミュニティではCommunity Builderとして、全国各地で活動しています。