Alibaba Cloudの機械学習プラットフォーム「PAI」 ー機械学習モデル開発・運用の統合管理を可能に(テックコラム)

メインビジュアル

 

AI活用を検討するうえで、「機械学習」はキーワードの一つ。

近年、「専門家でなくとも機械学習を活用するためのサービス」としてのMLaaS(Machine Learning αs α Service)が多く登場しており、主要クラウド事業者も同様のプロダクトをリリースしています。

その中でもAlibaba Cloudは、各社に先駆けてGUIによるモデル開発(ノンコーディング機械学習)機能を実装するなど、MLaaS領域の技術的なリーダーの立ち位置にあります。

今回はそんな先進的な技術を搭載し、そして今も進化を続けているAlibaba Cloudの機械学習プラットフォーム「PAI(Platform of Artificial Intelligence)」について解説します。

 

概要

・Alibaba Cloudはクラウド各社で先駆けてGUIによるモデル開発を実装するなど、MLaaS技術をリードしている
・PAIはモデルの作成からデプロイ、運用管理までカバーし、工数やハードウェアリソースなど機械学習活用における様々な課題をクリアできる
・サービスとしても日々進化を続けており、今後もよりユーザーが手軽に機械学習を活用するための機能やUIが実装される予定

 

機械学習の導入・運用における課題


AI(Artificial Intelligence/人工知能)とは、言語理解や推論、学習などの人間の持ちうる知能を機械に持たせることを言います。特に”機械学習”は過去の事実(データ)から法則を見出す”学習”にフォーカスした技術体系です。

大量のデータを学習することで得られた法則を用いて、新しくインプットされるデータを分析・予測し、目的のアウトプットを自動的に出力する仕組み(=機械学習モデル、以下、「モデル」)を開発する、というのが大きな流れになります。

一方でこの機械学習をビジネスで活用するには、高度な数学と統計が不可欠です。ところがITエンジニアの多くはそのバックグラウンドを持っていません。

また、ハードウェアリソース確保のコストに課題もあります。データ量が増えるほどコストが嵩む一方で、十分なリソースを確保できなければ、学習や推論が追いつかなくなってしまいます。

さらに運用を始めるにあたって、デプロイの構成を考える必要があります。データのフローや作成したモデルを動作させる環境など、様々な知識が必要になってきます。

 

3つの主要機能からなる機械学習プラットフォーム - PAI


これらの課題を解決するため、Alibaba Cloudでは2018年に「PAI(Machine Learning Platform for AI)」をリリースしました。クラウドサービスとして機械学習ツールを提供するMLaaSです。

PAIは、大きく3つの機能「PAI-Studio」「PAI-DSW」「PAI-EAS」で構成されます。これらがモデルの作成環境からデプロイ機能まで機械学習における主要な機能を備えているので、開発・運用にかかる専門知識や負担を大きく減らすことができ、AI活用でありがちな専門人材の調達・工数の問題を抱える企業に最適なプロダクトです。

PAIの主要機能構成
〈PAIの機能構成〉

またハードウェアリソースの課題も、クラウドのメリットをフル活用することで解決できます。CPU・GPUといった計算リソースを柔軟にスケールさせて利用できるほか、Alibaba Cloudのデータ処理プラットフォームのMaxComputeとも連携でき、データストアにてETL処理が実行できます。これによりテラバイト、ペタバイトレベルの大容量データの分散処理が可能な機械学習環境が利用できます。

またGPUによる分散並列処理を要する深層学習については、アリババ独自開発のPluto(Caffeベース)のほかTensorFlowやPyTorch、MXNetなどの主要なフレームワークに対応しています。

 

PAI-Studio:GUIによるモデルの作成

ここからは、PAIの各主要機能について解説します。
PAI-Studioではモデルの作成ができます。モデル作成における各タスクをドラック&ドロップで操作するジョブダッシュボード機能を搭載しており、閲覧性と操作性を追求したGUIが大きな特長です。

PAI-StudioのGUIによるモデル作成
〈ドラッグ&ドロップによるモデル作成〉

各タスクはインプット、アウトプット、データ前処理、特徴処理、トレーニング、モデル評価といった100個以上の機能に対応。アルゴリズムをモジュール化して最小限のパラメーターを設定することで、機械学習をコードレスにしています。

また、テンプレートとして「詐欺判定」や「EC向けレコメンド機能」などが用意されており、日々増え続けるこれらのテンプレを活用することで、容易にモデルの作成が可能で、これからモデルの開発をする企業や自社開発環境にとっては非常に嬉しい機能になっています。

100種類以上のテンプレートから選択可能
〈100種類以上のテンプレートから選択可能〉

 

PAI-DSW:クラウドのメリットを最大限活かした開発環境

PAI-DSW (Data Science Workshop) はノートブック形式で開発が行える環境。深層学習など、更に複雑なモデルの開発の場合、モデルのカスタマイズが多く必要で、より柔軟に開発を行えることが求められます。PAI-DSWでは、従来のやり方で更にクラウドのメリットも使えてスムーズに開発が行える環境になります。

深層学習でよく使われるライブラリが揃っており、その他のライブラリも自由に追加することが可能です。また、SQLなども対応しているため、BigData開発をサポートしています。

CPUやGPUなどのリソースの性能や数を自由に変更でき、使用状況のモニタリング機能もついています。更に従量課金制で使うこともできるため、コストを調整しながらフレキシブルに開発を行えます。

PAI-DSWの画面サンプル
〈PAI-DSWのサンプル画面〉

 

PAI-EAS:作成したモデルのデプロイ・管理機能

モデルの開発ができたらPAI-EAS (Elastic Algorithm Service) を使ってデプロイします。PAI-EASは学習済みのモデルをリアルタイムにクエリして、推論結果が得られるように最適化されているサービスです。モデルのデプロイ環境の構築が不要となるので、学習環境と推論環境をまとめて管理できることが大きな特長です。

デプロイしたモデルの管理に役立つ機能も搭載しています。バージョン管理機能でサービスが進化していくと同時に更新されていくモデルの管理を行ったり、モデルの更新の際にダウンタイムを最小限にするための機能などもあり、様々な面でビジネスに機械学習の導入をやりやすくしてくれます。

クラウドサービスなので、もちろんリソースのオートスケーリングやモニタリング機能があります。ユーザーからも管理者側からもサービスを継続的に使えるようになっています。

 

”進化”を続けるプラットフォームの可能性


今回はAlibaba Cloudの機械学習プラットフォームPAIを、以下の主要機能ごとに簡単にご紹介しました。

PAIを用いたアプリ開発プロセス例

・GUI操作とテンプレート活用でモデル作成の負担を軽減するPAI-Studio
・リソースの利用料を柔軟に調整しながらモデルを開発するPAI-DSW
・開発したモデルのデプロイと管理運用を容易にするPAI-EAS

さらにこれらの主要コンポーネントのほか、中国でβ版が公開されているPAI-AutoLearningでは、GUIでさらに広範囲な操作が実行でき、ワンストップで機械学習のモデルの開発とトレーニングが可能になってます。
※PAI-AutoLearningの検証記事はこちら

クラウドサービスプロバイダー各社で、機械学習開発のハードルを下げるプロダクトが続々とリリースされています。その中でもAlibaba Cloudは特にこの領域の先端を走っています。そういった今後の進化のポテンシャルへの期待もあって、日本でのユーザーも増えています。ぜひ、試してみてはいかがでしょうか。

 

次のコラムはこちら
coming soon...

 

関連リンク(実際にPAIを利用した開発事例を多数紹介しております。)

 

Yusuke Yamada

SBクラウド株式会社 技術部 AIエンジニアリング課 課長

山田 佑輔

大学時代から画像認識技術を研究。SIerや国産パブリッククラウドサービス事業者にて、設計・構築・プリセールス・サポート・新規サービス企画など幅広く経験し、インフラ歴は14年。
2018年にSBクラウドに参画し、AIチームを立ち上げ。以降、多くの企業へのAI導入プロジェクトを主導。