AI Hub
概要
AI HubはABCI上で大規模な汎用学習済みモデルの再利用等を行うためのツールやサービス群であり、Open OnDemandからはApp for MLflow Server
を利用できます。
App for MLflow Server
は、実験管理ツールであるMLflowのTracking ServerをABCIグループ単位で利用できる形にデプロイし、WebUIから管理できるアプリです。
デプロイされたMLflow Tracking Serverは、ABCIの計算ノードやOpen OnDemandのJupyter Labから、モデル開発における学習履歴や学習モデルの記録・共有のためにチームで利用できます。
Caution
App for MLflow Server
は試験的機能として公開しています。
予告なくサービス変更する場合や、問い合わせへの回答に時間を要する場合があります。
前提条件
- ABCIクラウドストレージにバケットとアクセスキーの作成 (MLflow Tracking Serverを作成する場合)
- 作成方法はABCIクラウドストレージの使い方をご確認ください。
アプリ操作方法
App for MLflow Server
を起動するには、メニューからAI Hub
、MLflow Server
をクリックしてください。
App for MLflow Server
を起動すると、以下のような画面が表示されます。
MLflow Tracking Serverを作成(デプロイ)する場合
-
画面の説明にもとに、以下の項目を入力し
Create Service
ボタンをクリックします。項目 説明 group_name
ABCIグループ名 env_name
環境名 cloud_storage_bucket_name
バケット名 cloud_storage_accesskey_ID
アクセスキーID cloud_storage_secret_accesskey
シークレットアクセスキー -
Serviceの作成に成功すると、Operational status for requests 欄に「Service created」と表示されます。
MLflow Tracking Serverを管理・利用する場合
Service List Update
ボタンをクリックする事で、自身が利用可能なService List を一覧表示できます。- Control Service のボタンを操作することで、サービスの起動、停止、削除を行えます。
- Operational status for requests 欄に操作の状態が表示されます。
- 利用を終えたサービスは、資源節約のため停止や削除にご協力ください。
-
MLflow Tracking ServerにBasic認証の設定する場合は、サービスの
Update Auth Info
ボタンをクリックします。-
予め所定の場所に以下のフォーマットのYAMLファイルを配置しておく必要があります。
{'user_name':'<Basic認証用ユーザ名>', 'pass':'<Basic認証用パスワード>'}
-
-
MLflowのUIを確認する場合は、
URL for access from outside ABCI
のURLをクリックします。- Basic認証用のユーザ名とパスワードを入力してログインします。
- 起動しているMLflow Tracking Serverをご利用ください。