コンテンツにスキップ

AI Hub

概要

AI HubはABCI上で大規模な汎用学習済みモデルの再利用等を行うためのツールやサービス群であり、Open OnDemandからはApp for MLflow Serverを利用できます。

App for MLflow Serverは、実験管理ツールであるMLflowのTracking ServerをABCIグループ単位で利用できる形にデプロイし、WebUIから管理できるアプリです。

デプロイされたMLflow Tracking Serverは、ABCIの計算ノードやOpen OnDemandのJupyter Labから、モデル開発における学習履歴や学習モデルの記録・共有のためにチームで利用できます。

Caution

App for MLflow Serverは試験的機能として公開しています。 予告なくサービス変更する場合や、問い合わせへの回答に時間を要する場合があります。

前提条件

アプリ操作方法

App for MLflow Serverを起動するには、メニューからAI HubMLflow Serverをクリックしてください。

App for MLflow Serverを起動すると、以下のような画面が表示されます。

App for MLflow Server画面  

MLflow Tracking Serverを作成(デプロイ)する場合

  • 画面の説明にもとに、以下の項目を入力しCreate Serviceボタンをクリックします。

    項目 説明
    group_name ABCIグループ名
    env_name 環境名
    cloud_storage_bucket_name バケット名
    cloud_storage_accesskey_ID アクセスキーID
    cloud_storage_secret_accesskey シークレットアクセスキー
  • Serviceの作成に成功すると、Operational status for requests 欄に「Service created」と表示されます。

MLflow Tracking Serverを管理・利用する場合

  • Service List Updateボタンをクリックする事で、自身が利用可能なService List を一覧表示できます。
  • Control Service のボタンを操作することで、サービスの起動、停止、削除を行えます。
    • Operational status for requests 欄に操作の状態が表示されます。
    • 利用を終えたサービスは、資源節約のため停止や削除にご協力ください。
  • MLflow Tracking ServerにBasic認証の設定する場合は、サービスのUpdate Auth Infoボタンをクリックします。

    • 予め所定の場所に以下のフォーマットのYAMLファイルを配置しておく必要があります。

      {'user_name':'<Basic認証用ユーザ名>', 'pass':'<Basic認証用パスワード>'}

  • MLflowのUIを確認する場合は、URL for access from outside ABCIのURLをクリックします。

    • Basic認証用のユーザ名とパスワードを入力してログインします。
  • 起動しているMLflow Tracking Serverをご利用ください。
    • ABCIのジョブやOpen OnDemandのJupyter Labから利用できます。
    • MLflow APIのトラッキングURIにURL for access from inside ABCIを指定することで、AIモデルの学習履歴や学習モデルをモデルレジストリに記録できます。
    • MLflow Tracking Serverの具体的な利用方法はMLflowのドキュメントをご確認ください。