最終更新日:
【DataRobotを用いた画像分類】DataRobotシリーズ その3
こんにちは。スキルアップAIの東です。
これまでのDataRobotシリーズでは、DataRobotの基本的な使い方や異常検知を行う方法についてご紹介しました。
実務においては、機械学習によって画像を分類したいという場面がよくありますが、DataRobotではその画像分類も行うことが可能です。
今回は、DataRobotを用いた画像分類の方法についてご説明します。
第1回「DataRobotの基本的な使い方」はこちら
第2回「DataRobotを用いた異常検知」はこちら
DataRobotシリーズの記事一覧はこちら
1.画像分類の概要
今回は、DataRobotの「Visual AI」という機能を用いて、画像データとテーブルデータを組み合わせた多値分類を行う方法をご紹介します。「Visual AI」とは、画像を用いたモデルの作成や利用を自動化する機能です。
例として今回は、皮膚の病変部位に対する病気の特定を画像分類によって行ってみたいと思います。
2.画像分類の手順
次の手順で画像分類を行っていきます。
- データの準備
- データの読み込み
- モデリング
- ブループリントを確認する
- 特徴量のインパクトを確認する
- アクティベーションマップを確認する
- 多値分類問題の評価指標を確認する
まず、①の「データの準備」から行っていきます。
今回用いるCSVファイルには、症例IDや病気の種類、患者の年齢、性別、病変部が身体のどの箇所にあるかといった情報が格納されています。
画像を読み込むには、このCSVファイルに画像ファイルへのパスを記載した「image」という列を新たに用意し、CSVファイルと画像を紐づけする必要があります。
DataRobotでデータを読み込むため、CSVファイルと画像ファイルが格納されたフォルダを作成し、圧縮します。
次に、作成したZIPファイルをDataRobot上で読み込みます。
以上でデータの読み込みが完了しました。
次に、読み込んだデータを用いてモデリングを行っていきます。
まず、先ほど読み込んだデータがDataRobot上に正しく取り込まれていることを確認します。
これで画像が正常に取り込まれていることが確認できました。
次に、予測したいターゲットを設定します。今回は病変の種類を予測するため、病気の種類が格納された「dx」という特徴量をターゲットとします。
画面中央の「開始」をクリックし、モデリングを開始します。
この際、モデリングモードが「クイック」になっていることを確認します(モデリングモードをクイックにすると、通常の4分の1程度の時間で完了することができます)
モデリングが完了すると、「オートパイロットが終了しました」と表示されます。
以上でモデリングが完了しました。
次に、画像データがモデルにおいて処理されていることを確かめるため、ブループリントを確認します。
ブループリント内で画像データが処理されていることが確認できます。
以上で画像データがモデルにおいて処理されていることを確認できました。
次に、モデルに用いた各特徴量のインパクトを調べます。
画像がどの程度予測に寄与しているのかを確認できます。今回の例では、画像が予測に対して全体の特徴量の約 23% 寄与していることがわかりました。
次に、アクティベーションマップを確認します。
アクティベーションマップとは、モデルが画像のどの部分を注視して予測を行っているかを可視化したものです。
アクティベーションマップが表示できました。
画像の着色部分は赤くなっている箇所ほど予測に寄与していることを表しています。このように、DataRobotでは画像の一つひとつにおいて重要度が高い部分を調べることができます。
次に、多値分類問題の評価指標を確認します。
DataRobotでは、混同行列や性能評価指標を確認することができます。
混同行列の見方は以下の通りです。
今回のモデルでは、予測精度が 93.75%、F1スコアが 0.96、recallが 1、precisionが 0.92 であることがわかります。
以下の動画では、DataRobotの社員の方に、DataRobotとはどのような会社なのか、また注力されているAI教育への取り組みなどを伺いました。 DataRobotについて詳しく知りたい方は、合わせてチェックしてみてください。
3.まとめ
今回は、画像データとテーブルデータを用いて画像を分類する方法をご紹介しました。
もちろん、画像データのみを用いて画像を分類するモデルも作成することができます。ぜひいろいろ試してみてください。
スキルアップAIでは、関連講座として「現場で使えるAIプランニング・プロジェクト推進基礎講座(DataRobot活用編)」を開講中です。 本講座では、AIプランニング・プロジェクト推進基礎講座で学ぶPoCフェーズにおいて、実際にDataRobotを活用してケースデータに対してPoCを実施することで、アイディエーションに留まらないプロジェクト推進のイメージを持てるように工夫しています。是非ご検討ください。
また、毎週水曜日に実践的AI勉強会「スキルアップAIキャンプ」を開催しています。勉強会では、様々な実践的テーマを取り上げ、データ分析・AI開発の実務力アップにつながるヒントをご提供します。講師が参加者の皆さんからの質問や悩みに答えるコーナーもあります。
興味がある方はぜひ参加してみてください!
第1回「DataRobotの基本的な使い方」はこちら
第2回「DataRobotを用いた異常検知」はこちら
DataRobotシリーズの記事一覧はこちら
【監修】スキルアップAI 取締役CTO 小縣信也
AI指導実績は国内トップクラス。「太陽光発電発電量予測および異常検知」など、多数のAI開発案件を手掛けている。日本ディープラーニング協会主催2018E資格試験 優秀賞受賞、2019#1E資格試験優秀賞受賞。著書「徹底攻略ディープラーニングE資格エンジニア問題集」(インプレス)。
配信を希望される方はこちら
また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
公開日: