最終更新日:
【DataRobotの基本的な使い方】DataRobotシリーズ その1
こんにちは。スキルアップAIの東です。
「機械学習を行ってみたいけど、自分ではコードが書けないし、周りにそういうのが得意なエンジニアもいない」という場面に直面したことはありませんか?
今回はそのような時に役に立つ、ノーコードでAIを構築できる「DataRobot」についてご紹介します。
「DataRobot」を使うと、エンジニアやデータサイエンティストでなくてもデータドリブンな課題解決を行うことができるようになります。
第2回「DataRobotを用いた異常検知」はこちら
DataRobotシリーズの記事一覧はこちら
1.DataRobotとは?
「DataRobot」は、DataRobot社が開発した機械学習自動化プラットフォームです。
このプラットフォームを用いると、従来手作業で行う必要のあった特徴量の前処理やモデルの選定などの、時間のかかる作業を自動化できます。そのため、データサイエンティストやエンジニアのようなAIに関する高度な知識をもった人材でなくても機械学習のモデルを構築できます。
2.DataRobotのアカウントの作成
DataRobotを使用するためには、まずDataRobotのアカウントを作成します。DataRobotでは有料のライセンスも用意されていますが、まずは無料で試せるトライアルから始めてみるのがよいでしょう。それにはこちらのリンク先でメールアドレスの登録を行います。メールアドレスを登録することで30日間トライアル環境を使用することができます。
3.DataRobotを用いた線形回帰モデルの作成
ここからはDataRobotの基本的な使い方についてご紹介します。
使用例として今回は、ダイヤモンドの重さの単位であるカラットと、その価格に関するデータを使って、ダイヤモンドの重さから価格を予測するモデルを作成したいと思います。
今回は、手動モードで線形回帰モデルを作成します。
下記の手順に従ってモデルの作成を行います。
- データの読み込み
- データを大まかに捉える
- モデリング
- モデリング性能の確認
まずは、データの読み込みから行います。
以上でデータの読み込みが完了しました。
次に、読み込んだデータをDataRobot上で確認してみます。
ここで、データの品質評価を確認します。
データの品質評価とは、問題を引き起こす可能性のあるポイントを報告する機能です。
「偽装欠損値」では、データの加工などの過程で、元々欠損値であったところに望ましくない値が挿入されている可能性が報告されます。
「過剰なゼロ」では、同じ列(特徴量)の中に0が繰り返し出現していることが報告されます。例えば、ある商品の売り上げが0の場合、その商品の需要がない可能性と、在庫がなかった可能性の両方が考えられます。このような、0が繰り返し出現する場合に疑われるトラブルを発見する手がかりとなります。
「インライア」では、外れ値ではないものの、他の値と出現頻度が大きく異なり、望ましくない可能性がある値が報告されます。
「外れ値」では、他の値から大きく外れた値が報告されます。
ただしこれらの報告はあくまでも「可能性」であり、必ずしも対処すべきものとは限りません。
以上でデータの確認ができました。
次に、読み込んだデータを用いてモデリングを行います。
今回は、手動モードで線形回帰モデルを作成するため、モデリングモードを「手動」に変更します。
DataRobotでは、モデルの作成においてさまざまモデリングモードが用意されています。
オートパイロット | 完全自動モード |
---|---|
クイック | オートパイロットよりもモデル探索の過程を簡略化したモードで、オートパイロットよりも時間を短縮できる |
手動 | リポジトリ(DataRobotのモデルのライブラリ)にある任意のモデルを実行するモード |
包括的オートパイロット | モデルの精度を高めるために、サンプルサイズを最大にして、可能性のある全てのモデルを作成するモード |
今回は、線形回帰モデルを作成するので「Linear Regression」にチェックを入れます。
以上でモデリングが完了しました。
次に、作成したモデルの性能を確認します。
以上でモデルの性能が確認できました。
以下の動画では、DataRobotの社員の方に、DataRobotとはどのような会社なのか、また注力されているAI教育への取り組みなどを伺いました。 DataRobotについて詳しく知りたい方は、合わせてチェックしてみてください。
4.まとめ
今回は、DataRobotの基本的な使い方についてご紹介しました。
通常、機械学習を行う際はPythonなどのプログラミング言語でコードを書いて実行するというプロセスが発生しますが、DataRobotではボタンをクリックするだけで簡単に機械学習を行うことができます。
機械学習をやってみたいけど周りにエンジニアやデータサイエンティストがいなくて困っている、という方はぜひ利用してみてはいかがでしょうか。
スキルアップAIでは、関連講座として「現場で使えるAIプランニング・プロジェクト推進基礎講座(DataRobot活用編)」を開講中です。 本講座では、AIプランニング・プロジェクト推進基礎講座で学ぶPoCフェーズにおいて、実際にDataRobotを活用してケースデータに対してPoCを実施することで、アイディエーションに留まらないプロジェクト推進のイメージを持てるように工夫しています。是非ご検討ください。
また、毎週水曜日に実践的AI勉強会「スキルアップAIキャンプ」を開催しています。勉強会では、様々な実践的テーマを取り上げ、データ分析・AI開発の実務力アップにつながるヒントをご提供します。講師が参加者の皆さんからの質問や悩みに答えるコーナーもあります。
興味がある方はぜひ参加してみてください!
第2回「DataRobotを用いた異常検知」はこちら
DataRobotシリーズの記事一覧はこちら
【監修】スキルアップAI 取締役CTO 小縣信也
AI指導実績は国内トップクラス。「太陽光発電発電量予測および異常検知」など、多数のAI開発案件を手掛けている。日本ディープラーニング協会主催2018E資格試験 優秀賞受賞、2019#1E資格試験優秀賞受賞。著書「徹底攻略ディープラーニングE資格エンジニア問題集」(インプレス)。
配信を希望される方はこちら
また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
公開日: