様々な特徴量エンジニアリングのテクニックと
性能が向上された事例を学ぶ
特徴量エンジニアリングとは、機械学習モデルの性能を高めるために、既存の特徴量から新たな特徴量を作成することです。作成された特徴量は機械学習モデルの学習用データの一部となるため、特徴量エンジニアリングはモデルの性能を大きく左右する重要な工程と言えます。特徴量エンジニアリングのテクニックは、Kaggle などのデータ分析コンペティションにおいて、データの構造や種類に応じて数多く提案されており、それら全てを網羅的に把握することは困難です。
そこで本講座では、テーブルデータ、テキストデータ、時系列データそして画像データに対する特徴量エンジニアリングのテクニックを整理し、その要点をまとめました。様々な特徴量エンジニアリングのテクニックと特徴量エンジニアリングによって実際に性能が向上された事例を学び、機械学習モデルの性能を引き上げるためのスキルを習得しましょう。
講座の特長
-
1
世界トップクラスの Kaggler が多数在籍する株式会社Rist が監修
Deep Learningを中心としたAI技術で、製造業や、建設業等の分野でお客様に合わせた幅広いAIシステムをオーダーメイドで開発。近年はその技術力を活かしたプロダクト開発にも力を入れている。「人類の感覚器官に、自由を取り戻す」をミッションに、人々が眼や耳を酷使してきた検査・解析業務から解放されるよう、あらゆる業務の自動化・省力化を目指して活動を行っています。
株式会社Rist
得られる知識・スキル
-
特徴量エンジニアリングの基本的な考え方
基本的な考え方を説明できるようになります。 -
テーブルデータ、テキストデータ、時系列データ、画像データに対する特徴量エンジニアリングのテクニック
多様なデータに対する特徴量エンジニアリングのテクニックを説明したり、実装したりできるようになります。
こんな方におすすめ
- 特徴量エンジニアリングに関して網羅的に知識を得たい AI エンジニア
- 機械学習モデルの性能をもう一段階引き上げたい AI エンジニア
カリキュラム
- 序章 : 本講座の概要
- 第1章 : 特徴量エンジニアリングとは
- 第2章 : テーブルデータの特徴量エンジニアリング
- 第3章 : テーブルデータを用いたノートブック演習
- 第4章 : テキストデータの特徴量エンジニアリング
- 第5章 : テキストデータを用いたノートブック演習
- 第6章 : 時系列データの特徴量エンジニアリング
- 第7章 : 時系列データを用いたノートブック演習
- 第8章 : 画像データの特徴量エンジニアリング
- 第9章 : 画像データを用いたノートブック演習
- 付録 : Kaggle体験記
担当講師
小縣 信也
兵庫県出身。大阪市立大学工学部卒業後、建材メーカー、設備設計事務所に勤務。2010年、OpenFOAM勉強会for beginner(現オープンCAE勉強会@関東)を立ち上げ3年間幹事を務める。建築環境に関する数値シミュレーション、電力量や温湿度などのセンサーデータに関する分析が専門。1級建築士、エネルギー管理士。2013年、国土交通省国土技術政策総合研究所 優秀技術者賞受賞。
日本ディープラーニング協会主催2018E資格試験 優秀賞受賞、2019#1E資格試験優秀賞受賞。最近は、需要予測や異常検知などのモデル開発に取り組んでいる。著書「徹底攻略ディープラーニングE資格エンジニア問題集」(インプレス)。
講座概要
講座名 | 特徴量エンジニアリング講座 |
---|---|
受講形式 |
オンライン講座:eラーニング形式 お好きな時間、お好きな場所でeラーニング形式にて受講いただけます。 |
前提となる知識・スキル |
必須スキル
推奨スキル
|
講座時間 | 動画講義約7時間 |
料金 | 165,000円/1名(税込) |
料金に標準で含まれるもの |
|
動画の視聴期間 | 動画共有日から1年間 |
チャットの質問期間 | 講座チャンネルへの招待日から3ヶ月間 |
事前準備 | 本講座では、MinicondaまたはAnacondaをインストールしていただきます。また、condaおよびpipというライブラリ管理ソフトを使って、Python ライブラリをインストールしていただきます。これらインストール作業を行えるパソコン環境をご準備ください。特に、社用のパソコンなどでアクセス制限のあるインターネット回線をご利用の方は、インストール作業を問題なく行えることを事前にご確認ください。ご不明な点がございましたら、事前にご連絡ください。 |
PCの動作環境 |
※8GB未満でも受講して頂くことは可能ですが、大容量のデータを扱うため、より高スペックなPCの利用を推奨しています。 |