テキストだけでなく、画像や音声といった多様なデータを同時に扱える”マルチモーダル”なモデルは、これからのAI活用において重要なテーマです。実際のビジネスシーンでは、メールやSNSでのテキストメッセージだけでなく、会議の音声記録や商品の画像データなど、さまざまな種類の情報が日々扱われています。
これらを包括的に解析・活用できるAIが登場すれば、生産性の大幅な向上やイノベーション創出につながる可能性があります。
今回のスキルアップAIキャンプでは、マルチモーダル言語処理の仕組みや研究事例を学びます。
プログラム概要
- Transformerと大規模言語モデル
- マルチモーダル言語処理とVision-Language Model
- Transformerの応用研究:生活支援ロボットの物体配置における危険性の説明文生成
※一部変更となる場合がございます。
スピーカー
-
株式会社スキルアップNeXt/小縣 信也
兵庫県出身。大阪市立大学工学部卒業後、建材メーカー、設備設計事務所に勤務。2010年、OpenFOAM勉強会for beginner(現オープンCAE勉強会@関東)を立ち上げ3年間幹事を務める。建築環境に関する数値シミュレーション、電力量や温湿度などのセンサーデータに関する分析が専門。1級建築士、エネルギー管理士。2013年、国土交通省国土技術政策総合研究所 優秀技術者賞受賞。 日本ディープラーニング協会主催2018E資格試験 優秀賞受賞、2019#1E資格試験優秀賞受賞。最近は、需要予測や異常検知などのモデル開発に取り組んでいる。著書「徹底攻略ディープラーニングE資格エンジニア問題集」(インプレス)。
-
株式会社スキルアップNeXt/小松 拓実
慶應義塾大学情報工学科修士2年。主にVision&Languageにおける深層学習の研究を行っている。これまでの研究内容として、太陽フレア予測における視覚的説明の生成や生活支援ロボットの物体配置時における危険性に関する説明文の生成がある。
開催概要
日時
2025年1月22日(水)19:30~21:00
開催方法
Zoom
参加費
無料
※競合他社様のご参加は、ご遠慮いただいておりますので、ご了承ください。