最終更新日:
破滅的忘却と継続学習の問題設定について
こんにちは。スキルアップAIの野口です。私は現在、破滅的忘却と継続学習について研究をしています。
従来の機械学習フレームワークでは、固定のデータを使って学習および評価を行います。しかし実際の機械学習システムでは、データが次々と取得されますので、それに併せてモデルを逐次的に学習する必要があります。このとき、新たなデータに対して純粋にモデルを再学習させようとすると、「破滅的忘却」という問題が生じます。
この破滅的忘却に対処しながら新たなデータにモデルを適応させるための学習方法として「継続学習」があります。継続学習では、次々にデータが取得される状況のもとで、機械学習モデルを逐次的に学習していく方法を考えます。
本記事では、機械学習における致命的欠陥である「破滅的忘却」および「継続学習で扱われる問題設定」についてご紹介します。継続学習の具体的な手法については、別記事の「一度学んだことを忘れずに新しいことを学ぶには?深層学習における継続学習入門」に掲載していますので、興味のある方はそちらの記事もご参照ください。
1.破滅的忘却とは
図1. 破滅的忘却の様子
破滅的忘却とは、モデルが次々と新しいタスクを学習するときに、過去に学習したタスクを忘れてしまう現象のことをいいます。破滅的忘却は人間を含む一部の哺乳類においては生じにくい現象なのですが、機械学習モデルにおいては容易に生じてしまうことが知られています。
例えば図1のように、最初に「0 vs 1 の分類タスク」を学習した直後では、モデルは 0 vs 1 の高精度な予測を容易に達成できます。しかし、その後新たなタスクとして「2 vs 3 の分類タスク」を学習した後では、先程まで可能だった既存のタスクである 0 vs 1 の予測ができなくなってしまいます。
このような破滅的忘却をどのようにして緩和させるかというアプローチがこれまでにいろいろと提案されています。その中の一つに「継続学習」と呼ばれる学習方法があります。次節では、継続学習の問題設定として「ドメイン増分(Domain Incremental)」と「クラス増分(Class Incremental)」の2つについて解説します。
2.継続学習の問題設定について
図2. 晴れた日の犬と鳥の画像を分類する分類器
継続学習の代表的な問題設定として「クラス増分(Class Incremental)」と「ドメイン増分(Domain Incremental)」があります。
本節では、上の図のような「晴れた日に撮影された、犬と鳥の画像」で学習された、イヌとトリの分類器を例にとります。ここであえて「晴れた日」と指定したのは、ドメイン増分の説明をやりやすくするためです。それぞれの問題設定を一言で説明すると次のようになります。
- クラス増分:学習していないクラスを新たに学習させる問題
- 例)「犬と鳥」の画像分類器に対して、新たに「船」の画像を学習させる
- ドメイン増分:学習済みのクラスとは同じクラスだが、異なるドメインのデータを学習させる問題
- 例)「晴れた日」の犬と鳥の画像分類器に対して新たに「雪の日」の画像を学習させる(=「晴れドメイン」で学習された分類器に「雪ドメイン」を新たに学習させる、ということ。)
2.1.クラス増分
図3. クラス増分の例
クラス増分(Class Incremental)とは、モデルが学習していないクラスをそのモデルに新たに学習させる問題です。こちらはドメイン増分と比べてもわかりやすい問題設定になっています。
上の図3はクラス増分の問題設定を示した図です。犬と鳥の分類器に新たに「船」というクラスを学習させます。このように今までのクラスに、新しくクラスが増分されているため、この問題設定はクラス増分と呼ばれています。実務においても、分類器に新たにクラスを追加したいという場面はよくあります。
2.2.ドメイン増分
図4. ドメイン増分の例
続いてドメイン増分(Domain Incremental)についてです。ここで取り扱うクラスは、学習済みのクラスと同じく犬と鳥です。ただし、画像のドメインが異なります。ドメインとは例えば「天気の違い」が挙げられます。
図4はドメイン増分の例を示しています。例としてあげている分類器では、「晴れの日」の犬と鳥を学習していました。この分類器に新たに「雪の日」の犬と鳥を入れてみます。そうすると、分類器は雪を見たことがないので、「なんだこの全体的に白で覆われている物体は!?」となってしまいます(実際に分類器がそう思っているかはさておき)。
結果として分類器は誤った分類をしてしまう可能性が高いです。そのため、新たなドメインである「雪の日」に関しても学習する必要があります。
このようにデータのドメインが変化(晴れ→雪)することをDomain Shiftと言ったりもしますが、これは車の自動運転などではクリティカルな問題となります。晴れの日は上手に自動運転ができるのに雪が降ると一気に運転が狂い始める、となってしまっては困るからです。ドメイン増分の例としてはほかにも写真の犬に加えて手書きのスケッチの犬も学習するパターンなども考えられます。
3.おわりに
本記事では破滅的忘却と継続学習の問題設定についてご紹介してきました。継続学習の問題設定はここで述べた2種類だけにとどまらず多岐に渡ります。ぜひ、どのような問題設定があるのかを調べてみてください。その際にに本記事が少しでも皆様の理解のお役に立てれば幸いです。
継続学習の具体的な手法については、別記事の「一度学んだことを忘れずに新しいことを学ぶには?深層学習における継続学習入門」に掲載しています。継続学習の手法について興味のある方はこちらの記事もぜひご参照ください。 深層学習について詳しく学びたい方は現場で使えるディープラーニング基礎講座をぜひご検討ください。
また、毎週水曜日に実践的AI勉強会「スキルアップAIキャンプ」を開催しています。勉強会では、様々な実践的テーマを取り上げ、データ分析・AI開発の実務力アップにつながるヒントをご提供します。講師が参加者の皆さんからの質問や悩みに答えるコーナーもあります。
興味がある方はぜひ参加してみてください!
4.参考文献
【監修】スキルアップAI 取締役CTO 小縣信也
AI指導実績は国内トップクラス。「太陽光発電発電量予測および異常検知」など、多数のAI開発案件を手掛けている。日本ディープラーニング協会主催2018E資格試験 優秀賞受賞、2019#1E資格試験優秀賞受賞。著書「徹底攻略ディープラーニングE資格エンジニア問題集」(インプレス)。
配信を希望される方はこちら
また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
公開日: