最終更新日:
AIトピックス:Kaggle初心者必見!コンペの出題課題紹介!-Part2-
こんにちは。スキルアップAIの泉です。
スキルアップAIでは、AIに関するトピックスをピックアップし、週間で紹介しております。
皆さんはkaggleをご存じでしょうか。
以前の記事では、初心者向けの課題「タイタニック号の生存者の予測」、「住宅の販売価格の予測」や、「GANによる芸術作品の創造」をご紹介しました。
今回は、前回に引き続き、「kaggleを少しだけのぞいてみたい」という方向けにkaggleコンペ課題を紹介をします。
1.BirdCLEF 2021-鳥の鳴き声の識別-
この課題では、世界中の鳥の鳴き声を共有する「xenocanto.org」というWebサイトの録音データを使用し、どの鳥が鳴いているかを判断するモデルを構築します。 トレーニングデータには、鳥の種類、録音された場所の座標、録音された日付などが含まれます。 実は、鳥にも方言があり、同じ種類の鳥でも生息地によって鳴き声が異なることがあるそうです。
この課題の重要な点として、自然環境で録音された音声を利用するため、背景に人工音(飛行機の音など)や目的以外の鳥、他の動物の鳴き声(シマリスなど)が混ざってしまっていることが挙げられます。従って、この複雑な録音を分析するため、適切に目的の鳥の音声を検出し、それを正しい種類に判別できる分類器を構築する必要があります。
参考:BirdCLEF 2021 – Birdcall Identification
2.胸部X線写真からCOVID-19による肺炎を検出
この課題では、コロナ感染が疑われる患者の胸部X線写真に対し、患部の場所と重症度を示したデータを利用して、重症度や患部を検出するモデルを構築します
COVID-19に感染しているかを診断する手法の1つに、放射線科医が胸部X線写真から診断する方法があります。
胸部X線写真は数分で取得が可能ですが、他の細菌性肺炎などと非常によく似ているため、診断が困難です。
また、放射線科医によるCOVID-19診断のためのガイドラインが存在しますが、放射線科医によって診断が異なってしまうことがあります。
そのため、胸部X線写真から、COVID-19により肺炎を起こしている位置などを特定し、放射線科医のCOVID-19診断をサポートすることが有効だと考えられています。
このようなCOVID-19診断の自動化を行えれば、放射線科医がCOVID-19患者をより確実かつ迅速に診断することが可能になります。
トレーニングデータには、胸部X線写真と、肺炎を起こしている患部位置などに関する情報が含まれています。 この胸部X線写真における肺炎を起こしている領域は、バウンディングボックスというラベルで情報付けされています。 バウンディングボックスでは、胸部X線写真に対して、肺炎を起こしている領域を四角い領域で囲み、患部としてラベル付けが行われています。
参考:SIIM-FISABIO-RSNA COVID-19 Detection
3.食料品小売業者の売り上げを予測する
この課題では、エクアドルに本拠を置く大手食料品小売業者であるCorporaciónFavoritaからのデータに基づき、時系列予測モデルを活用して店舗の売上を予測します。この課題ページには時系列予測モデルのチュートリアルも紹介されているため、初心者もチャレンジしやすいと思います。
食料品小売店では、在庫が過多になってしまうと商品が腐ってしまう可能性があります。
逆に、人気がある商品の在庫が少ないと売り切れてしまい、売上を上げるチャンスを失うことにつながる可能性があります。
従って、商品を適切なタイミングで十分に提供することが重要であり、どの商品がどの時期にどれほど売れるのか、正確な予測を行えれば消費者の満足度を向上させることが可能です。
学習のために提供されているデータは、日付、店舗、商品情報(例:家電、お肉、ペット用品など)、その商品が宣伝されているかどうか、販売数などです。 追加ファイルには、エクアドルは石油に依存している国であるため、毎日の石油価格のデータなどが含まれています。 テストデータには、日付、店舗、商品情報、販売数などが含まれています。 最終的に、テストデータから売上を予測し、提出する形式です。
参考:Store Sales – Time Series Forecasting
おわりに
いかがだったでしょうか?
スキルアップAIでは、「現場で使える機械学習・データ分析基礎講座」を開講中です。機械学習の概論から始まり、徐々にそれぞれのアルゴリズムの核心を学べる講座です。無料トライアル版のご用意もありますので、是非ご検討ください。
今後も、AI関連トピックスの記事を共有していきたいと思います。ご期待ください!
過去のAIトピックスはこちら
Kaggle初心者必見!コンペの出題課題紹介!-Part1-はこちら
配信を希望される方はこちら
また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
公開日: