京都の「コケ」を識別する手法が深層学習の弱点を克服する
深層学習の手法に基づく物体認識は、特徴がはっきりしないものを識別するのが苦手だ。京大の伊勢准教授らが開発した「コケ」の種類を識別する手法は、この弱点を克服する有望な方法となりそうだ。 by Emerging Technology from the arXiv2017.08.18
近年、深層学習アルゴリズムが機械による物体認識に革命を起こしている。テーブル、イス、自動車、さらには人の顔といったありふれた物の識別において、最先端のアルゴリズムは人間を易々としのぐようになった。
しかし、深層学習アルゴリズムには弱点があり、認知できないものが存在する。たとえばマシン・ビジョンは、草やハーブなどの識別が苦手だ。形状が定まっておらず、特徴を定義しづらいからだ。
テーブルは一般的に、4本の脚と1つの平らな面を持つ。機械学習はこういった特徴を識別するのが得意だ。一方、草やハーブは同一種であっても、生育条件によって大きさはさまざまであり、葉や種の数なども異なる。そのため、マシン・ビジョンによる認識は困難であり、花が咲いていない時期には特に難しい。
マシン・ビジョンは同様に、航空写真から樹木を識別したり、衛星画像から穀物を識別したりするのも苦手だ。はっきりしない形の物体も識別できるように深層学習アルゴリズムを訓練するための新しいアプローチが求められている。
京都大学の伊勢武史准教授たちは、深層学習機械が不定形の植物を認識できるようにするシンプルな技術を開発して、さまざまな種類のコケを識別するように教え込んで性能を試した。 ご存知のように、コケは形状をはっきりと定義するのが難しい植物である。
伊勢准教授たちの研究チームは、コケを研究するのに適した環境に恵まれている。京都は温かく湿度の高い気候で知られており、コケが育ちやすい。研究チームはまず、京都の伝統的な日本庭園である「無鄰菴(むりんあん)」に生育しているコケの写真撮影から始めた。
研究チームは3種類のコケを特定し、それぞれを個別にデジタルカメラで撮影した。しかし、コケの生育場所にはコケ以外の他の植物なども一緒に生えている。それぞれの画像は、オリンパス OM-D E-M5 Mark IIなどのデジタルカメラを用いて、焦点距離50ミリまたは同等のレンズで、60センチの距離でコケの塊を上から直接撮影したもので、解像度は4608 × 3456ピクセルである。
深層学習アルゴリズムの目標は、1枚の画像に写った異なる種類のコケを識別することと、他の物体や植物からコケを見分けることである。
手法は単純明快だ。アルゴリズムを訓練するために、特定のコケのそれぞれの画像を50%重複させながら、56 × 56ピクセルの小さな領域に分割する。この手法で元の画像から9万近くの画像を作り出し、そのうち80%をアルゴリズムの訓練に、残りを訓練したアルゴリズムのテストに使用する。
訓練用の画像は特定の種類のコケの均一な塊を写したものを選んだが、塊には他種のコケが生えている部分も少し含まれている。研究チームはすべての訓練用画像を調べて、スギゴケ、チョウチンゴケ、ハイゴケの3種類以外のコケの画像を手作業で取り除いた。この作業により、上記3種類のコケと、コケ以外の特徴の画像が残された。伊勢准教授たちはそれから、訓練用のすべての画像にいずれか一つのラベルを付けて深層学習機械に与えた。
結果は見事なものだった。アルゴリズムはすぐに、高い精度で各種類のコケを認識するようになった。様々な種類のコケが写った1枚の画像をアルゴリズムに与えると、画像の様々な部分にあるコケを正確に識別した。「テスト用の画像を90%以上の精度で分類しました」という。
アルゴリズムは、ある種のコケを他のコケよりも正確に識別した。伊勢准教授たちは、「識別精度は、スギゴケで99%、チョウチンゴケで95%、ハイゴケで74%と見積もれます」としている。
ハイゴケの精度が低いのは、生長の形態が明確でなく、他のコケより形状がはっきりしないためである。これに対し、スギゴケは独特の明確な形状を持っている。
精度を改善するにはさまざまな方法が考えられるという。例えば、ハイゴケがより特徴的に見える別の季節に撮影した画像を訓練用に作成したり、デジタルカメラのホワイトバランスを統一することでより正確に色を再現したりすることなどが挙げられる。
いずれにせよ、結果から判断すると、将来は有望そうだ。伊勢准教授たちの手法は、航空画像で上空から撮影された木や植物をより正確に識別するのに応用できる可能性がある。荒野や農場、森林などの広大な管理区域での個体数調査では大いに役立つだろう。
一方で伊勢准教授たちは、スマホを使ってコケを識別するアプリの開発を計画しているとしており、園芸家に人気となるかもしれない。
(参照:arxiv.org/abs/1708.01986 : “Identifying 3 moss species by deep learning, using the “chopped picture” method(「細切れ写真」手法によって深層学習で3種類のコケを識別する)
- 人気の記事ランキング
-
- How ChatGPT search paves the way for AI agents 脱チャットGPTへ、オープンAIが強化するプラットフォーム戦略
- Promotion NIHONBASHI SPACE WEEK 2024 アジア最大級の宇宙ビジネスイベント、東京・日本橋でまもなく開催
- Promotion Innovators Under 35 Japan Summit 2024 in Nihonbashi 2024年のイノベーターが集結「U35 Summit」参加者募集中
- This AI-generated Minecraft may represent the future of real-time video generation AIがリアルタイムで作り出す、驚きのマイクラ風生成動画
- Inside a fusion energy facility 2026年の稼働目指す、コモンウェルスの核融合施設へ行ってみた
- Why AI could eat quantum computing’s lunch AIの急速な進歩は 量子コンピューターを 不要にするか
- エマージングテクノロジー フロム アーカイブ [Emerging Technology from the arXiv]米国版 寄稿者
- Emerging Technology from the arXivは、最新の研究成果とPhysics arXivプリプリントサーバーに掲載されるテクノロジーを取り上げるコーネル大学図書館のサービスです。Physics arXiv Blogの一部として提供されています。 メールアドレス:KentuckyFC@arxivblog.com RSSフィード:Physics arXiv Blog RSS Feed