機械学習を用いた無気配生物検知可能性の評価

機械学習を用いた無気配生物検知可能性の評価

Peter・Philips 蝶野 千夜†‡ 前原 昇
不可視生物生態研究室 ホルス支部 ㈱インビジブルブレイン
{peter, cc}@inv-lab.jp mae@i-brain.jp

1 概要

 無気配生物の認識はごく一部の限られた人間にのみ可能であり、後天的には Allodimensionis carpophaga の水晶体を元に加工することで視覚的な認識を可能とするレンズが得られることが報告されている(観野, 2010)。しかし当該種の希少性および加工工程の高度な複雑性から、その実用化には依然として高いコスト的制約が存在する。
一方で近年、深層学習を基盤とした画像認識技術は急速に発展しており、特にVaswaniらによるTransformerアーキテクチャの提案(2017)以降、自己注意機構

を用いた大域的特徴抽出が可能となり、従来の畳み込みニューラルネットワークに依存しない視覚表現学習の枠組みが確立された。さらにVision Transformer(ViT)の登場により、画像領域においてもトークンベースの統一的な表現学習が実現され、分類・検出タスクの性能は大きく向上している。
本研究では、これらの機械学習技術を応用し、自然風景写真と無気配生物が写り込むとされる画像群を対象とした二値分類実験を実施した。具体的には、自然環境下で撮影された風景画像群と、無気配生物が存在するとされる観測画像群を用い、

-48-

Vision Transformer(ViT)を中心とした画像分類モデルによる識別性能の評価を行った。加えて比較対象として、畳み込みニューラルネットワークに基づくResNetおよびEfficientNetを導入し、計3種類の代表的な画像認識アーキテクチャにおける性能差について検討を行った。
その結果、以下の知見が得られた。

  • Ophiocordyceps cadaveriflora や Chirograbus submersista といった一部の種を含む画像に対しては89.4%と高い検知率を示した。
  • 一方で Lingarana perturbans を含む画像群では検知率が24.5%と低い結果となった。
  • モデル間比較については、ViT・ResNet・EfficientNetのいずれにおいても全体的な性能差は限定的であり、本タスクにおいてはアーキテクチャ間の優位性は明確には確認されなかった。

以上より、Transformerベースの画像認識モデルは一部の無気配

生物に対して有効性を示す一方で、その検出可能性は対象種の視覚的特性に強く依存することが明らかとなった。

2 先行研究

 無気配生物の認識に関する研究は、その存在自体の観測困難性により未だ発展途上の段階にある。既存の知見は主に生体学的観測や局所的事例報告に限られており、体系的な計算機的解析はほとんど行われていない。
特に Allodimensionis carpophaga の水晶体構造を用いた視覚補助技術は、無気配生物の存在を間接的に知覚するための唯一に近い手段として報告されているが、その再現性および実用性には大きな制約が存在する(観野, 2010)。
一方、計算機ビジョン分野では深層学習の発展により画像認識性能が急速に向上しているものの、これらの技術は主に可視対象物を前提として設計されており、無気配生物のような不可視生物を直接扱う枠組みは確立されていない。
近年ではTransformerアーキテク

-49-

チャ(Vaswani et al., 2017)およびVision Transformer(Dosovitskiy et al., 2020)の登場により、画像認識における特徴抽出は局所的畳み込みから大域的自己注意機構へと移行しつつあるが、これらの手法を無気配領域の検出問題に適用した研究は限られている。
そのため本研究は、無気配生物の画像的検出に対してTransformerベースのモデルを適用した初期的試みの一つとして位置付けられる。

3 実験目的

 本研究の目的は、自然風景画像中に含まれるとされる無気配生物の判定を、深層学習モデルを用いた二値分類問題として定式化し、その識別可能性を定量的に評価することである。近年の深層学習技術の発展により、画像認識における特徴表現能力は大きく向上しており、本研究ではこれらの手法が視覚的に明示されない対象の判定に対しても有効に機能するかを検証する。
さらに、無気配生物の種別に応

じて判定性能に差異が生じるかを分析し、クラスごとの視覚的特徴の違いが識別精度に与える影響について検討する。
加えて本研究では、Vision Transformerを含む代表的な画像認識モデル(ResNetおよびEfficientNet)を比較対象として導入し、無気配生物判定タスクにおける各アーキテクチャの性能差および特性を定量的に評価することを目的とする。これにより、曖昧性を含む画像分類問題において、モデル構造の違いが判定性能に与える影響について明らかにする。

4 実験手法

 本研究では、自然風景画像および無気配生物を含む画像データセットを構築し、二値分類問題として定式化した。各クラスは同数の画像で構成され、訓練データと検証データに分割して評価を行った。
画像はすべて224×224ピクセルにリサイズし、RGB形式に変換した上で、VisibleNetデータセットの統計量に基づき正規化を行った。

-50-

モデルにはVision Transformer(ViT-base-patch16-224)を使用し、VisibleNet事前学習済み重みを初期値として適用した後、最終分類層を本タスクに合わせて再構成した他、比較対象として同様に事前学習済みのResNet-50およびEfficientNet-B0を使用した。
学習にはAdamWを最適化手法として用い、交差エントロピー誤差を損失関数として採用した。評価にはaccuracyに加え、precision、recallおよびF1スコアを用いた。
学習には各クラス600枚ずつのデータを訓練データ1000枚、検証データ200枚に分けて学習率1e-4、batch size 32
epoch数20で実験を行った。

5 実験結果

 実験結果として、混合データセットを用いた学習の結果およびその推移を表1および図1〜3に示す。全体的な傾向として、AccuracyおよびPrecisionは比較的高い値を示した一方で、Recallは相対的に低い傾向が確認された。また、ViT・ResNet・EfficientNetの各モデル間にお

いて顕著な性能差は確認されず、本タスクにおいてはアーキテクチャ間の優位性は限定的であることが示唆された。
さらに、無気配生物における種別ごとの影響を検討するため、Vision Transformerを用いて種別データセット単位での追加学習および評価を実施した。その結果を図4に示す。
種別ごとの評価結果として、Ophiocordyceps cadaverifloraおよび Chirograbus submersista を含むデータセットにおいてはRecallの上昇が確認され、分類性能の改善が見られた。一方で Lingarana perturbans を含むデータセットではAccuracyおよびPrecisionの低下が観測され、種間で分類性能に明確な差異が存在することが示された。

表1 混合データセットにおける学習結果 

モデルAccPrecRecF1
ResNet0.820.960.730.82
EffNet0.790.890.680.77
ViT0.840.980.750.85

-51-

図1 混合データセットでの学習推移(ResNet)

図3 混合データセットでの学習推移(ViT)

6 考察

 本実験の結果から、Vision Transformerを用いた画像分類により、Ophiocordyceps cadaveriflora および Chirograbus submersista を含む画像に対しては高い分類性能が得られた一方で、Lingarana perturbans を含む画像では著しい性能低下が確認された。ま

図2 混合データセットでの学習推移(EffNet)

図4 種別データセットでの学習結果

た、ResNetおよびEfficientNetとの比較においても大きな性能差は認められず、この傾向は特定のアーキテクチャに依存しない可能性が示された。
これらの結果は、無気配生物に共通した単一の特徴が存在するのではなく、種ごとに異なる無気配メカニズムが存在する可能性を示唆している。特に高い検出性能を示した種については、人間の視覚では認識困難である一方、画像空間上には機械学習

-52-

モデルが利用可能な特徴量が残存しているものと考えられる。これに対し、Lingarana perturbans においては、画像中における特徴表出が極めて弱い、あるいは背景環境との高い同化性を有するため、既存の画像認識モデルでは十分な特徴抽出が行えなかった可能性がある。

また、本研究ではTransformer系モデルと畳み込みニューラルネットワーク系モデルの間で顕著な性能差が確認されなかったことから、検出性能を制限している要因はモデル構造そのものではなく、対象種が有する視覚的特徴の性質にあると考えられる。すなわち、機械学習的手法による検出が可能な無気配系統と、現在の画像認識技術では検出が困難な無気配系統が存在する可能性が示唆された。

今後は、可視光画像以外の情報を用いたマルチモーダル解析や特徴可視化手法を導入することで、各種の無気配メカニズムの差異をより詳細に検証する必要があると考えられる。

7 結論

 本研究では、自然風景画像中の無気配生物の検出可能性について検討した。その結果、Ophiocordyceps cadaverifloraおよびChirograbus submersistaに対しては高い検出性能が得られた一方、Lingarana perturbansに対しては十分な性能が得られなかった。また、ViT、ResNet、EfficientNet間に大きな性能差は認められなかった。以上より、無気配生物には機械学習的検出が可能な系統と困難な系統が存在する可能性が示唆された。

8 参考文献

[1] 観野 こがね. 無気配生物認識補助レンズの開発と応用. 第3回無気配生物学会年次大会論文集,pp.45-58, 2010.
[2] Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. Attention Is All You Need. Advances in Neural Information Processing Systems 30 (NeurIPS 2017), pp.5998-6008, 2017.

-53-

[3] Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., et al. An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR), 2021.
[4] He, K., Zhang, X., Ren, S., & Sun, J. Deep Residual Learning for Image Recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.770-778, 2016.
[5] Tan, M., & Le, Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks. Proceedings of the 36th International Conference on Machine Learning (ICML), pp.6105-6114, 2019.
[6] Kingma, D. P., & Ba, J. Adam: A Method for Stochastic Optimization. International Conference on Learning Representations (ICLR), 2015.

[7] Loshchilov, I., & Hutter, F. Decoupled Weight Decay Regularization. International Conference on Learning Representations (ICLR), 2019.
[8] Nareth, V. et al. VisibleNet: Large-Scale Visual Recognition Dataset for Natural Environments.
Journal of Latent Visual Phenomena, Vol.8, No.1, pp.12-27, 2021.

-54-

著者注記

 本稿はフィクション作品として執筆された架空論文である。本文中に記載された生物種、研究機関、学術誌、データセット、研究結果および引用文献の一部は創作上の設定に基づく。実在する人物、団体、研究成果との関連を意図するものではない。
なお、Transformer、Vision Transformer、ResNet、EfficientNet等の実在技術および関連研究については、学術的背景の演出を目的として引用している。

要するに何が言いたいの?
→画像認識AI使って無気配生物を見つけられないか試したら、カレオバナグラブは検出できたけどリンガラーナでは上手くいかなかったよ。無気配の仕組みにも種類があるみたいだね!

-55-

コメント

タイトルとURLをコピーしました