本研究の目的は、コンピュータービジョン技術を用いてガスを検出し、サーマル画像の低テクスチャの問題に取り組むことである。ガスは熱赤外画像でのみ可視化されるが、サーマル画像にはノイズが多く、ガス領域と背景の区別が困難である。
そこで本研究では、RGB画像の豊富な意味情報を活用してサーマル画像のガス領域を検出するRGB-サーマルクロスアテンションネットワーク(RT-CAN)を提案した。RT-CANは、RGB画像の情報をサーマル画像の特徴に統合することで、ガス領域の検出精度を向上させる。
また、ガス検出研究を促進するために、8種類の背景シーンを含む1,293枚のRGB-サーマル画像からなるGas-DBデータセットを新たに構築した。従来のデータセットは単一の背景しか含まれていなかったが、Gas-DBは実世界に近い多様なシーンを網羅している。
実験の結果、RT-CANは従来手法よりも高精度にガスを検出できることが示された。また、Gas-DBの有用性も確認された。本研究の成果は、視覚的に検知できないガスの検出技術の発展に貢献するものと期待される。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問