Core Concepts
本研究は、国内外の健康機関の推奨に基づいた栄養学的分類を含む初めての食品画像データベースを提案し、深層学習モデルを用いた食品認識タスクのベンチマークを行うものである。
Abstract
本研究では、AI4Food-NutritionDBと呼ばれる新しい食品画像データベースを提案している。このデータベースは、6つの栄養レベル、19の主要カテゴリ、73のサブカテゴリ、893の最終製品から構成される栄養学的分類を含んでいる。また、各サブカテゴリは、健康度と食品量に関連する7種類の料理タイプ(主菜、前菜、スナック、デザート、サイドディッシュ、パン、ドリンク)に分類されている。
AI4Food-NutritionDBは、UECFood-256、Food-101、Food-11、FruitVeg-81、MAFood-121、ISIA Food-500、VIPER-FoodNetの7つの既存データベースを組み合わせて構築されており、合計で558,676枚の食品画像が収録されている。
さらに、本研究では、XceptionとEfficient-NetV2の2つの深層学習アーキテクチャを用いて、AI4Food-NutritionDBに対するカテゴリ、サブカテゴリ、最終製品の3つの認識タスクのベンチマークを行っている。実験の結果、カテゴリ認識タスクでは最高82.04%のTop-1精度が得られたが、製品レベルの認識精度は66.28%と低下した。これは、同じ食品でも調理方法の違いなどにより外観が類似しているためと考えられる。
また、AI4Food-NutritionDBで事前学習したモデルを、VireoFood-251データベースに適用したところ、ImageNetで事前学習したモデルと比べて大幅な精度向上が見られた。これにより、提案するデータベースとベンチマークが、食品画像認識分野の発展に寄与できることが示された。
Stats
食品画像データベースには558,676枚の画像が含まれている。
食品は6つの栄養レベル、19の主要カテゴリ、73のサブカテゴリ、893の最終製品に分類されている。
各サブカテゴリは7種類の料理タイプに分類されている。