Core Concepts
ユーザーの高い期待に応えるため、段階的に精度の高いモデルを適用し、不確実性に基づいて適切に判断を遅延させることで、ユーザー信頼を維持する。
Abstract
本論文では、低リソース環境でのAI活用における課題に取り組むため、段階的なモデル適用アプローチを提案している。
まず、スマートフォン上の小型モデルを使用して初期推論を行う。この際、モデルの不確実性に基づいて判断を遅延させることで、ユーザーの期待に応えられない可能性を抑える。
次に、クラウド上の大型モデルを適用し、より正確な推論を行う。ただし、クラウドモデルでも不確実性が高い場合は、さらに人間の判断を仰ぐ。
このようなマルチステージのアプローチにより、ユーザーの信頼を維持しつつ、状況に応じて最適な推論を提供することができる。
提案手法は、インド全土の何千人もの綿花農家に展開されており、低リソース環境でのAI活用における一般的な課題解決策として期待されている。
Stats
提案手法のスマートフォンモデルは1,120万パラメータ、クラウドモデルは4,370万パラメータを有する。
スマートフォンモデルの平均推論時間は1秒未満であるのに対し、クラウドモデルの平均推論時間は約7時間、最頻値は約12時間と大幅に長い。
Quotes
"ユーザーの期待に応えられない可能性を抑えるため、モデルの不確実性に基づいて判断を遅延させる"
"マルチステージのアプローチにより、ユーザーの信頼を維持しつつ、状況に応じて最適な推論を提供する"