본 연구 논문에서는 실시간 협업 비전 인식, 특히 다수의 무인 지상 차량(UGV)이 보행자와 같은 움직이는 대상을 협력적으로 감지하고 추적하는 시나리오를 위한 강력한 작업 지향적 통신 프레임워크(R-TOCOM)를 제안합니다. 이 프레임워크는 동적 환경에서 멀티 카메라 네트워크가 직면하는 주요 과제, 즉 캘리브레이션 부정확성, 통신 제약, 데이터 시의성 확보의 필요성을 해결하는 데 중점을 둡니다.
협업 자기 캘리브레이션: R-TOCOM은 인접 UGV가 인식 데이터를 공유하여 실시간 외부 카메라 캘리브레이션을 수행할 수 있도록 하는 Re-ID 기반 접근 방식을 활용합니다. 이 방법은 전통적인 방법보다 더 높은 매칭 정확도를 제공하고 채널 용량에 따라 동적으로 특징 양자화를 조정하여 다양한 네트워크 조건에서 정확한 캘리브레이션을 보장합니다.
작업 지향적 압축: 캘리브레이션 후, 보행자 추적 및 Re-ID에 필요한 핵심 정보를 유지하면서 데이터 크기를 줄이기 위해 시각적 특징을 압축합니다. 이 압축 프로세스는 정보 병목 현상(IB) 원리를 기반으로 하며, 압축 및 추론 정확도 사이의 균형을 맞추면서 작업 관련 데이터 기능을 식별하고 인코딩합니다.
적응형 및 강력한 스케줄링: 압축된 특징은 공간 및 시간적 중복성을 줄이는 적응형 스케줄링 메커니즘을 통해 전송됩니다. 멀티 뷰 융합 및 채널 인식 필터링은 손상된 데이터를 필터링하고 안정적인 입력을 융합하여 강력성을 더욱 향상시킵니다. 이 접근 방식은 제한된 대역폭 시나리오에서 효율적인 데이터 전송을 보장합니다.
멀티 뷰 데이터 융합: 마지막으로 시스템은 수신된 데이터를 처리하여 보행자 점유 맵을 생성합니다. 이 맵은 환경에 대한 포괄적인 뷰를 제공하여 정확한 실시간 의사 결정을 가능하게 합니다.
향상된 인식 정확도: Re-ID 기반 캘리브레이션 및 멀티 뷰 데이터 융합을 통해 R-TOCOM은 다중 객체 감지 정확도(MODA)를 크게 향상시킵니다.
감소된 통신 비용: 작업 지향적 압축, 적응형 스케줄링, IB 기반 인코딩을 통해 R-TOCOM은 전송되는 데이터 양을 최소화하여 통신 오버헤드와 지연 시간을 효과적으로 줄입니다.
향상된 데이터 시의성: R-TOCOM은 데이터 최신성을 우선 순위로 하여 동적 환경에서 시의적절한 인식 및 의사 결정을 보장합니다.
전반적으로 R-TOCOM은 향상된 정확성, 효율성, 시의적절성으로 실시간 협업 비전 인식을 위한 포괄적인 솔루션을 제공합니다. 이 프레임워크는 자율 주행, 감지 시스템, 로봇 공학 등 다양한 분야에 적용될 수 있으며, 이러한 분야에서 정확하고 신뢰성 있는 실시간 인식이 중요합니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문