Core Concepts
GPT-4 비전 모델을 활용하여 단일 건물 외관 이미지만으로도 건물의 연대를 추정할 수 있다.
Abstract
이 연구에서는 GPT-4 비전 모델을 활용하여 건물 외관 이미지만으로도 건물의 연대를 추정하는 방법을 제안했다. 기존의 딥러닝 기반 모델들은 많은 양의 레이블링된 데이터가 필요했지만, GPT-4 비전 모델은 별도의 학습 없이도 건물 연대 추정이 가능하다.
연구팀은 런던 지역의 건물 외관 이미지 데이터셋 FI-London을 구축했다. 이 데이터셋은 15개의 다양한 건물 연대 구간을 포함하고 있다. GPT-4 비전 모델을 활용하여 이 데이터셋에 대한 건물 연대 추정을 수행한 결과, 정확도는 39.69%였지만 평균 오차는 0.85 decade로 나타났다. 이는 GPT-4 비전 모델이 건물 연대를 대략적으로 추정할 수 있음을 보여준다.
분석 결과, GPT-4 비전 모델은 1920-1939년대와 2000-2019년대 건물의 연대 추정에 가장 높은 성능을 보였다. 하지만 1840-1859년대와 1700년 이전 건물의 연대 추정에는 어려움을 겪었다. 이는 이 시기 건물들의 외관 특징이 모호하거나 리모델링 등으로 인해 구분이 어렵기 때문으로 분석된다.
전반적으로 GPT-4 비전 모델은 건물 외관 이미지만으로도 건물 연대를 대략적으로 추정할 수 있는 것으로 나타났다. 이는 건물 정보 관리, 도시 계획, 문화재 보존 등 다양한 분야에서 활용될 수 있을 것으로 기대된다. 향후 연구에서는 데이터셋 확장, 모델 성능 개선, 다른 건물 속성 추정 등을 통해 이 기술을 더욱 발전시킬 계획이다.
Stats
건물 연대 1940-1959년대의 경우 정확도가 100%로 가장 높았지만, 재현율은 21.43%로 낮았다.
건물 연대 1960-1979년대의 경우 재현율이 75%로 높았지만, 정확도는 28.57%로 낮았다.
건물 연대 1800-1819년대와 1880-1899년대의 경우 평균 절대 오차가 0.4-0.44 decade로 가장 낮았다.
Quotes
"GPT-4 비전 모델은 건물 외관 이미지만으로도 건물 연대를 대략적으로 추정할 수 있다."
"건물 연대 추정의 정확도는 건물 외관 특징의 명확성에 따라 달라지며, 리모델링 등으로 인해 오래된 건물의 연대 추정이 어려웠다."