핵심 개념
오픈 소스 비전-언어 모델인 Florence-2를 미세 조정하여 2D 엔지니어링 도면에서 GD&T 정보를 자동으로 추출하는 효율적인 방법을 소개하며, Florence-2는 GPT-4o 및 Claude-3.5-Sonnet과 같은 대규모 모델보다 우수한 성능을 보여줍니다.
초록
2D 엔지니어링 도면에서 자동으로 GD&T 정보를 추출하기 위한 비전-언어 모델 미세 조정: 연구 논문 요약
Khan, M. T., Chen, L., Ng, Y. H., Feng, W., Tan, N. Y. J., & Moon, S. K. (2024). Fine-Tuning Vision-Language Model for Automated Engineering Drawing Information Extraction.
본 연구 논문에서는 2D 엔지니어링 도면에서 GD&T(기하 공차) 정보를 자동으로 추출하는 효율적이고 정확한 방법을 제시하는 것을 목표로 합니다. 수작업으로 진행되던 GD&T 정보 추출 과정을 자동화하여 제조 공정의 효율성을 높이고 오류 가능성을 줄이는 것이 목표입니다.