이 논문은 AI 생성 이미지 내 텍스트의 정확성과 가독성을 평가하기 위한 ABHINAW 평가 방법을 소개한다.
먼저 기존의 단순 정확도 비교 방식의 한계를 분석한다. 이를 해결하기 위해 다음과 같은 방법을 제안한다:
이를 종합한 ABHINAW 점수는 AI 생성 이미지 내 텍스트의 정확성과 가독성을 종합적으로 평가할 수 있다.
실험 결과, ABHINAW 점수는 텍스트 길이가 증가할수록 감소하는 경향을 보였다. 또한 사람이 수동으로 평가한 결과와 자동 평가 결과 간 높은 상관관계를 보였다.
향후 연구 방향으로 "두 가지 프롬프트" 솔루션, 동적 배경 재생성, 시각적 코사인 유사도 등을 제안한다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Abhinaw Jagt... ב- arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.11874.pdfשאלות מעמיקות