본 연구는 다양한 실세계 시나리오에 대해 별도의 학습 없이 빠르게 적응할 수 있는 장면 텍스트 인식 모델 E2STR을 제안한다. E2STR은 문맥 풍부한 장면 텍스트 시퀀스를 활용한 학습 전략을 통해 문맥 학습 능력을 갖추며, 이를 통해 소수의 예시만으로도 다양한 시나리오에 효과적으로 적응할 수 있다.