Core Concepts
모바일 AIGC 서비스 제공자(MASP)는 사용자 프롬프트와 각 AIGC 출력 부분 간의 상관관계를 나타내는 일련의 크로스-모달 주의 맵을 활용하여 가장 의미적으로 중요한 콘텐츠를 효율적으로 필터링하고 전송할 수 있습니다. 이를 통해 사용자는 모바일 대역폭을 절약하면서도 높은 품질의 AIGC 출력을 복구할 수 있습니다.
Abstract
이 논문은 모바일 AIGC를 위한 크로스-모달 생성 의미 통신(G-SemCom) 프레임워크를 제안합니다.
크로스-모달 주의 맵 생성: MASP는 사용자 프롬프트와 각 AIGC 출력 부분 간의 상관관계를 나타내는 일련의 크로스-모달 주의 맵을 생성합니다. 이를 통해 프롬프트 컨텍스트를 분석하고 가장 의미적으로 중요한 콘텐츠를 효율적으로 필터링할 수 있습니다.
주의 기반 의미 추출: 주의 맵을 활용하여 MASP는 AIGC 출력의 의미적 특징을 추출하고 압축된 의미 정보를 사용자에게 전송합니다. 사용자는 생성 디코더를 사용하여 전체 AIGC 출력을 높은 품질로 복구할 수 있습니다.
의미 인코딩과 프롬프트 엔지니어링의 결합 최적화: 전송되는 정보가 의미를 보존할 뿐만 아니라 복구를 안내하므로, 우리는 제한된 대역폭 내에서 의미 유사성과 출력 품질을 동시에 최대화하는 문제를 정의합니다. 이를 위해 인간 지각 메트릭인 JPSQ를 제안하고, 주의 기반 깊은 확산(ADD) 알고리즘을 개발합니다.
실험 결과: 광범위한 실험을 통해 제안된 프레임워크와 알고리즘의 유효성을 입증합니다. 구체적으로 사용자의 대역폭 소비를 49.4% 줄일 수 있으며, 지각적 출력 품질 점수는 0.0299만 감소합니다. 또한 ADD 알고리즘은 기준 DRL 알고리즘에 비해 수렴 속도와 효율성이 크게 향상됩니다.
Stats
사용자의 대역폭 소비를 49.4% 줄일 수 있습니다.
지각적 출력 품질 점수는 0.0299만 감소합니다.
ADD 알고리즘은 기준 DRL 알고리즘에 비해 1.74배 높은 전체 보상을 얻습니다.
Quotes
"모바일 AIGC 서비스 제공자(MASP)는 사용자 프롬프트와 각 AIGC 출력 부분 간의 상관관계를 나타내는 일련의 크로스-모달 주의 맵을 활용하여 가장 의미적으로 중요한 콘텐츠를 효율적으로 필터링하고 전송할 수 있습니다."
"전송되는 정보가 의미를 보존할 뿐만 아니라 복구를 안내하므로, 우리는 제한된 대역폭 내에서 의미 유사성과 출력 품질을 동시에 최대화하는 문제를 정의합니다."