Reka는 Reka Core, Flash 및 Edge라는 강력한 멀티모달 언어 모델 시리즈를 소개한다. 이 모델들은 텍스트, 이미지, 비디오 및 오디오 입력을 처리하고 추론할 수 있다.
Reka Edge와 Reka Flash는 동급 모델 중 최고 수준의 성능을 보이며, 더 큰 모델들을 능가한다. Reka Core는 최고 수준의 모델들(OpenAI, Google, Anthropic)과 경쟁할 수 있는 수준이다.
Reka Core는 이미지 질문 답변 벤치마크(MMMU, VQAv2)에서 GPT4-V와 경쟁력 있는 성능을 보였다. 멀티모달 채팅에서는 두 번째로 선호되는 모델로 평가되었고, Claude 3 Opus를 능가했다.
텍스트 벤치마크에서 Reka Core는 MMLU, GSM8K 등의 지표에서 다른 최고 수준 모델들과 경쟁력 있는 성능을 보였고, GPT4-0613을 능가했다. 비디오 질문 답변(Perception-Test)에서는 Gemini Ultra를 능가했다.
Reka Edge와 Flash 모델들도 동급 모델 중 최고 수준의 성능을 보였다. Reka Edge는 Gemma 7B와 Mistral 7B를 능가했고, Reka Flash는 GPT-3.5 Turbo, Grok-1, Mistral Medium, Gemini Pro 1.0 등 더 큰 모델들을 능가했다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Aitor Ormaza... at arxiv.org 04-19-2024
https://arxiv.org/pdf/2404.12387.pdfDeeper Inquiries