Linnk AI 다운로드
•
자율 연구 보조원
>
로그인
통찰
-
LLM 추론 최적화
LLM 추론에서 처리량-지연 트레이드오프를 Sarathi-Serve로 다루기
LLM 추론에서 처리량과 지연을 최적화하는 Sarathi-Serve의 효율성
1