728x90
반응형
RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크
- RouteLLM은 LMSys와 Anyscale이 협력하여 개발한 LLM 라우터 serving 및 평가를 위한 프레임워크
모델 지원
- GPT-4와 Mixtral 8x7B 외에도 strong-model과 weak-model 인수를 수정하여 다양한 모델 조합 사용 가능
- LiteLLM을 활용해 다양한 오픈소스 및 closed 모델에서 chat completions 지원
- OpenAI 호환 엔드포인트도 사용 가능
- 다양한 모델 제공업체의 API 키 설정 방법 제공
개발 동기
- 비용과 기능이 다양한 LLM을 배포할 때 고품질 응답을 위해 가장 강력한 모델을 사용하면 비용이 많이 들고, 저렴한 모델을 사용하면 품질이 낮아질 수 있음
- LLM 라우팅은 간단한 쿼리를 저렴한 모델로 보내 비용을 절감하면서 품질을 유지하는 솔루션 제공
- 각 요청에는 비용-품질 tradeoff를 결정하는 cost threshold가 연관됨
서버
- RouteLLM은 다양한 라우팅 전략에 따라 요청을 라우팅하기 위한 경량 OpenAI 호환 서버 제공
- --routers로 사용 가능한 라우터 목록 지정, --config로 라우터 설정 파일 경로 지정
- 대부분의 경우 강력하고 가벼운 mf 라우터 사용 권장
- 클라이언트는 model 필드에 라우터 이름과 threshold를 지정하여 요청
Threshold 보정
- 라우팅에 사용되는 threshold는 비용-품질 tradeoff를 제어함
- 라우터 유형과 받는 쿼리에 따라 의미 있는 threshold 범위가 다르므로, 샘플 쿼리와 강한 모델로 보낼 쿼리 비율을 사용해 보정하는 것이 좋음
- 기본적으로 Chatbot Arena 데이터셋을 기반으로 threshold 보정 지원
- 실제 수신하는 쿼리 유형과 유사한 데이터셋에서 보정하는 것이 좋음
평가
- RouteLLM은 벤치마크에서 다양한 라우팅 전략의 성능을 측정하기 위한 평가 프레임워크도 포함
- --routers로 평가할 라우터 목록 지정, --benchmark로 평가할 특정 벤치마크 지정
- 평가 결과는 콘솔에 출력되고, 라우터 성능 그래프도 생성됨
- 기본적으로 GPT-4와 Mixtral이 평가에 사용되는 모델 쌍이며, --strong-model과 --weak-model 플래그로 수정 가능
라우터
- RouteLLM은 gpt-4-1106-preview와 mixtral-8x7b-instruct-v0.1 모델 쌍에 대해 훈련된 4개의 라우터 제공
- 라우터 목록: mf, sw_ranking, bert, causal_llm, random
- 이 라우터들은 다른 강한/약한 모델 쌍에도 잘 일반화되므로 모델 쌍을 교체해도 다시 학습할 필요 없음
반응형
'AI > AI News' 카테고리의 다른 글
AI 데이터 인프라의 부상 (1) | 2024.11.25 |
---|---|
NVIDIA garak - LLM 취약점 스캐너 (1) | 2024.11.19 |
Briefer – 일정, SQL, 내장 LLM이 포함된 멀티플레이어 노트북 (0) | 2024.07.27 |
Google, AI 계약 덕분에 Reddit에서 작동하는 유일한 검색 엔진이 되다 (0) | 2024.07.27 |
"오픈소스 AI가 미래의 길입니다" by 마크 주커버그 (0) | 2024.07.27 |