AI/AI News

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

검정비니 2024. 7. 27. 22:17

728x90

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

RouteLLM은 LMSys와 Anyscale이 협력하여 개발한 LLM 라우터 serving 및 평가를 위한 프레임워크

모델 지원

GPT-4와 Mixtral 8x7B 외에도 strong-model과 weak-model 인수를 수정하여 다양한 모델 조합 사용 가능
LiteLLM을 활용해 다양한 오픈소스 및 closed 모델에서 chat completions 지원
OpenAI 호환 엔드포인트도 사용 가능
다양한 모델 제공업체의 API 키 설정 방법 제공

개발 동기

비용과 기능이 다양한 LLM을 배포할 때 고품질 응답을 위해 가장 강력한 모델을 사용하면 비용이 많이 들고, 저렴한 모델을 사용하면 품질이 낮아질 수 있음
LLM 라우팅은 간단한 쿼리를 저렴한 모델로 보내 비용을 절감하면서 품질을 유지하는 솔루션 제공
각 요청에는 비용-품질 tradeoff를 결정하는 cost threshold가 연관됨

서버

RouteLLM은 다양한 라우팅 전략에 따라 요청을 라우팅하기 위한 경량 OpenAI 호환 서버 제공
--routers로 사용 가능한 라우터 목록 지정, --config로 라우터 설정 파일 경로 지정
대부분의 경우 강력하고 가벼운 mf 라우터 사용 권장
클라이언트는 model 필드에 라우터 이름과 threshold를 지정하여 요청

Threshold 보정

라우팅에 사용되는 threshold는 비용-품질 tradeoff를 제어함
라우터 유형과 받는 쿼리에 따라 의미 있는 threshold 범위가 다르므로, 샘플 쿼리와 강한 모델로 보낼 쿼리 비율을 사용해 보정하는 것이 좋음
기본적으로 Chatbot Arena 데이터셋을 기반으로 threshold 보정 지원
실제 수신하는 쿼리 유형과 유사한 데이터셋에서 보정하는 것이 좋음

평가

RouteLLM은 벤치마크에서 다양한 라우팅 전략의 성능을 측정하기 위한 평가 프레임워크도 포함
--routers로 평가할 라우터 목록 지정, --benchmark로 평가할 특정 벤치마크 지정
평가 결과는 콘솔에 출력되고, 라우터 성능 그래프도 생성됨
기본적으로 GPT-4와 Mixtral이 평가에 사용되는 모델 쌍이며, --strong-model과 --weak-model 플래그로 수정 가능

라우터

RouteLLM은 gpt-4-1106-preview와 mixtral-8x7b-instruct-v0.1 모델 쌍에 대해 훈련된 4개의 라우터 제공
라우터 목록: mf, sw_ranking, bert, causal_llm, random
이 라우터들은 다른 강한/약한 모델 쌍에도 잘 일반화되므로 모델 쌍을 교체해도 다시 학습할 필요 없음

저작자표시

'AI > AI News' 카테고리의 다른 글

AI 데이터 인프라의 부상 (1)	2024.11.25
NVIDIA garak - LLM 취약점 스캐너 (1)	2024.11.19
Briefer – 일정, SQL, 내장 LLM이 포함된 멀티플레이어 노트북 (0)	2024.07.27
Google, AI 계약 덕분에 Reddit에서 작동하는 유일한 검색 엔진이 되다 (0)	2024.07.27
"오픈소스 AI가 미래의 길입니다" by 마크 주커버그 (0)	2024.07.27

현재글RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

As I've always been

docker, MultiQuery Attention, decoder-only transformer, opensource llm, fifo queue, flask, GPT, Multi-Query Attention, llama3.1, 파이썬 성능 튜닝, simple queue service, SQLAlchemy, mixtral, SQL, 라마3, 오픈소스AI, pytorch, Python, MultiHead Attention, LLM,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

As I've always been

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

'AI > AI News' 카테고리의 다른 글

'AI/AI News'의 다른글

티스토리툴바

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

'AI > AI News' 카테고리의 다른 글

'AI/AI News'의 다른글

관련글

티스토리툴바