As I've always been

  • 홈
  • 태그
  • 미디어로그
  • 위치로그
  • 방명록

mixtral 1

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크

RouteLLM - LLM 라우터 서빙 및 평가를 위한 프레임워크RouteLLM은 LMSys와 Anyscale이 협력하여 개발한 LLM 라우터 serving 및 평가를 위한 프레임워크모델 지원GPT-4와 Mixtral 8x7B 외에도 strong-model과 weak-model 인수를 수정하여 다양한 모델 조합 사용 가능LiteLLM을 활용해 다양한 오픈소스 및 closed 모델에서 chat completions 지원OpenAI 호환 엔드포인트도 사용 가능다양한 모델 제공업체의 API 키 설정 방법 제공개발 동기비용과 기능이 다양한 LLM을 배포할 때 고품질 응답을 위해 가장 강력한 모델을 사용하면 비용이 많이 들고, 저렴한 모델을 사용하면 품질이 낮아질 수 있음LLM 라우팅은 간단한 쿼리를 저렴한 모델..

AI/AI News 2024.07.27
이전
1
다음
더보기
프로필사진

As I've always been

  • 분류 전체보기 (270)
    • AI (31)
      • LLM (8)
      • Transformers (2)
      • PyTorch (6)
      • Machine Learning (4)
      • 논문 리뷰 (1)
      • Kaggle Writeups (1)
      • AI News (7)
      • Nvidia Jetson (1)
      • AI로 생성한 작품 (1)
    • OS (23)
      • OS - Overview (9)
      • 메모리 관리 (6)
      • 프로세스 관리 (8)
    • Container (13)
      • Docker (4)
      • Kubernetes (6)
    • DevOps (5)
      • OpenTelemetry (1)
      • 백엔드 (1)
      • NGINX (1)
    • 시스템 설계 및 디자인 패턴 (3)
      • 시스템 설계 (1)
      • 클라우드 디자인 패턴 (1)
    • Python (18)
      • ray (1)
      • FastAPI (2)
      • scikit-learn (1)
      • Flask (3)
      • sqlalchemy (5)
    • DB (16)
      • PostgreSQL (8)
      • MySQL (2)
      • Vector DB (2)
    • C++ (40)
      • C++ 기본 (40)
    • Java (52)
      • Java 기본 (45)
      • JVM (2)
      • Java Tips (4)
    • 알고리즘 (8)
    • JavaScript (17)
      • Node.js (6)
      • React Native (4)
      • JavaScript 기본 (6)
    • IoT (5)
    • Object Oriented Programming (1)
    • 네트워크 (4)
    • Web (7)
      • html & css (3)
    • Linux (4)
    • Android (6)
    • Shell script (3)
    • 인코딩 (1)
    • AWS (1)

Tag

decoder-only transformer, GPT, MultiQuery Attention, MultiHead Attention, 오픈소스AI, SQL, LLM, Python, opensource llm, simple queue service, Multi-Query Attention, flask, SQLAlchemy, llama3.1, 파이썬 성능 튜닝, 라마3, docker, pytorch, mixtral, fifo queue,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바