AI/AI News

NVIDIA garak - LLM 취약점 스캐너

검정비니 2024. 11. 19. 13:25
728x90
반응형
  • Garak은 LLM 기반 시스템의 취약점을 찾기 위해 개발된 무료 도구
  • 주로 LLM의 오작동과 보안 문제를 검사하며, nmap의 LLM 버전이라 할 수 있음
  • 다양한 정적, 동적, 적응형 탐침(probes)을 사용하여 LLM의 여러 취약점을 탐색

Garak의 주요 기능

  • LLM의 실패 지점 확인: 잘못된 정보 생성, 데이터 유출, 프롬프트 인젝션, 독성 생성, 제일브레이크(jailbreak) 등 여러 약점을 탐색
  • 다양한 프로빙 기법 사용: 수십 개의 플러그인과 수많은 탐침을 통해 다양한 LLM 실패 모드를 분석
  • 로그 기록: 각 실패 사례에 대해 프롬프트, 목표, 응답을 포함한 상세한 로그 제공
  • 지속적인 업데이트: 커뮤니티의 기여로 새로운 탐침이 추가되고 기존 탐침이 개선되며, 테스트 범위가 지속적으로 확대

Garak의 주요 특징

  • LLM 보안에 초점
    • LLM 고유의 취약점을 중점적으로 검사
      • 프롬프트 인젝션, 제일브레이크, 가드레일 우회, 텍스트 재생 공격 등
    • 기타 ML 보안 도구와는 달리 LLM 보안에만 집중
  • 자동화된 스캐닝
    • 다양한 탐침을 자동으로 실행하며, 탐지기 설정과 속도 제한 처리도 자동화
    • 기본 설정만으로도 전체 표준 스캔이 가능하지만, 사용자 맞춤형 설정도 가능
  • 다양한 LLM 지원
    • OpenAI, Hugging Face, Cohere, Replicate 등 여러 LLM과 연결 가능
    • 커뮤니티 기여 기반으로 더 많은 LLM 지원 추가 예정
  • 구조화된 보고 기능
    • 스크린 출력: 스캔 진행 상황 실시간 모니터링
    • 리포트 로그: 각 프롬프트와 응답의 상세 기록
    • 히트 로그(Hit log): 취약점 발견 시 기록
    • 디버그 로그: 문제 해결 및 Garak 작동 기록

 

https://github.com/NVIDIA/garak

반응형