소형 언어 모델(SLM) 핵심 가이드 한 줄 정의 **소형 언어 모델(Small/Smaller Language Model, SLM)**은 수억~수십억(≈0.5B–10B) 파라미터 규모의 경량 LLM으로, 저지연·저비용·온디바이스/에지 실행을 목표로 설계된 모델입니다. “정답률 최고”보다 응답 속도·비용·배포 용이성·프라이버시를 우선합니다.

왜 SLM인가? 지연 시간↓: 실시간 인터랙션(에이전트, 음성/채팅 UI)에서 체감 반응성 확보 비용 절감: 추론 비용과 메모리 풋프린트가 작아 대량 트래픽/내부 업무에 유리 프라이버시/규제: 온디바이스 또는 VPC 내부 배치로 데이터 외부 반출 최소화 에너지 효율: 모바일/엣지/저사양 서버에서도 구동 가능 대표 활용 시나리오 요약·분류·라벨링: 이메일/티켓/문서 라우팅, 민감정보 마스킹 도메인 질의응답(RAG): 사내 KB/문서 검색 + 간결한 답변 작성 에이전트 오케스트레이션: 툴 호출·상태관리·간단한 계획 수립(복잡 추론은 LLM로 폴백) 온...