sLLM

A collection of 2 posts

[AI] sLLM을 위한 모델 서빙

[AI] sLLM을 위한 모델 서빙

sLLM 모델 서빙 개인이 LLM을 서빙하는 것은 비용이 매우 많이 듭니다. 뭐 느려도 사용만 하겠다고 CPU로 연산하면 사용 가능하겠지만, 그것도 쉽진 않죠. Deepseek-R1이 처음 나왔을 때 누가 맥미니를 최대 메모리로 6대(64GB x

Full Story

[AI] sLLM을 위한 모델 경량화

[AI] sLLM을 위한 모델 경량화

sLLM (smaller Large Language Model) 수백억~수천억개의 매개변수를 가지는 LLM과 달리, 수백만~수십억개의 적은 매개변수를 가지는 LLM. 모델의 크기가 작아, 컴퓨팅 리소스가 적어도 사용할 수 있습니다. 컴퓨팅이 적고 에너지 소모도 적어 모바일, 노트북

Full Story

Recent Posts

[Home-K8S] #22 FluxCD 계층과 분리 / 다중 클러스터 리소스 공유와 설정 분리

FluxCD - yaml 앞서 fluxcd 를 이용해서 helm chart 를 구성했습니다. 그 외에 일반적인 yaml

[Oracle Cloud] 무료로 k8s 모니터링 & 알람 설정하기 (on-prem) #1

홈랩 k8s 모니터링 기존에는 가장 기본적인 오픈소스 모니터링 시스템 (prometheus + grafana, loki + promtail) 을 구성해서

[Oracle Cloud] Oracle Cloud 도메인 쿼리 설정 (CoreDNS)

Oracle Cloud 에서 wireguard server 를 구성해서 네트워크를 연결했습니다. Oracle 에 Bucket 을 Private 로