ollama

A collection of 2 posts

[AI] sLLM을 위한 모델 서빙

[AI] sLLM을 위한 모델 서빙

sLLM 모델 서빙 개인이 LLM을 서빙하는 것은 비용이 매우 많이 듭니다. 뭐 느려도 사용만 하겠다고 CPU로 연산하면 사용 가능하겠지만, 그것도 쉽진 않죠. Deepseek-R1이 처음 나왔을 때 누가 맥미니를 최대 메모리로 6대(64GB x

Full Story

[Home-K8S] #5 k8sgpt 설치 (code-server)

[Home-K8S] #5 k8sgpt 설치 (code-server)

k8sgpt k8sgpt라는 llm으로 내 k8s를 검사하고 솔루션까지 알려준다는 아주 매력적인 이야기를 하는 서비스가 있습니다. 실제로 구성해서 오류 Pod를 만들어서 해보면 솔루션이 나옵니다. k8sgpt analyze --namespace default --filter Pod --explain K8S Code-Server에 k8sgpt 구성하기

Full Story

Recent Posts

[Home-K8S] #22 FluxCD 계층과 분리 / 다중 클러스터 리소스 공유와 설정 분리

FluxCD - yaml 앞서 fluxcd 를 이용해서 helm chart 를 구성했습니다. 그 외에 일반적인 yaml

[Oracle Cloud] 무료로 k8s 모니터링 & 알람 설정하기 (on-prem) #1

홈랩 k8s 모니터링 기존에는 가장 기본적인 오픈소스 모니터링 시스템 (prometheus + grafana, loki + promtail) 을 구성해서

[Oracle Cloud] Oracle Cloud 도메인 쿼리 설정 (CoreDNS)

Oracle Cloud 에서 wireguard server 를 구성해서 네트워크를 연결했습니다. Oracle 에 Bucket 을 Private 로