llama.cpp

LLM inference in C/C++

★ 70,000 GitHub MIT LLM & Chat

Überblick

High-performance LLaMA inference on CPU and GPU, with a built-in server and Python bindings.

Anforderungen

Min vCPU

Min RAM

4096 MB

Min Disk

20 GB

Rec vCPU

Rec RAM

8192 MB

Rec Disk

40 GB

Empfohlener VPS

Contabo · VPS S

4 vCPU · 8192 MB · 100 GB

$4.50

Zum Anbieter

Contabo · VPS S

4 vCPU · 8192 MB · 100 GB

$4.50

Zum Anbieter

Contabo · VPS S

4 vCPU · 8192 MB · 100 GB

$4.50

Zum Anbieter

Affiliate-Hinweis

Docker Compose

# Generated by Run This Ai — docker-compose.yml
services:
  llama-cpp:
    image: ghcr.io/ggerganov/llama.cpp:server
    restart: unless-stopped
    ports:
      - 8080:8080
    volumes:
      - ./data/llama-cpp:/data

Bester VPS für llama.cpp →

Anleitungen & Artikel

How to Install llama.cpp on Ubuntu 24.04

A step-by-step installation guide.

Jun 27, 2026

llama.cpp

Überblick

Anforderungen

Empfohlener VPS

Contabo · VPS S

Contabo · VPS S

Contabo · VPS S

Docker Compose

Verwandte Tools

Ollama

Open WebUI

Phoenix

Anleitungen & Artikel

How to Install llama.cpp on Ubuntu 24.04