Schlagwort-Archiv: Copilot

Sprachmodelle (LLMs) lokal ausführen

ChatGPT, Copilot & Co. verwenden Large Language Models (LLMs). Diese werden auf leistungsstarken Servern ausgeführt und als Cloud-Services angeboten. Das funktioniert wunderbar. Aber nicht jeder will Daten, Text und Code ständig in die Cloud hochladen. Kann man also — mit »gewöhnlicher« Hardware — LLMs auch lokal ausführen?

Tatsächlich ist das verblüffend einfach. Das Tool der Wahl heißt Ollama. Was Docker für Container ist, ist Ollama für LLMs!

Ollama kann ziemlich mühelos unter Linux, macOS und Windows installiert werden. Unter Windows und macOS starten Sie Ollama als Hintergrunddienst mit einer winzigen grafischen Oberfläche (im Prinzip nur ein Icon, das den Status anzeigt). Unter Linux richten Sie den Dienst mit systemctl ein:

systemctl enable --now ollama
Der Screenshot zeigt ein Linux-Terminal, in dem Ollama ein Llama2-Modell ausführt und eine Programmieraufgabe beantwortet. Oben ist der Befehl „ollama run llama2 … --verbose“ zu sehen, darunter der Download/Verify-Output mit Layern und Größenangaben. Anschließend gibt das Modell Python-Code aus: eine Funktion, die mit Regex E‑Mail-Adressen aus einem String extrahiert, gefolgt von einer erklärenden Textsektion.
Ollama läuft im Terminal, kann aber auch per API genutzt werden (z.B. zur Realisierung einer Web-Schnittstelle).

Sprachmodelle (LLMs) lokal ausführen weiterlesen