Große Sprachmodelle (LLMs)

Frameworks, Tools und Ressourcen für Große Sprachmodelle (LLMs), einschließlich Training, Inferenz (vLLM, llama.cpp) und RAG.

Repositories

ollama / ollama

Ollama ist ein leichtgewichtiges Framework zum Ausführen und Verwalten von Open-Source-Sprachmodellen lokal. Es bietet eine einfache CLI und REST-API zum Erstellen von KI-Anwendungen und unterstützt Modelle wie Llama, Gemma und Mistral mit einfacher Integration in verschiedene Tools.

172.9k

8 hours ago

open-webui / open-webui

Open WebUI ist eine erweiterbare, funktionsreiche und benutzerfreundliche selbstgehostete KI-Plattform, die vollständig offline betrieben werden kann. Sie unterstützt verschiedene LLM-Runner wie Ollama und OpenAI-kompatible APIs mit integrierter Inferenz-Engine für RAG.

Python

139.5k

a day ago

langchain-ai / langchain

LangChain ist ein Framework zur Entwicklung von Agenten und LLM-gesteuerten Anwendungen. Es verbindet interoperable Komponenten und Drittanbieter-Integrationen, um die KI-Anwendungsentwicklung zu vereinfachen.

Python

138.2k

a day ago

deepseek-ai / DeepSeek-V3

DeepSeek-V3 ist ein leistungsstarkes Mixture-of-Experts (MoE)-Sprachmodell mit 671B Gesamtparametern, wobei pro Token 37B aktiviert werden. Es nutzt Multi-Head-Latent-Attention, FP8-Training und Multi-Token-Vorhersage und erreicht eine Leistung, die mit führenden geschlossenen Modellen vergleichbar ist, bei hoher Trainingseffizienz und Stabilität.

Python

103.7k

9 months ago

deepseek-ai / DeepSeek-R1

DeepSeek-R1 ist ein Reasoning-Modell der ersten Generation, das in Mathematik, Code und Logikaufgaben eine mit OpenAI-o1 vergleichbare Leistung erzielt. Das 671B-Parameter-Modell ist unter der MIT-Lizenz open-source.

92.0k

a year ago

vllm-project / vllm

vLLM ist eine schnelle und benutzerfreundliche Bibliothek für LLM-Inferenz und -Bereitstellung. Ursprünglich an der UC Berkeley entwickelt, bietet sie höchste Durchsatzleistung, effizientes Speichermanagement mit PagedAttention und nahtlose Integration mit Hugging Face-Modellen.

Python

81.7k

24 minutes ago

nomic-ai / gpt4all

GPT4All ist ein Open-Source-Ökosystem, das es ermöglicht, leistungsstarke große Sprachmodelle (LLMs) privat auf gängigen Desktop- und Laptop-Computern auszuführen. Keine API-Aufrufe oder GPUs erforderlich – laden Sie einfach die App herunter und chatten Sie mit lokalen KI-Modellen.

C++

77.3k

a year ago

binary-husky / gpt_academic

Ein umfassender akademischer KI-Assistent mit Unterstützung für mehrere LLMs (GPT/GLM/Qwen/DeepSeek). Spezialisiert auf Paper-Übersetzung, Textverbesserung, Code-Analyse und akademisches Schreiben mit modularem Plugin-System und anpassbaren Shortcuts.

Python

70.8k

4 months ago

meta-llama / llama

Offizielles Meta Llama 2 Inferenz-Code-Repository. Bietet minimale Implementierung zum Laden und Ausführen von Llama-Modellen (7B-70B Parameter) für Textvervollständigung und Chat-Anwendungen. Enthält Modellgewichte, Tokenizer und Beispielskripte für lokales Deployment.

Python

59.4k

a year ago

xai-org / grok-1

xAI's Grok-1: Ein 314B Parameter Mixture-of-Experts-Modell mit JAX-Implementierung. Open-Source-Gewichte und Architektur für fortgeschrittene KI-Forschung und Bereitstellung.

Python

51.7k

2 years ago

run-llama / llama_index

LlamaIndex ist ein Open-Source-Datenframework zum Erstellen von LLM-Anwendungen mit Retrieval-Augmented Generation (RAG). Bietet Datenkonnektoren, Indexierungswerkzeuge und Abfrageschnittstellen.

Python

49.8k

3 days ago

microsoft / BitNet

Microsofts offizielles Inferenz-Framework für 1-Bit-LLMs, bietet schnelle und verlustfreie Inferenz auf CPU und GPU mit optimierten Kerneln für effizientes Edge-Geräte-Deployment.

Python

39.1k

3 months ago

HKUDS / LightRAG

LightRAG ist ein leichtgewichtiges und effizientes Retrieval-Augmented Generation Framework, das Wissensgraphen mit Vektorsuche integriert. Es unterstützt multimodale Dokumentenverarbeitung, mehrere Speicher-Backends und bietet API- und Web-UI-Schnittstellen.

Python

36.0k

15 hours ago

SillyTavern / SillyTavern

Eine leistungsstarke lokale LLM-Frontend für Power-User, unterstützt mehrere KI-APIs, Bildgenerierung, TTS und umfangreiche Anpassungsoptionen für immersive Rollenspiel-Erlebnisse.

JavaScript

28.7k

13 days ago

QwenLM / Qwen3

Qwen3 ist eine fortschrittliche Open-Source-Sprachmodellreihe von Alibaba Cloud mit dualen Denk-/Nicht-Denk-Modi, 1M Token Kontext, Mehrsprachenunterstützung und modernsten Reasoning-Fähigkeiten.

Python

27.3k

5 months ago

huggingface / open-r1

Open R1 ist ein Community-gesteuertes Projekt zur vollständigen Reproduktion der DeepSeek-R1-Fähigkeiten. Es bietet Trainingspipelines, Auswertungsskripte und Datensätze für SFT, GRPO und Datengenerierung, die transparente KI-Entwicklung ermöglichen.

Python

26.0k

2 months ago

Collections

Große Sprachmodelle (LLMs)

Repositories

ollama / ollama

open-webui / open-webui

langchain-ai / langchain

deepseek-ai / DeepSeek-V3

deepseek-ai / DeepSeek-R1

vllm-project / vllm

nomic-ai / gpt4all

binary-husky / gpt_academic

meta-llama / llama

xai-org / grok-1

run-llama / llama_index

microsoft / BitNet

HKUDS / LightRAG

SillyTavern / SillyTavern

QwenLM / Qwen3

huggingface / open-r1

Graph