Große Sprachmodelle (LLMs)

Frameworks, Tools und Ressourcen für Große Sprachmodelle (LLMs), einschließlich Training, Inferenz (vLLM, llama.cpp) und RAG.

Repositories

Ollama ist ein leichtgewichtiges Framework zum Ausführen und Verwalten von Open-Source-Sprachmodellen lokal. Es bietet eine einfache CLI und REST-API zum Erstellen von KI-Anwendungen und unterstützt Modelle wie Llama, Gemma und Mistral mit einfacher Integration in verschiedene Tools.

Go
169.1k
9 hours ago
langchain-ai/langchain

LangChain ist ein Framework zur Entwicklung von Agenten und LLM-gesteuerten Anwendungen. Es verbindet interoperable Komponenten und Drittanbieter-Integrationen, um die KI-Anwendungsentwicklung zu vereinfachen.

Python
133.7k
4 hours ago
open-webui/open-webui

Open WebUI ist eine erweiterbare, funktionsreiche und benutzerfreundliche selbstgehostete KI-Plattform, die vollständig offline betrieben werden kann. Sie unterstützt verschiedene LLM-Runner wie Ollama und OpenAI-kompatible APIs mit integrierter Inferenz-Engine für RAG.

Python
132.1k
4 hours ago

DeepSeek-V3 ist ein leistungsstarkes Mixture-of-Experts (MoE)-Sprachmodell mit 671B Gesamtparametern, wobei pro Token 37B aktiviert werden. Es nutzt Multi-Head-Latent-Attention, FP8-Training und Multi-Token-Vorhersage und erreicht eine Leistung, die mit führenden geschlossenen Modellen vergleichbar ist, bei hoher Trainingseffizienz und Stabilität.

Python
102.6k
8 months ago

DeepSeek-R1 ist ein Reasoning-Modell der ersten Generation, das in Mathematik, Code und Logikaufgaben eine mit OpenAI-o1 vergleichbare Leistung erzielt. Das 671B-Parameter-Modell ist unter der MIT-Lizenz open-source.

92.0k
10 months ago

GPT4All ist ein Open-Source-Ökosystem, das es ermöglicht, leistungsstarke große Sprachmodelle (LLMs) privat auf gängigen Desktop- und Laptop-Computern auszuführen. Keine API-Aufrufe oder GPUs erforderlich – laden Sie einfach die App herunter und chatten Sie mit lokalen KI-Modellen.

C++
77.3k
a year ago

vLLM ist eine schnelle und benutzerfreundliche Bibliothek für LLM-Inferenz und -Bereitstellung. Ursprünglich an der UC Berkeley entwickelt, bietet sie höchste Durchsatzleistung, effizientes Speichermanagement mit PagedAttention und nahtlose Integration mit Hugging Face-Modellen.

Python
76.8k
4 hours ago

Ein umfassender akademischer KI-Assistent mit Unterstützung für mehrere LLMs (GPT/GLM/Qwen/DeepSeek). Spezialisiert auf Paper-Übersetzung, Textverbesserung, Code-Analyse und akademisches Schreiben mit modularem Plugin-System und anpassbaren Shortcuts.

Python
70.4k
3 months ago

Offizielles Meta Llama 2 Inferenz-Code-Repository. Bietet minimale Implementierung zum Laden und Ausführen von Llama-Modellen (7B-70B Parameter) für Textvervollständigung und Chat-Anwendungen. Enthält Modellgewichte, Tokenizer und Beispielskripte für lokales Deployment.

Python
59.3k
a year ago

xAI's Grok-1: Ein 314B Parameter Mixture-of-Experts-Modell mit JAX-Implementierung. Open-Source-Gewichte und Architektur für fortgeschrittene KI-Forschung und Bereitstellung.

Python
51.5k
2 years ago

LlamaIndex ist ein Open-Source-Datenframework zum Erstellen von LLM-Anwendungen mit Retrieval-Augmented Generation (RAG). Bietet Datenkonnektoren, Indexierungswerkzeuge und Abfrageschnittstellen.

Python
48.6k
7 hours ago

Microsofts offizielles Inferenz-Framework für 1-Bit-LLMs, bietet schnelle und verlustfreie Inferenz auf CPU und GPU mit optimierten Kerneln für effizientes Edge-Geräte-Deployment.

Python
38.3k
a month ago

LightRAG ist ein leichtgewichtiges und effizientes Retrieval-Augmented Generation Framework, das Wissensgraphen mit Vektorsuche integriert. Es unterstützt multimodale Dokumentenverarbeitung, mehrere Speicher-Backends und bietet API- und Web-UI-Schnittstellen.

Python
33.4k
a day ago

Qwen3 ist eine fortschrittliche Open-Source-Sprachmodellreihe von Alibaba Cloud mit dualen Denk-/Nicht-Denk-Modi, 1M Token Kontext, Mehrsprachenunterstützung und modernsten Reasoning-Fähigkeiten.

Python
27.1k
3 months ago
huggingface/open-r1

Open R1 ist ein Community-gesteuertes Projekt zur vollständigen Reproduktion der DeepSeek-R1-Fähigkeiten. Es bietet Trainingspipelines, Auswertungsskripte und Datensätze für SFT, GRPO und Datengenerierung, die transparente KI-Entwicklung ermöglichen.

Python
26.0k
14 days ago
SillyTavern/SillyTavern

Eine leistungsstarke lokale LLM-Frontend für Power-User, unterstützt mehrere KI-APIs, Bildgenerierung, TTS und umfangreiche Anpassungsoptionen für immersive Rollenspiel-Erlebnisse.

JavaScript
25.7k
2 days ago