大型語言模型 (LLMs)

大型語言模型 (LLMs) 相關的框架、工具與資源,涵蓋訓練、推論(vLLM、llama.cpp)及檢索增強生成(RAG)。

Repositories

Grok open release

Python
51.5k
2 years ago

DeepSeek-V3 是一款強大的混合專家(MoE)語言模型,總參數量 671B,每個 token 激活 37B 參數。採用多頭潛在注意力機制、FP8 混合精度訓練和多 token 預測技術,在多項基準測試中超越其他開源模型,性能媲美領先閉源模型,同時保持高效穩定的訓練過程。

Python
101.9k
6 months ago

DeepSeek-R1 是深度求索推出的首代理性推理模型,在數學、程式碼和推理任務上性能對標 OpenAI-o1。該模型擁有 671B 參數 MoE 架構,開源了完整模型權重及 6 個蒸餾版本,採用 MIT 協議支援商用。

91.9k
8 months ago

Inference code for Llama models

Python
59.2k
a year ago

Qwen3 is the large language model series developed by Qwen team, Alibaba Cloud.

Python
26.7k
2 months ago

Ollama 是一個輕量級框架,用於在本地運行和管理開源大語言模型。它提供簡潔的命令行工具和 REST API,支援 Llama、Gemma、Mistral 等模型,可輕鬆整合到各種開發工具和平台中,讓開發者快速建構本地 AI 應用。

Go
164.0k
3 hours ago

vLLM 是一個快速且易於使用的大型語言模型推理與服務函式庫。最初由加州大學柏克萊分校開發,具備業界領先的吞吐量、基於 PagedAttention 的高效記憶體管理、連續批次處理功能,並與 Hugging Face 模型無縫整合。

Python
71.8k
3 hours ago
langchain-ai/langchain

LangChain 是一個用於建構智慧代理和大語言模型驅動應用程式的框架。它透過連接可互通的元件和第三方整合,簡化 AI 應用程式開發,並幫助開發者在技術快速演進時保持靈活性。

Python
128.1k
5 hours ago

LlamaIndex is the leading document agent and OCR platform

Python
47.3k
16 hours ago
SillyTavern/SillyTavern

LLM Frontend for Power Users.

JavaScript
23.8k
9 hours ago

The definitive Web UI for local AI, with powerful features and easy setup.

Python
46.1k
a month ago
open-webui/open-webui

Open WebUI 是一個可擴展、功能豐富且使用者友善的自託管 AI 平台,設計為完全離線運作。它支援 Ollama 和 OpenAI 相容 API 等多種 LLM 運行器,內建 RAG 推理引擎,是強大的 AI 部署解決方案。

Python
125.6k
2 hours ago

GPT4All 是一個開源專案,讓你能在一般電腦和筆記型電腦上私密執行大型語言模型(LLM)。無需 API 呼叫或 GPU,只需下載應用程式即可開始與本地 AI 模型對話,資料完全保留在本地。

C++
77.2k
9 months ago
huggingface/open-r1

Fully open reproduction of DeepSeek-R1

Python
25.9k
3 months ago

Official inference framework for 1-bit LLMs

Python
28.6k
a month ago

为GPT/GLM等LLM大语言模型提供实用化交互接口,特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, moss等。

Python
70.2k
a month ago

[EMNLP2025] "LightRAG: Simple and Fast Retrieval-Augmented Generation"

Python
28.9k
18 hours ago