Большие языковые модели (LLMs)

Фреймворки, инструменты и ресурсы для больших языковых моделей (LLMs), включая обучение, инференс (vLLM, llama.cpp) и RAG.

Репозитории

ollama / ollama

Ollama — это легковесный фреймворк для запуска и управления открытыми большими языковыми моделями локально. Он предоставляет простой CLI и REST API для создания AI-приложений, поддерживая модели Llama, Gemma, Mistral и другие с легкой интеграцией в различные инструменты.

172.6k

6 hours ago

open-webui / open-webui

Open WebUI — это расширяемая, функциональная и удобная платформа для самостоятельного размещения ИИ, предназначенная для работы полностью в автономном режиме. Поддерживает различные LLM-раннеры, включая Ollama и совместимые с OpenAI API, со встроенным движком вывода для RAG.

Python

139.2k

a day ago

langchain-ai / langchain

LangChain — это фреймворк для создания агентов и приложений на основе больших языковых моделей. Он помогает связывать взаимозаменяемые компоненты и сторонние интеграции для упрощения разработки ИИ-приложений.

Python

138.0k

17 hours ago

deepseek-ai / DeepSeek-V3

DeepSeek-V3 — мощная языковая модель архитектуры Mixture-of-Experts (MoE) с 671 млрд параметров, из которых 37 млрд активируются на токен. Использует многоголовое латентное внимание, FP8-обучение и мульти-токенное предсказание, достигая производительности, сопоставимой с ведущими закрытыми моделями, при высокой эффективности обучения.

Python

103.6k

9 months ago

deepseek-ai / DeepSeek-R1

DeepSeek-R1 — модель рассуждений первого поколения, достигающая производительности, сопоставимой с OpenAI-o1, в задачах по математике, коду и логике. Модель с 671B параметрами открыта под лицензией MIT.

92.0k

a year ago

vllm-project / vllm

vLLM — это быстрая и простая в использовании библиотека для инференса и обслуживания больших языковых моделей. Разработанная в UC Berkeley, она обеспечивает высокую пропускную способность, эффективное управление памятью и интеграцию с моделями Hugging Face.

Python

81.4k

9 hours ago

nomic-ai / gpt4all

GPT4All — это экосистема с открытым исходным кодом, позволяющая запускать большие языковые модели (LLM) конфиденциально на обычных настольных компьютерах и ноутбуках. Не требуются API-вызовы или GPU — просто скачайте приложение и начните общаться с локальными ИИ-моделями.

C++

77.3k

a year ago

binary-husky / gpt_academic

Академический AI-ассистент с поддержкой множества LLM (GPT/GLM/Qwen/DeepSeek). Специализируется на переводе статей, полировке текстов, анализе кода и академическом письме с модульной системой плагинов и настраиваемыми ярлыками.

Python

70.8k

4 months ago

meta-llama / llama

Официальный репозиторий кода вывода Meta Llama 2. Предоставляет минимальную реализацию для загрузки и запуска моделей Llama (7B-70B параметров) для приложений завершения текста и чата. Включает веса моделей, токенизатор и примеры скриптов для локального развертывания.

Python

59.4k

a year ago

xai-org / grok-1

Grok-1 от xAI: Модель Mixture-of-Experts с 314B параметрами и реализацией на JAX. Открытые веса и архитектура для передовых исследований и развертывания ИИ.

Python

51.7k

2 years ago

run-llama / llama_index

LlamaIndex — это фреймворк с открытым исходным кодом для создания приложений на основе больших языковых моделей (LLM) с использованием генерации с усилением поиска (RAG). Предоставляет соединители данных, инструменты индексации и интерфейсы запросов.

Python

49.7k

a day ago

microsoft / BitNet

Официальный фреймворк Microsoft для вывода 1-битных больших языковых моделей, обеспечивает быстрый и без потерь вывод на CPU и GPU с оптимизированными ядрами для эффективного развертывания на периферийных устройствах.

Python

39.1k

3 months ago

HKUDS / LightRAG

LightRAG — это легковесный и эффективный фреймворк для генерации с расширенным поиском, который объединяет графы знаний с векторным поиском. Поддерживает многомодальную обработку документов, различные бэкенды хранения и предоставляет API и Web UI интерфейсы.

Python

35.7k

6 days ago

SillyTavern / SillyTavern

Мощный локальный фронтенд LLM для опытных пользователей, поддерживающий множество AI API, генерацию изображений, TTS и расширенные возможности настройки для иммерсивных ролевых игр.

JavaScript

28.6k

10 days ago

QwenLM / Qwen3

Qwen3 — это продвинутая серия открытых языковых моделей от Alibaba Cloud с двойными режимами мышления/без мышления, контекстом в 1 млн токенов, многоязычной поддержкой и передовыми возможностями логического вывода.

Python

27.3k

5 months ago

huggingface / open-r1

Open R1 — это проект с открытым исходным кодом для полного воспроизведения возможностей рассуждения DeepSeek-R1. Предоставляет конвейеры обучения, скрипты оценки и наборы данных для SFT, GRPO и генерации данных, обеспечивая прозрачную разработку моделей ИИ.

Python

26.0k

2 months ago

Collections

Большие языковые модели (LLMs)

Репозитории

ollama / ollama

open-webui / open-webui

langchain-ai / langchain

deepseek-ai / DeepSeek-V3

deepseek-ai / DeepSeek-R1

vllm-project / vllm

nomic-ai / gpt4all

binary-husky / gpt_academic

meta-llama / llama

xai-org / grok-1

run-llama / llama_index

microsoft / BitNet

HKUDS / LightRAG

SillyTavern / SillyTavern

QwenLM / Qwen3

huggingface / open-r1

Graph