Modelos de Lenguaje de Gran Escala (LLMs)

Marcos, herramientas y recursos para Modelos de Lenguaje de Gran Escala (LLMs), que incluyen entrenamiento, inferencia (vLLM, llama.cpp) y RAG.

Repositorios

Ollama es un marco ligero para ejecutar y gestionar modelos de lenguaje de código abierto localmente. Proporciona una CLI y API REST simples para construir aplicaciones de IA, soportando modelos como Llama, Gemma y Mistral con fácil integración en diversas herramientas y plataformas.

Go
172.6k
11 hours ago
open-webui/open-webui

Open WebUI es una plataforma de IA autoalojada, extensible, rica en funciones y fácil de usar, diseñada para funcionar completamente sin conexión. Soporta varios ejecutores de LLM como Ollama y APIs compatibles con OpenAI, con motor de inferencia integrado para RAG.

Python
139.2k
a day ago
langchain-ai/langchain

LangChain es un framework para construir agentes y aplicaciones impulsadas por LLM. Ayuda a conectar componentes interoperables e integraciones de terceros para simplificar el desarrollo de aplicaciones de IA.

Python
138.0k
9 hours ago

DeepSeek-V3 es un potente modelo de lenguaje Mixture-of-Experts (MoE) con 671B de parámetros totales y 37B activados por token. Incorpora atención latente multi-cabezal, entrenamiento FP8 y predicción multi-token, logrando un rendimiento comparable a los mejores modelos cerrados, manteniendo eficiencia y estabilidad en el entrenamiento.

Python
103.6k
9 months ago

DeepSeek-R1 es un modelo de razonamiento de primera generación que logra un rendimiento comparable a OpenAI-o1 en tareas de matemáticas, código y razonamiento. Cuenta con 671B de parámetros y está disponible bajo licencia MIT.

92.0k
a year ago

vLLM es una biblioteca rápida y fácil de usar para inferencia y servicio de LLM. Desarrollada originalmente en UC Berkeley, ofrece rendimiento líder, gestión eficiente de memoria con PagedAttention y integración perfecta con modelos de Hugging Face.

Python
81.4k
14 hours ago

GPT4All es un ecosistema de código abierto que permite ejecutar modelos de lenguaje grandes (LLM) de forma privada en ordenadores y portátiles comunes. No requiere llamadas a API ni GPUs; solo descarga la aplicación y comienza a chatear con modelos de IA locales.

C++
77.3k
a year ago

Asistente de IA especializado en investigación académica, compatible con múltiples LLMs (GPT/GLM/Qwen/DeepSeek). Ofrece traducción de artículos, pulido de textos, análisis de código y escritura académica con sistema modular de plugins y atajos personalizables.

Python
70.8k
4 months ago

Repositorio oficial de código de inferencia de Meta Llama 2. Proporciona implementación mínima para cargar y ejecutar modelos Llama (7B-70B parámetros) para aplicaciones de finalización de texto y chat. Incluye pesos del modelo, tokenizador y scripts de ejemplo para implementación local.

Python
59.4k
a year ago

Grok-1 de xAI: Modelo Mixture-of-Experts de 314B parámetros con implementación JAX. Pesos y arquitectura de código abierto para investigación y despliegue de IA avanzada.

Python
51.7k
2 years ago

LlamaIndex es un marco de datos de código abierto para construir aplicaciones de LLM con generación aumentada por recuperación (RAG). Proporciona conectores de datos, herramientas de indexación e interfaces de consulta.

Python
49.7k
a day ago

Marco de inferencia oficial de Microsoft para modelos de lenguaje grande de 1 bit, proporciona inferencia rápida y sin pérdidas en CPU y GPU con kernels optimizados para implementación eficiente en dispositivos periféricos.

Python
39.1k
3 months ago

LightRAG es un marco de generación aumentada por recuperación ligero y eficiente que integra grafos de conocimiento con recuperación vectorial. Soporta procesamiento multimodal de documentos, múltiples backends de almacenamiento y proporciona interfaces API y Web UI.

Python
35.7k
6 days ago
SillyTavern/SillyTavern

Un potente frontend local de LLM para usuarios avanzados, compatible con múltiples APIs de IA, generación de imágenes, TTS y opciones de personalización extensas para experiencias de rol inmersivas.

JavaScript
28.6k
10 days ago

Qwen3 es una serie avanzada de modelos de lenguaje de código abierto de Alibaba Cloud, con modos duales de pensamiento/no pensamiento, contexto de 1 millón de tokens, soporte multilingüe y capacidades de razonamiento de última generación.

Python
27.3k
5 months ago
huggingface/open-r1

Open R1 es un proyecto comunitario para reproducir completamente las capacidades de razonamiento de DeepSeek-R1. Proporciona pipelines de entrenamiento, scripts de evaluación y conjuntos de datos para SFT, GRPO y generación de datos, permitiendo el desarrollo transparente de modelos de IA.

Python
26.0k
2 months ago