Modelos de Lenguaje de Gran Escala (LLMs)

Marcos, herramientas y recursos para Modelos de Lenguaje de Gran Escala (LLMs), que incluyen entrenamiento, inferencia (vLLM, llama.cpp) y RAG.

Repositorios

Ollama es un marco ligero para ejecutar y gestionar modelos de lenguaje de código abierto localmente. Proporciona una CLI y API REST simples para construir aplicaciones de IA, soportando modelos como Llama, Gemma y Mistral con fácil integración en diversas herramientas y plataformas.

Go
169.1k
9 hours ago
langchain-ai/langchain

LangChain es un framework para construir agentes y aplicaciones impulsadas por LLM. Ayuda a conectar componentes interoperables e integraciones de terceros para simplificar el desarrollo de aplicaciones de IA.

Python
133.7k
4 hours ago
open-webui/open-webui

Open WebUI es una plataforma de IA autoalojada, extensible, rica en funciones y fácil de usar, diseñada para funcionar completamente sin conexión. Soporta varios ejecutores de LLM como Ollama y APIs compatibles con OpenAI, con motor de inferencia integrado para RAG.

Python
132.1k
4 hours ago

DeepSeek-V3 es un potente modelo de lenguaje Mixture-of-Experts (MoE) con 671B de parámetros totales y 37B activados por token. Incorpora atención latente multi-cabezal, entrenamiento FP8 y predicción multi-token, logrando un rendimiento comparable a los mejores modelos cerrados, manteniendo eficiencia y estabilidad en el entrenamiento.

Python
102.6k
8 months ago

DeepSeek-R1 es un modelo de razonamiento de primera generación que logra un rendimiento comparable a OpenAI-o1 en tareas de matemáticas, código y razonamiento. Cuenta con 671B de parámetros y está disponible bajo licencia MIT.

92.0k
10 months ago

GPT4All es un ecosistema de código abierto que permite ejecutar modelos de lenguaje grandes (LLM) de forma privada en ordenadores y portátiles comunes. No requiere llamadas a API ni GPUs; solo descarga la aplicación y comienza a chatear con modelos de IA locales.

C++
77.3k
a year ago

vLLM es una biblioteca rápida y fácil de usar para inferencia y servicio de LLM. Desarrollada originalmente en UC Berkeley, ofrece rendimiento líder, gestión eficiente de memoria con PagedAttention y integración perfecta con modelos de Hugging Face.

Python
76.8k
4 hours ago

Asistente de IA especializado en investigación académica, compatible con múltiples LLMs (GPT/GLM/Qwen/DeepSeek). Ofrece traducción de artículos, pulido de textos, análisis de código y escritura académica con sistema modular de plugins y atajos personalizables.

Python
70.4k
3 months ago

Repositorio oficial de código de inferencia de Meta Llama 2. Proporciona implementación mínima para cargar y ejecutar modelos Llama (7B-70B parámetros) para aplicaciones de finalización de texto y chat. Incluye pesos del modelo, tokenizador y scripts de ejemplo para implementación local.

Python
59.3k
a year ago

Grok-1 de xAI: Modelo Mixture-of-Experts de 314B parámetros con implementación JAX. Pesos y arquitectura de código abierto para investigación y despliegue de IA avanzada.

Python
51.5k
2 years ago

LlamaIndex es un marco de datos de código abierto para construir aplicaciones de LLM con generación aumentada por recuperación (RAG). Proporciona conectores de datos, herramientas de indexación e interfaces de consulta.

Python
48.6k
7 hours ago

Marco de inferencia oficial de Microsoft para modelos de lenguaje grande de 1 bit, proporciona inferencia rápida y sin pérdidas en CPU y GPU con kernels optimizados para implementación eficiente en dispositivos periféricos.

Python
38.3k
a month ago

LightRAG es un marco de generación aumentada por recuperación ligero y eficiente que integra grafos de conocimiento con recuperación vectorial. Soporta procesamiento multimodal de documentos, múltiples backends de almacenamiento y proporciona interfaces API y Web UI.

Python
33.4k
a day ago

Qwen3 es una serie avanzada de modelos de lenguaje de código abierto de Alibaba Cloud, con modos duales de pensamiento/no pensamiento, contexto de 1 millón de tokens, soporte multilingüe y capacidades de razonamiento de última generación.

Python
27.1k
3 months ago
huggingface/open-r1

Open R1 es un proyecto comunitario para reproducir completamente las capacidades de razonamiento de DeepSeek-R1. Proporciona pipelines de entrenamiento, scripts de evaluación y conjuntos de datos para SFT, GRPO y generación de datos, permitiendo el desarrollo transparente de modelos de IA.

Python
26.0k
14 days ago
SillyTavern/SillyTavern

Un potente frontend local de LLM para usuarios avanzados, compatible con múltiples APIs de IA, generación de imágenes, TTS y opciones de personalización extensas para experiencias de rol inmersivas.

JavaScript
25.7k
2 days ago