Repository navigation

#

on-device-llms

Website
Wikipedia

Lizonghang / prima.cpp

prima.cpp: Speeding up 70B-scale LLM inference on low-resource everyday home clusters

distributed-ai llm-inference on-device-llms llama-cpp distributed-inference

C++

997

69

1 个月前

dmis-lab / Outlier-Safe-Pre-Training

[ACL 2025] Outlier-Safe Pre-Training for Robust 4-Bit Quantization of Large Language Models

acl 深度学习 large-language-models on-device-llms quantization

Python

29

4

21 天前

Mehdi-Letafati / multi-agent-workflows-from-scratch

Multi-agent workflows with Llama3: A private on-device multi-agent framework

agentic-framework agentic-workflow generative-ai large-language-models llama3 Python on-device-llms

Python

3

0

1 年前