Repository navigation

#

ggml

Website
Wikipedia

ggml-org/llama.cpp

ggml-org / llama.cpp

LLM inference in C/C++

C++

78441

11467

3 小时前

xorbitsai / inference

Replace OpenAI GPT with another LLM in your app by changing a single line of code. Xinference gives you the freedom to use any LLM you need. With Xinference, you're empowered to run inference with any open-source language models, speech recognition models, and multimodal models, whether in the cloud, on-premises, or even on your laptop.

ggml PyTorch chatglm 部署 flan-t5 大语言模型 wizardlm 人工智能机器学习 Whisper inference openai-api mistral gemma llama llamacpp vllm qwen llama3 glm4

Python

7559

641

1 天前

rustformers / llm

[Unmaintained, see README] An ecosystem of Rust libraries for working with large language models

人工智能 ggml 大语言模型机器学习 Rust

Rust

6102

371

10 个月前

leejet / stable-diffusion.cpp

Stable Diffusion and Flux in pure C/C++

人工智能 C++diffusion ggml image-generation latent-diffusion stable-diffusion text2image txt2img image2image img2img flux flux-dev flux-schnell

C++

4023

366

1 个月前

guinmoon / LLMFarm

llama and other large language models on iOS and MacOS offline using GGML library.

人工智能 ggml gpt-2 iOS llama macOS Swift starcoder rwkv

Swift

1734

129

1 个月前

RWKV / rwkv.cpp

INT4/INT5/INT8 and FP16 inference on CPU for RWKV language model

深度学习 language-model 大语言模型机器学习 quantization rwkv ggml

C++

1507

103

1 个月前

RahulSChand / gpu_poor

Calculate token/s & GPU memory requirement for any LLM. Supports llama.cpp/ggml/bnb/QLoRA quantization

ggml huggingface 大语言模型 quantization gpu language-model PyTorch llama llama2 llamacpp

JavaScript

1286

70

5 个月前

sammcj/gollama

sammcj / gollama

Go manage your Ollama models

人工智能 gguf 大语言模型 ollama tui ggml Linux macOS models

Go

1024

55

16 天前

PABannier / bark.cpp

Suno AI's Bark model in C/C++ for fast text-to-speech generation

inference 机器学习 text-to-speech tts ggml

C++

799

71

5 个月前

azkadev / whisper

Whisper Dart is a cross platform library for dart and flutter that allows converting audio to text / speech to text / inference from Open AI models

Dart Flutter speech-to-text Whisper transcribe openai transformer speech speech-recognition speech-synthesis 人工智能 Android indonesia iOS Linux macOS Windows ggml

C++

606

39

2 个月前

the-crypt-keeper / can-ai-code

Self-evaluating interview for AI coders

人工智能 ggml langchain llama-cpp 大语言模型 humaneval transformers

Python

579

35

15 小时前

abacaj / mpt-30B-inference

Run inference on MPT-30B using CPU

ctransformers ggml mpt-30b

Python

575

93

2 年前

Maknee / minigpt4.cpp

Port of MiniGPT4 in C++ (4bit, 5bit, 6bit, 8bit, 16bit CPU inference with GGML)

C C++深度学习 ggml 机器学习 minigpt4 multimodal quantization

C++

567

27

2 年前

monatis / clip.cpp

CLIP inference in plain C/C++ with no extra dependencies

C clip C++ggml image-search multimodal

C++

492

44

8 个月前

shm007g / LLaMA-Cult-and-More

Large Language Models for All, 🦙 Cult and More, Stay in touch !

alpaca ChatGPT gpt llama ggml gpt4 gptq vicuna PyTorch Tensorflow transformers deepspeed 大语言模型

HTML

446

24

2 年前

WIP Library Text To Speech From Suno AI's Bark in C/C++ for fast inference

bark Dart ggml text-to-speech tts 人工智能机器学习 clone 深度学习 fake 神经网络 voice

C++

403

3

1 年前

azkadev / general_ai

GENERAL Ai Library For DART & Flutter

人工智能 Dart 深度学习 Flutter Library 机器学习 ggml stable-diffusion Whisper

C++

343

1

1 年前

staghado / vit.cpp

Inference Vision Transformer (ViT) in plain C/C++ with ggml

cpu ggml vision-transformer whisper-cpp edge-computing llamacpp 人工智能机器视觉 image-classification C C++

C++

266

21

1 年前

shubham0204 / SmolChat-Android

Running any GGUF SLMs/LLMs locally, on-device in Android

Android C++ggml Kotlin llamacpp

Kotlin

260

29

1 天前

mgonzs13 / llama_ros

llama.cpp (GGUF LLMs) and llava.cpp (GGUF VLMs) for ROS 2

C++gpt llama 大语言模型 ros2 ggml gguf llamacpp llava vlm langchain embeddings rerank reranking

C++

196

30

6 天前