Repository navigation

pipeline-parallelism

Website
Wikipedia

Making large AI models cheaper, faster and more accessible

深度学习 hpc large-scale data-parallelism pipeline-parallelism model-parallelism 人工智能 big-model distributed-computing inference heterogeneous-training foundation-models

Python

41190

4532

5 天前

deepspeedai / DeepSpeed

DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.

深度学习 PyTorch gpu 机器学习 billion-parameters data-parallelism model-parallelism inference pipeline-parallelism compression mixture-of-experts trillion-parameters zero

Python

40300

4574

14 小时前

bigscience-workshop / petals

🌸 Run LLMs at home, BitTorrent-style. Fine-tuning and inference up to 10x faster than offloading

bloom 深度学习 distributed-systems language-models large-language-models 机器学习 neural-networks PyTorch volunteer-computing pipeline-parallelism guanaco llama 聊天机器人 gpt transformer 自然语言处理 pretrained-models falcon mixtral

Python

9801

577

1 年前

kakaobrain / torchgpipe

A GPipe implementation in PyTorch

深度学习 PyTorch gpipe model-parallelism pipeline-parallelism parallelism checkpointing

Python

855

1 年前

PaddlePaddle / PaddleFleetX

飞桨大模型开发套件，提供大语言模型、跨模态大模型、生物计算大模型等领域的全流程开发工具链。

paddlepaddle benchmark large-scale model-parallelism data-parallelism pipeline-parallelism cloud elastic lightning pretraining self-supervised-learning unsupervised-learning

Python

474

166

1 年前

Coobiw / MPP-LLaVA

Personal Project: MPP-Qwen14B & MPP-Qwen-Next(Multimodal Pipeline Parallel based on Qwen-LM). Support [video/image/multi-image] {sft/conversations}. Don't let the poverty limit your imagination! Train your own 8B/14B LLaVA-training-like MLLM on RTX3090/4090 24GB.

multimodal-large-language-models deepspeed pipeline-parallelism mllm qwen fine-tuning pretraining

Jupyter Notebook

473

7 个月前

Oneflow-Inc / libai

LiBai(李白): A Toolbox for Large-Scale Distributed Parallel Training

oneflow 自然语言处理深度学习 large-scale data-parallelism model-parallelism distributed-training pipeline-parallelism transformer self-supervised-learning vision-transformer

Python

407

2 个月前

InternLM / InternEvo

InternEvo is an open-sourced lightweight training framework aims to support model pre-training without the need for extensive dependencies.

gemma internlm internlm2 llama3 llava llm-framework llm-training multi-modal pipeline-parallelism flash-attention PyTorch

Python

407

1 个月前

alibaba / EasyParallelLibrary

Easy Parallel Library (EPL) is a general and efficient deep learning framework for distributed model training.

深度学习 data-parallelism model-parallelism pipeline-parallelism memory-efficient distributed-training gpu

Python

268

3 年前

Shenggan / awesome-distributed-ml

A curated list of awesome projects and papers for distributed training or inference

深度学习 distributed-systems high-performance-computing 机器学习 model-parallelism pipeline-parallelism

245

1 年前

torchpipe / torchpipe

Serving Inside Pytorch

部署 inference pipeline-parallelism serving tensorrt triton-inference-server ray PyTorch torch2trt serve llm-serving

C++

163

10 天前

ai-decentralized / BloomBee

Decentralized LLMs fine-tuning and inference with offloading

深度学习 distributed-systems llama 机器学习 pipeline-parallelism PyTorch

Python

4 天前

xrsrke / pipegoose

Large scale 4D parallelism pre-training for 🤗 transformers in Mixture of Experts *(still work in progress)*

megatron transformers data-parallelism pipeline-parallelism model-parallelism huggingface-transformers mixture-of-experts moe

Python

2 年前

AlibabaPAI / DAPPLE

An Efficient Pipelined Data Parallel Approach for Training Large Model

pipeline-parallelism

Python

5 年前

ParCIS / Chimera

Chimera: bidirectional pipeline parallelism for efficiently training large-scale models.

transformers distributed-deep-learning pipeline-parallelism

Python

6 个月前

saareliad / FTPipe

FTPipe and related pipeline model parallelism research.

pipeline-parallelism fine-tuning 自然语言处理 t5 深度神经网络 distributed-training

Python

2 年前

gty111 / gLLM

gLLM: Global Balanced Pipeline Parallelism System for Distributed LLM Serving with Token Throttling

llm-inference pipeline-parallelism llm-serving qwen3

Python

6 天前

MLSysU / TD-Pipe

A Throughput-Optimized Pipeline Parallel Inference System for Large Language Models

high-throughput llm-inference pipeline-parallelism vllm

Python

2 个月前

nawnoes / pytorch-gpt-x

Implementation of autoregressive language model using improved Transformer and DeepSpeed pipeline parallelism.

gpt PyTorch transformer pipeline-parallelism deepspeed

Python

4 年前

fanpu / DynPartition

Official implementation of DynPartition: Automatic Optimal Pipeline Parallelism of Dynamic Neural Networks over Heterogeneous GPU Systems for Inference Tasks

机器学习 model-parallelism neural-networks pipeline-parallelism PyTorch reinforcement-learning scheduling

Python

2 年前