Collections 排行榜

電腦視覺

用於影像理解、生成、光學字元辨識（OCR）與物件偵測的電腦視覺函式庫與模型。

倉庫

AUTOMATIC1111 / stable-diffusion-webui

功能豐富的 Stable Diffusion 網頁介面，支援文生圖、圖生圖、外繪、局部重繪。內建擴充系統、LoRA、自訂嵌入及 API 介面，操作方便。

Python

164.2k

5 months ago

hacksider / Deep-Live-Cam

即時臉部替換和影片深度偽造工具，僅需一張圖片即可運作。支援攝影機直播、影片處理，並提供CUDA、CoreML、DirectML等多種GPU加速方案。

Python

94.9k

2 days ago

opencv / opencv

OpenCV 是一個開源電腦視覺和機器學習軟體庫，提供即時優化的影像處理、物件偵測、影片分析和 AI 模型執行工具，支援多平台和多種程式語言。

C++

89.9k

4 hours ago

PaddlePaddle / PaddleOCR

開源 OCR 工具包與文檔 AI 引擎，將 PDF 和圖像轉換為 LLM 可用的結構化資料（JSON/Markdown）。內建 SOTA 輕量級視覺語言模型 PaddleOCR-VL 進行智能文檔解析，PP-OCRv5 支援 100+ 種語言文字辨識，並與 Dify、RAGFlow 等 RAG/Agent 生態深度整合。

Python

85.3k

20 days ago

tesseract-ocr / tesseract

Tesseract OCR引擎，支援100多種語言的文字識別，包含命令列工具和API庫，採用神經網絡(LSTM)技術從圖像中提取文字。

C++

75.4k

7 days ago

CompVis / stable-diffusion

Stable Diffusion 是一個潛在文字到圖像的擴散模型，可根據文字描述生成逼真圖像。基於潛在擴散架構和 CLIP 文字編碼器，支援文生圖、圖生圖、圖像修復等多種任務，可在消費級 GPU 上運行。

Jupyter Notebook

73.2k

2 years ago

ultralytics/ultralytics

ultralytics / ultralytics

Ultralytics YOLO 是一個先進的電腦視覺框架，提供最先進的目標檢測、分割、分類、追蹤和姿態估計模型。快速、準確且易於使用，支援多種部署方案。

Python

59.5k

5 hours ago

ultralytics/yolov5

ultralytics / yolov5

YOLOv5 是一個先進的電腦視覺模型，支援即時目標檢測、實例分割和圖像分類。基於 PyTorch 構建，具有出色的速度、精度和易用性，適用於研究和生產環境。

Python

57.7k

9 hours ago

ageitgey / face_recognition

基於Python的高精度人臉識別庫，LFW基準測試準確率達99.38%。提供人臉檢測、特徵點識別和身份識別功能，支援命令行工具和即時影片處理。

Python

56.6k

21 days ago

deepfakes / faceswap

FaceSwap 是一個基於深度學習的開源換臉工具，支援圖片和影片中的人臉識別與替換。提供完整的訓練流程，包含人臉提取、模型訓練和轉換功能，支援多種深度學習模型和GPU加速。

Python

55.3k

11 days ago

facebookresearch / segment-anything

Meta AI 的分割萬物模型（SAM）是一個突破性的圖像分割基礎模型。透過簡單的點或框提示即可產生高品質的物件遮罩，基於1100萬圖像和11億遮罩訓練，在各種分割任務上展現出卓越的零樣本性能。

Jupyter Notebook

54.5k

2 years ago

Graph