ChatGH

计算机视觉

用于图像理解、生成、光学字符识别(OCR)和目标检测的计算机视觉库与模型。

仓库

基于 Gradio 构建的 Stable Diffusion 功能强大的 Web 界面。支持文生图、图生图、局部重绘、高清修复、LoRA 模型、自定义脚本及丰富扩展,是本地运行 AI 绘画的主流工具。

Python
162.4k
a month ago

实时面部替换和视频深度伪造工具,仅需一张图片即可运行。支持摄像头直播、视频处理,并提供CUDA、CoreML、DirectML等多种GPU加速方案。

Python
90.6k
12 hours ago

OpenCV 是一个开源计算机视觉和机器学习软件库,提供实时优化的图像处理、目标检测、视频分析和 AI 模型执行工具,支持多平台和多种编程语言。

C++
87.1k
21 hours ago

业界领先的OCR和文档AI引擎,将图像/PDF转换为结构化数据。支持100+语言、复杂文档解析、智能信息提取,可在多平台部署。

Python
75.6k
20 hours ago

Tesseract OCR引擎,支持100多种语言的文字识别,包含命令行工具和API库,采用神经网络(LSTM)技术从图像中提取文本。

C++
73.5k
16 days ago

Stable Diffusion 是一个潜在文本到图像的扩散模型,可根据文字描述生成逼真图像。基于潜在扩散架构和 CLIP 文本编码器,支持文生图、图生图、图像修复等多种任务,可在消费级 GPU 上运行。

Jupyter Notebook
72.9k
2 years ago
ultralytics/yolov5

YOLOv5 是一个先进的计算机视觉模型,支持实时目标检测、实例分割和图像分类。基于 PyTorch 构建,具有出色的速度、精度和易用性,适用于研究和生产环境。

Python
57.2k
2 days ago

基于Python的高精度人脸识别库,LFW基准测试准确率达99.38%。提供人脸检测、特征点识别和身份识别功能,支持命令行工具和实时视频处理。

Python
56.3k
2 years ago
ultralytics/ultralytics

Ultralytics YOLO 是一个先进的计算机视觉框架,提供最先进的目标检测、分割、分类、跟踪和姿态估计模型。快速、准确且易于使用,支持多种部署方案。

Python
55.9k
2 hours ago

FaceSwap 是一个基于深度学习的开源换脸工具,支持图片和视频中的人脸识别与替换。提供完整的训练流程,包含人脸提取、模型训练和转换功能,支持多种深度学习模型和GPU加速。

Python
55.2k
7 days ago

Meta AI 的分割一切模型(SAM)是一个革命性的图像分割基础模型。通过简单的点或框提示即可生成高质量的对象掩码,基于1100万图像和11亿掩码训练,在各种分割任务上展现出卓越的零样本性能。

Jupyter Notebook
53.9k
2 years ago