Computer Vision

Bibliotheken und Modelle für Computer Vision zur Bildanalyse, -generierung, OCR und Objekterkennung.

Repositories

AUTOMATIC1111 / stable-diffusion-webui

Funktionsreicher Web-UI für Stable Diffusion. Unterstützt Text-to-Image, Image-to-Image, Outpainting, Inpainting sowie Erweiterungen, LoRA, benutzerdefinierte Embeddings und API.

Python

164.3k

5 months ago

hacksider / Deep-Live-Cam

Echtzeit-Gesichtstausch- und Video-Deepfake-Tool, das mit nur einem einzigen Bild funktioniert. Unterstützt Webcam-Streaming, Videoverarbeitung und mehrere GPU-Beschleunigungsoptionen einschließlich CUDA, CoreML und DirectML.

Python

94.9k

3 days ago

opencv / opencv

OpenCV ist eine Open-Source-Softwarebibliothek für Computer Vision und maschinelles Lernen. Sie bietet Echtzeit-optimierte Tools für Bildverarbeitung, Objekterkennung, Videoanalyse und KI-Modellausführung auf mehreren Plattformen und Programmiersprachen.

C++

89.9k

a day ago

PaddlePaddle / PaddleOCR

Open-Source-OCR-Toolkit und Document-AI-Engine, die PDFs und Bilder in LLM-gerechte strukturierte Daten (JSON/Markdown) umwandelt. Bietet das SOTA-Leichtgewicht-VLM PaddleOCR-VL zur Dokumentenanalyse, PP-OCRv5 mit Unterstützung für über 100 Sprachen sowie tiefe Integration in RAG-/Agent-Ökosysteme wie Dify und RAGFlow.

Python

85.7k

2 days ago

tesseract-ocr / tesseract

Tesseract OCR-Engine mit neuronalem Netzwerk (LSTM) Unterstützung für 100+ Sprachen. Enthält Kommandozeilentool und API-Bibliothek zur Textextraktion aus Bildern.

C++

75.4k

18 hours ago

CompVis / stable-diffusion

Stable Diffusion ist ein latentes Text-zu-Bild-Diffusionsmodell, das fotorealistische Bilder aus Textbeschreibungen erzeugt. Basierend auf latenter Diffusionsarchitektur mit CLIP-Textencoder ermöglicht es Bildsynthese, Bild-zu-Bild-Übersetzung und Inpainting.

Jupyter Notebook

73.2k

2 years ago

ultralytics / ultralytics

Ultralytics YOLO ist ein modernes Computer-Vision-Framework, das State-of-the-Art-Modelle für Objekterkennung, Segmentierung, Klassifizierung, Tracking und Pose-Schätzung bietet. Schnell, präzise und einfach zu bedienen mit umfangreichen Bereitstellungsoptionen.

Python

59.6k

8 hours ago

ultralytics / yolov5

YOLOv5 ist ein modernes Computer-Vision-Modell für Echtzeit-Objekterkennung, Segmentierung und Klassifizierung. Basierend auf PyTorch bietet es außergewöhnliche Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit.

Python

57.7k

4 hours ago

ageitgey / face_recognition

Eine leistungsstarke und einfache Python-Bibliothek für Gesichtserkennung mit 99.38% Genauigkeit im LFW-Benchmark. Bietet einfache API für Gesichtserkennung, Gesichtsmerkmalanalyse und Identitätserkennung mit Befehlszeilentools.

Python

56.6k

22 days ago

deepfakes / faceswap

FaceSwap ist ein Open-Source-Deepfake-Tool, das Deep Learning zur Erkennung und zum Austausch von Gesichtern in Bildern und Videos verwendet. Bietet einen vollständigen Workflow mit Gesichtserkennung, Modelltraining und Konvertierung, unterstützt mehrere Modelle und GPU-Beschleunigung.

Python

55.3k

11 days ago

facebookresearch / segment-anything

Meta AIs Segment Anything Model (SAM) ist ein bahnbrechendes Foundation-Modell für promptbare Bildsegmentierung. Es erzeugt hochwertige Objektmasken aus einfachen Prompts wie Punkten oder Rahmen, trainiert mit 11M Bildern und 1.1B Masken, und bietet außergewöhnliche Zero-Shot-Leistung über diverse Segmentierungsaufgaben hinweg.

Jupyter Notebook

54.5k

2 years ago

Collections

Computer Vision

Repositories

AUTOMATIC1111 / stable-diffusion-webui

hacksider / Deep-Live-Cam

opencv / opencv

PaddlePaddle / PaddleOCR

tesseract-ocr / tesseract

CompVis / stable-diffusion

ultralytics / ultralytics

ultralytics / yolov5

ageitgey / face_recognition

deepfakes / faceswap

facebookresearch / segment-anything

Graph