Visión por computadora

Bibliotecas y modelos de visión por computadora para comprensión de imágenes, generación, OCR y detección de objetos.

Repositorios

Una interfaz web potente para Stable Diffusion construida con Gradio. Incluye generación de imágenes desde texto, img2img, inpainting, escalado, soporte LoRA, scripts personalizados y extensiones para creación de arte con IA.

Python
162.4k
a month ago

Herramienta de intercambio facial en tiempo real y deepfake de video que funciona con una sola imagen. Soporta transmisión por webcam, procesamiento de video y múltiples opciones de aceleración GPU incluyendo CUDA, CoreML y DirectML.

Python
90.8k
a day ago

OpenCV es una biblioteca de software de visión por computadora y aprendizaje automático de código abierto. Proporciona herramientas optimizadas en tiempo real para procesamiento de imágenes, detección de objetos, análisis de video y ejecución de modelos de IA.

C++
87.1k
7 hours ago

Motor de OCR y IA de documentos líder en la industria que convierte imágenes/PDF en datos estructurados. Soporta 100+ idiomas, análisis de documentos complejos y extracción inteligente de información.

Python
75.7k
15 hours ago

Motor OCR Tesseract con soporte de red neuronal (LSTM) para 100+ idiomas. Incluye herramienta de línea de comandos y biblioteca API para extracción de texto de imágenes.

C++
73.5k
18 days ago

Stable Diffusion es un modelo de difusión latente de texto a imagen que genera imágenes fotorrealistas a partir de descripciones textuales. Basado en arquitectura de difusión latente con codificador CLIP, permite síntesis de imágenes, traducción imagen-a-imagen y reparación.

Jupyter Notebook
72.9k
2 years ago
ultralytics/yolov5

YOLOv5 es un modelo de visión por computadora de última generación para detección de objetos en tiempo real, segmentación y clasificación. Construido sobre PyTorch, ofrece velocidad excepcional, precisión y facilidad de uso.

Python
57.2k
4 hours ago

Biblioteca Python potente y sencilla para reconocimiento facial con 99.38% de precisión en LFW. Ofrece API fácil para detección de rostros, análisis de características faciales y reconocimiento de identidad con herramientas de línea de comandos.

Python
56.3k
2 years ago
ultralytics/ultralytics

Ultralytics YOLO es un framework de visión por computadora de vanguardia que proporciona modelos de detección de objetos, segmentación, clasificación, seguimiento y estimación de pose de última generación. Rápido, preciso y fácil de usar con amplias opciones de implementación.

Python
56.0k
2 hours ago

FaceSwap es una herramienta de deepfake de código abierto que utiliza aprendizaje profundo para detectar e intercambiar rostros en imágenes y videos. Ofrece un flujo de trabajo completo con extracción facial, entrenamiento de modelos y conversión, compatible con múltiples modelos y aceleración GPU.

Python
55.2k
8 days ago

El Segment Anything Model (SAM) de Meta AI es un modelo fundacional revolucionario para segmentación de imágenes mediante prompts. Genera máscaras de objetos de alta calidad a partir de prompts simples como puntos o cuadros, entrenado con 11M de imágenes y 1.1B de máscaras, ofreciendo un rendimiento excepcional de zero-shot en diversas tareas de segmentación.

Jupyter Notebook
54.0k
2 years ago