컴퓨터 비전

이미지 이해, 생성, OCR 및 객체 감지를 위한 컴퓨터 비전 라이브러리 및 모델입니다.

Repositories

ultralytics/yolov5

YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

Python
56.9k
ultralytics/ultralytics

Ultralytics YOLO 🚀

Python
53.9k

The repository provides code for running inference with the SegmentAnything Model (SAM), links for downloading the trained model checkpoints, and example notebooks that show how to use the model.

Jupyter Notebook
53.5k

The world's simplest facial recognition api for Python and the command line

Python
56.2k

Tesseract 는 100 개 이상의 언어를 지원하는 강력한 오픈소스 OCR 엔진입니다. LSTM 신경망과 레거시 인식 모드를 모두 활용하여 이미지에서 고정밀도로 텍스트를 추출할 수 있습니다.

C++
72.7k

PaddleOCR 은 업계 최고의 OCR 및 문서 AI 엔진입니다. 이미지와 PDF 를 구조화된 데이터 (JSON, Markdown) 로 변환하며 100 개 이상의 언어를 지원합니다. 텍스트 인식용 PP-OCRv5, 문서 파싱용 PP-StructureV3, 멀티모달 문서 이해용 PaddleOCR-VL 등을 제공하며 다양한 벤치마크에서 SOTA 성능을 달성했습니다.

Python
71.5k

Deepfakes Software For All

Python
55.0k

Deep-Live-Cam 은 단 하나의 이미지로 실시간 얼굴 교체 및 비디오 딥페이크를 구현하는 도구입니다. 화상 통화, 스트리밍, 콘텐츠 제작 중 실시간 얼굴 교체를 원클릭 인터페이스로 간단하게 수행할 수 있습니다.

Python
79.8k

OpenCV 는 오픈 소스 컴퓨터 비전 및 머신 러닝 소프트웨어 라이브러리입니다. 이미지 처리, 객체 감지, 비디오 분석 및 AI 모델 실행을 위한 실시간 최적화 도구를 여러 플랫폼과 프로그래밍 언어로 제공합니다.

C++
86.4k

Stable Diffusion 은 텍스트 프롬프트에서 사실적인 이미지를 생성하는 잠재 확산 모델입니다. CLIP 텍스트 인코더를 탑재하여 텍스트 - 이미지 생성, 이미지 변환, 인페인팅 등 다양한 작업을 수행할 수 있으며, 소비자용 GPU 에서 실행 가능합니다.

Jupyter Notebook
72.6k

Gradio 로 구축된 Stable Diffusion 을 위한 강력한 웹 UI. 텍스트에서 이미지 생성, 이미지 변환, 인페인팅, 업스케일링, LoRA 지원, 사용자 정의 스크립트 및 AI 이미지 생성을 위한 다양한 확장 기능을 제공합니다.

Python
161.5k