コンピュータビジョン

画像理解、生成、OCR、物体検出などのためのコンピュータビジョンライブラリとモデル。

Repositories

ultralytics/yolov5

YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

Python
56.9k
ultralytics/ultralytics

Ultralytics YOLO 🚀

Python
53.9k

The repository provides code for running inference with the SegmentAnything Model (SAM), links for downloading the trained model checkpoints, and example notebooks that show how to use the model.

Jupyter Notebook
53.5k

The world's simplest facial recognition api for Python and the command line

Python
56.2k

Tesseract は 100 以上の言語をサポートする強力なオープンソース OCR エンジンです。LSTM ニューラルネットとレガシー認識モードの両方を備え、画像から高精度でテキストを抽出できます。

C++
72.7k

PaddleOCR は業界をリードする OCR およびドキュメント AI エンジンです。画像や PDF を構造化データ(JSON、Markdown)に変換し、100 以上の言語をサポート。PP-OCRv5 によるテキスト認識、PP-StructureV3 によるドキュメント解析、PaddleOCR-VL によるマルチモーダル文書理解を提供します。

Python
71.5k

Deepfakes Software For All

Python
55.0k

Deep-Live-Cam は、たった 1 枚の画像でリアルタイムの顔交換とビデオディープフェイクを実現するツールです。ビデオ通話、配信、コンテンツ制作で簡単なワンクリック操作で顔の入れ替えが可能です。

Python
79.8k

OpenCV はオープンソースのコンピュータビジョンおよび機械学習ソフトウェアライブラリです。画像処理、物体検出、動画解析、AI モデル実行のためのリアルタイム最適化ツールを、複数のプラットフォームとプログラミング言語で提供します。

C++
86.4k

Stable Diffusion は、テキストプロンプトから写真のようにリアルな画像を生成する潜在拡散モデルです。CLIP テキストエンコーダーを搭載し、テキストから画像の生成、画像変換、修復などのタスクを実行できます。

Jupyter Notebook
72.6k

Gradio で構築された Stable Diffusion 向けの強力な Web UI。テキストから画像生成、画像変換、インペインティング、アップスケーリング、LoRA 対応、カスタムスクリプトなど、AI 画像生成の多機能を提供。

Python
161.5k