Repository navigation

video-recognition

Website
Wikipedia

kenshohara / 3D-ResNets-PyTorch

3D ResNets for Action Recognition (CVPR 2018)

深度学习机器视觉 PyTorch Python action-recognition video-recognition

Python

4018

934

5 年前

jinwchoi / awesome-action-recognition

A curated list of action recognition and related area resources

Awesome Lists action-recognition action-detection activity-recognition video-understanding video-recognition video-processing object-recognition pose-estimation

3939

724

2 年前

PaddlePaddle / PaddleVideo

Awesome video understanding toolkits based on PaddlePaddle. It supports video data annotation tools, lightweight RGB and skeleton based action recognition model, practical applications for video tagging and sport action detection.

video-recognition tsm slowfast tsn bmn action-recognition youtube-8m kinetics400 video-understanding activitynet action-detection temporal-action-detection ava

Python

1644

386

8 个月前

subho406 / OmniNet

Official Pytorch implementation of "OmniNet: A unified architecture for multi-modal multi-task learning" | Authors: Subhojeet Pramanik, Priyanka Agrawal, Aman Hussain

机器学习深度学习神经网络人工智能 transformer 自然语言处理 image-captioning video-recognition multitask-learning multimodal-learning

Python

512

5 年前

edenai / edenai-apis

Eden AI: simplify the use and deployment of AI technologies by providing a unique API that connects to the best possible AI engines

aggregator 人工智能 API 机器视觉 document-parsing 图像处理 machine-translation 自然语言处理 OCR optical-character-recognition pre-trained-model Python speech-recognition speech-to-text text-to-speech video-recognition

Python

459

1 天前

apoorva-dave / LicensePlateDetector

Detects license plate of car and recognizes its characters

机器学习 license-plate-recognition image-recognition video-recognition

Python

356

113

2 年前

datamllab / autovideo

AutoVideo: An Automated Video Action Recognition System

automl Video 深度学习 video-recognition automated

Python

339

2 年前

Atze00 / MoViNet-pytorch

MoViNets PyTorch implementation: Mobile Video Networks for Efficient Video Recognition;

video-recognition Video

Jupyter Notebook

283

3 年前

tea1528 / Non-Local-NN-Pytorch

PyTorch implementation of Non-Local Neural Networks (https://arxiv.org/pdf/1711.07971.pdf)

深度学习 video-recognition

Python

251

3 年前

whwu95 / Text4Vis

【AAAI'2023 & IJCV】Transferring Vision-Language Models for Visual Recognition: A Classifier Perspective

cross-modal-learning transfer-learning video-recognition video-understanding action-recognition

Python

196

1 年前

whwu95 / GPT4Vis

GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition?

gpt-4-vision-preview prompt-engineering video-recognition visual-recognition

Python

184

1 年前

whwu95 / BIKE

【CVPR'2023】Bidirectional Cross-Modal Knowledge Exploration for Video Recognition with Pre-trained Vision-Language Models

action-recognition cross-modal-learning video-recognition video-understanding

Python

153

1 年前

cooperdk / YAPO-e-plus

YAPO e+ - Yet Another Porn Organizer (extended)

porn pornography tagging scene-recognition video-recognition

Python

149

3 年前

kenshohara / 3D-ResNets

3D ResNets for Action Recognition

深度学习机器视觉 Lua action-recognition video-recognition

Lua

119

8 年前

ldkong1205 / TranSVAE

[NeurIPS 2023] Unsupervised Video Domain Adaptation for Action Recognition: A Disentanglement Perspective

action-recognition domain-adaptation video-recognition transfer-learning generative-model

Jupyter Notebook

119

2 年前

rohitgirdhar / CATER

CATER: A diagnostic dataset for Compositional Actions and TEmporal Reasoning

video-recognition action-recognition 深度学习 video-understanding

Python

107

5 年前

Ha0Tang / HandGestureRecognition

[Neurocomputing 2019] Fast and Robust Dynamic Hand Gesture Recognition via Key Frames Extraction and Feature Fusion

feature-fusion fast robust efficiency accuracy journal action-recognition video-classification video-recognition Video

C++

102

4 年前

DmitryRyumin / WACV-2024-Papers

WACV 2024 Papers: Discover cutting-edge research from WACV 2024, the leading computer vision conference. Stay updated on the latest in computer vision and deep learning, with code included. ⭐ support visual intelligence development!

3d-computer-vision adversarial-attacks autonomous-driving biometrics 机器视觉 datasets face-recognition generative-models gesture-recognition image-recognition image-understanding low-level 机器学习 Robotics video-recognition vision-transformer visualization

Python

1 年前

yanbeic / CCL

PyTorch Implementation on Paper [CVPR2021]Distilling Audio-Visual Knowledge by Compositional Contrastive Learning

distillation audio-visual-learning cvpr2021 contrastive-learning PyTorch video-recognition

Python

4 年前

Fl1s / turron

A search system that analyzes short video snippets (2–5 secs) and finds highly accurate matches using keyframe-based perceptual hashing. Selfhosted Video Shazam.

Java Spring Boot video-recognition hamming-distance shazam Video video-processing

Java

10 小时前