Repository navigation

cross-modality

Website
Wikipedia

🏄 Scalable embedding, reasoning, ranking for images and sentences with CLIP

bert sentence-encoding 深度学习 clip-model clip-as-service bert-as-service cross-modal-retrieval multi-modality neural-search openai PyTorch onnx cross-modality

Python

12750

2077

2 年前

zai-org / CogVLM

a state-of-the-art-level open visual language model | 多模态预训练模型

cross-modality language-model multi-modal pretrained-models visual-language-models

Python

6669

441

1 年前

KimMeen / Time-LLM

[ICLR 2024] Official implementation of " 🦙 Time-LLM: Time Series Forecasting by Reprogramming Large Language Models"

cross-modal-learning cross-modality 深度学习 language-model large-language-models 机器学习 multimodal-deep-learning multimodal-time-series prompt-tuning time-series time-series-analysis time-series-forecasting

Python

2275

394

1 年前

hangzhaomit / Sound-of-Pixels

Codebase for ECCV18 "The Sound of Pixels"

cross-modality 机器视觉 sound-separation self-supervised-learning

Python

386

3 年前

layumi / Image-Text-Embedding

TOMM2020 Dual-Path Convolutional Image-Text Embedding with Instance Loss 🐾 https://arxiv.org/abs/1711.05535

MATLAB person-reidentification image-search image-retrieval cross-modal-retrieval cross-modality

MATLAB

296

9 个月前

movienet / movienet-tools

Tools for movie and video research

movie 机器视觉 video-understanding action-recognition 深度学习 vision-language cross-modality

C++

293

3 年前

haofanwang / awesome-conditional-content-generation

Update-to-data resources for conditional content generation, including human motion generation, image or video generation and editing.

aigc Awesome Lists controllable-generation cross-modality diffusion-models

278

1 年前

sail-sg / ptp

[CVPR2023] The code for 《Position-guided Text Prompt for Vision-Language Pre-training》

cross-modality vision-language-pretraining

Python

151

2 年前

bismex / Awesome-cross-modality-person-re-identification

Awesome Cross-modality Person Re-identification

person-reidentification person-reid Awesome Lists reid cross-modality

148

3 年前

ZYK100 / LLCM

[CVPR 2023] Diverse Embedding Expansion Network and Low-Light Cross-Modality Benchmark for Visible-Infrared Person Re-identification

cross-modality cvpr2023 dataset

Python

131

2 年前

Event-AHU / EventVOT_Benchmark

[CVPR-2024] The First High Definition (HD) Event based Visual Object Tracking Benchmark Dataset

cross-modality high-definition multi-modal single-object-tracking visual-object-tracking visual-tracking

Python

127

7 个月前

AnjanDutta / sem-pcyc

PyTorch implementation of the paper "Semantically Tied Paired Cycle Consistency for Zero-Shot Sketch-based Image Retrieval", CVPR 2019.

zero-shot-learning cross-modality cycle-gan generative-model

Python

110

2 年前

rhgao / co-separation

Co-Separating Sounds of Visual Objects (ICCV 2019)

audio-visual-learning sound-separation cross-modality

Python

2 年前

mangye16 / Visible-Thermal-Person-Re-Identification

Demo code for visible thermal (cross-modality) person re-identification

person-reidentification cross-modality

Python

6 年前

WinfredGe / T2S

[IJCAI 2025] Official implementation of "T2S: High-resolution Time Series Generation with Text-to-Series Diffusion Models"

cross-modal-learning cross-modality 深度学习 language-model 机器学习 multimodal-deep-learning multimodal-time-series time-series time-series-analysis

Python

1 个月前

AdityaLab / MM4TSA

A professional list on Multi-Modalities For Time Series Analysis (MM4TSA) Papers and Resource.

Awesome Lists cross-modality forecasting foundation-models large-language-models multimodal multimodal-learning multimodal-time-series Hackathon-Kit survey time-series

4 天前

JDAI-CV / CM-NAS

CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification (ICCV2021)

nas reid cross-modality neural-architecture-search

Python

4 年前

chenjingong / DN-ReID

[CVPR2024]Day-Night Cross-domain Vehicle Re-identification

cross-modality cvpr2024 dataset 深度学习 re-identification

Python

1 年前

workingcoder / MCJA

A New Strong and Simple Baseline Method for VI-ReID (Bridging the Gap: Multi-level Cross-modality Joint Alignment for Visible-infrared Person Re-identification)

cross-modality baseline person-reid person-reidentification re-identification reid

Python

1 年前

M-3LAB / awesome-multimodal-brain-image-systhesis

cross-modality image-synthesis image-to-image-translation medical-image-processing survey 深度学习

2 年前