Repository navigation

multimodal-interactions

Website
Wikipedia

MELD: A Multimodal Multi-Party Dataset for Emotion Recognition in Conversation

emotion-recognition sentiment-analysis multimodal-interactions dialogue-systems conversational-ai 聊天机器人 emotion dialogue emotion-detection

Python

892

218

1 年前

declare-lab / multimodal-deep-learning

This repository contains various models targetting multimodal representation learning, multimodal fusion for downstream tasks such as multimodal sentiment analysis.

multimodal-deep-learning multimodal-learning multimodal-interactions

OpenEdge ABL

828

156

2 年前

microsoft / psi

Platform for Situated Intelligence

multimodal streaming human-robot-interaction multimodal-interactions perception 框架 stream-processing component-library 人工智能 pipelines

554

101

1 个月前

soujanyaporia / MUStARD

Multimodal Sarcasm Detection Dataset

multimodal-interactions multimodal-deep-learning

OpenEdge ABL

340

8 个月前

declare-lab / awesome-emotion-recognition-in-conversations

A comprehensive reading list for Emotion Recognition in Conversations

emotion-recognition dialogue-systems 自然语言处理 multimodal-deep-learning multimodal-interactions conversational-ai

268

1 年前

declare-lab / contextual-utterance-level-multimodal-sentiment-analysis

Context-Dependent Sentiment Analysis in User-Generated Videos

sentiment-analysis multimodal-interactions lstm Keras

Python

124

2 年前

umdsquare / data-at-hand-mobile

Mobile application for exploring fitness data using both speech and touch interaction.

speech multimodal-interactions mobile-app fitness-tracker visualization navigation

TypeScript

2 年前

declare-lab / hfusion

Multimodal sentiment analysis using hierarchical fusion with context modeling

sentiment-analysis multimodal-interactions fusion emotion-recognition emotion-detection

Python

2 年前

thuiar / UMC

Unsupervised Multimodal Clustering for Semantics Discovery in Multimodal Utterances (ACL 2024)

clustering discovery intent multimodal-deep-learning multimodal-interactions

Python

4 个月前

PrithivirajDamodaran / vision-language-modelling-series

Companion Repo for the Vision Language Modelling YouTube series - https://bit.ly/3PsbsC2 - by Prithivi Da. Open to PRs and collaborations

multimodal-deep-learning multimodal-interactions vision-and-language vision-and-language-pre-training

Jupyter Notebook

3 年前

xuxingya / talkingdraw

Using voice and pen to draw diagrams quickly with automatically suggested icons and texts by AI in talking.

人工智能 ui speech-recognition gesture-recognition multimodal-interactions sequence-to-sequence

JavaScript

7 年前

IdentiMood / LittleAntispoof

A multimodal face liveness detection module that can be used in the context of face anti-spoofing

deepface emotion-recognition multimodal-interactions

Python

7 个月前

jhaayush2004 / Multimodal-AI-Assistant

Multimodal AI Assistant with Google Gemini-1.5-pro, gTTS, PIL, and SpeechRecognition Technologies!

gemini-pro multimodal-interactions pil speech-recognition Streamlit

Python

9 个月前

geut / plusultra_whitepaper

Technical Draft: A platform to augment web applications with multimodal interactions

research-project multimodal-interactions

TeX

10 年前

amrgomaaelhady / ML-PersRef

Code for ICMI2020 and ICMI2021 papers: "Studying Person-Specific Pointing and Gaze Behavior for Multimodal Referencing of Outside Objects from a Moving Vehicle" and "ML-PersRef: A Machine Learning-based Personalized Multimodal Fusion Approach for Referencing Outside Objects From a Moving Vehicle"

multimodal-interactions multimodal-learning automotive gesture-recognition

Jupyter Notebook

2 年前

emanuelegiona / MI2020

Project for Multimodal Interaction course (A.Y. 2019/2020), GesturePad

Python multimodal-interactions text-editor mediapipe

Python

5 年前

tiagohpf / im-2018-assign2

Control of some Spotify's functionalities by voice

academic-project multimodal-interactions speech-recognition spotify-api

7 年前

jcornaz / hesso.mpri.kemboko

Challenge of gesture recognition for the course : "Multimodal Processing Recognition and Interaction" of the HES-SO university (Switzerland)

master school-project challenge 机器学习 multimodal-interactions

MATLAB

7 年前

zshafique25 / QUIZLY-APP

Developed a multimodal interactive quiz app allowing users to select answers via hand gestures. Created a user-friendly UI/UX in Figma and built the front end with React Native, using MongoDB for data management. Implemented a backend with Express and Node.js, and trained CNN models in Python for gesture recognition, enhancing user engagement.

cnn-classification Express Figma 机器学习 MongoDB multimodal-interactions Node.js Python React Native

JavaScript

2 年前

tiagohpf / im-2018-assign3

Control of some Spotify's functionalities with gestures

academic-project multimodal-interactions spotify-api

7 年前