Jianguo Wei

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

Min Zhang
214 publications
Tat-Seng Chua
173 publications
Jiawei Han
140 publications
Lingfei Wu
97 publications
Lin Zhang
88 publications
Yu Zhao
61 publications
Yixin Cao
49 publications
Di Jin
43 publications
Meishan Zhang
43 publications
Hao Fei
37 publications
Wei Ji
37 publications

research

∙ 08/09/2023

Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic Role Labeling

Video Semantic Role Labeling (VidSRL) aims to detect the salient events ...

0 Yu Zhao, et al. ∙

research

∙ 05/19/2023

Generating Visual Spatial Description via Holistic 3D Scene Understanding

Visual spatial description (VSD) aims to generate texts that describe th...

0 Yu Zhao, et al. ∙

research

∙ 10/20/2022

Visual Spatial Description: Controlled Spatial-Oriented Image-to-Text Generation

Image-to-text tasks, such as open-ended image captioning and controllabl...

0 Yu Zhao, et al. ∙

research

∙ 06/15/2022

TeKo: Text-Rich Graph Neural Networks with External Knowledge

Graph Neural Networks (GNNs) have gained great popularity in tackling va...

2 Zhizhi Yu, et al. ∙

research

∙ 03/17/2022

TMS: A Temporal Multi-scale Backbone Design for Speaker Embedding

Speaker embedding is an important front-end module to explore discrimina...

0 Ruiteng Zhang, et al. ∙

research

∙ 10/26/2021

CS-Rep: Making Speaker Verification Networks Embracing Re-parameterization

Automatic speaker verification (ASV) systems, which determine whether tw...

0 Ruiteng Zhang, et al. ∙

research

∙ 10/22/2020

Selection of the optimal embedding positions of digital audio watermarking in wavelet domain

This work studied embedding positions of digital audio watermarking in w...

0 Yangxia Hu, et al. ∙

Success!

An error occurred

Jianguo Wei

Featured Co-authors

Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic Role Labeling

Generating Visual Spatial Description via Holistic 3D Scene Understanding

Visual Spatial Description: Controlled Spatial-Oriented Image-to-Text Generation

TeKo: Text-Rich Graph Neural Networks with External Knowledge

TMS: A Temporal Multi-scale Backbone Design for Speaker Embedding

CS-Rep: Making Speaker Verification Networks Embracing Re-parameterization

Selection of the optimal embedding positions of digital audio watermarking in wavelet domain

Sign in with Google

Consider DeepAI Pro