💡 关于我
我的研究兴趣主要集中在 Agentic AI 和 多模态情感智能。欢迎就相关方向合作交流。
我曾担任团队负责人并获得了 ACM MM 2025 MER (多模态情感识别) 挑战赛 DES 赛道的第一名。此外,我的第一作者论文已被 ACM MM 主会 Grand Challenge 赛道录用。
在2024年,我被选树为广东大学生年度人物和人民日报国家奖学金学生代表。
| 联系方式:yueshenghuang@stu.gpnu.edu.cn | English / 中文 |
🔥 新闻
- 2026.01: 🚀 我发布 Awesome Affective Computing:Affective Computing & Emotion AI 精选清单,涵盖多模态情感识别、情感推理、多模态情感分析与共情式 LLM/MLLM 的论文、数据集与工具包。 Awesome Affective Computing
- 2025.08: 🏆 我获得 ACM MM 2025 MER Challenge (DES Track) 第一名(担任团队负责人)!
- 2025.08: 📄 我的第一作者论文被 ACM MM 2025 主会 Grand Challenge 赛道录用!
- 2024.12: 🎉 我获评 2023 年度广东大学生年度人物(全省本硕博共评选 10 人),为同年度最年轻的获奖者。
- 2024.05: 🎉 我作为 100 名本科生国家奖学金获得者代表之一被《人民日报》报道(广东省仅 4 名)。
- 2023.12: 🎉 我获得国家奖学金。
📝 发表论文
ACM MM 2025

Affective-CoT: Decomposing Multimodal Emotion Reasoning through a Hierarchical Cognitive Workflow
Yuesheng Huang, Jinming Liu, Jiajia Chen, Yihang Lin, Yanmei Chen, Jianwei Dong
BibTeX
@inproceedings{huang2025affective,
title={Affective-CoT: Decomposing Multimodal Emotion Reasoning through a Hierarchical Cognitive Workflow},
author={Huang, Yuesheng and Liu, Jinming and Chen, Jiajia and Lin, Yihang and Chen, Yanmei and Dong, Jianwei},
booktitle={Proceedings of the 33rd ACM International Conference on Multimedia},
pages={13848--13855},
year={2025}
}
title={Affective-CoT: Decomposing Multimodal Emotion Reasoning through a Hierarchical Cognitive Workflow},
author={Huang, Yuesheng and Liu, Jinming and Chen, Jiajia and Lin, Yihang and Chen, Yanmei and Dong, Jianwei},
booktitle={Proceedings of the 33rd ACM International Conference on Multimedia},
pages={13848--13855},
year={2025}
}
MRAC@ACM MM

DARE to Disagree: A Multi-Agent Adversarial Debate Framework for Open-Vocabulary Multimodal Emotion Recognition
Yuesheng Huang, Meiqi Feng, Zhenming He, Yueyuan Peng, Jiawen Li
BibTeX
@inproceedings{huang2025dare,
title={DARE to Disagree: A Multi-Agent Adversarial Debate Framework for Open-Vocabulary Multimodal Emotion Recognition},
author={Huang, Yuesheng and Feng, Meiqi and He, Zhenming and Peng, Yueyuan and Li, Jiawen},
booktitle={Proceedings of the 3rd International Workshop on Multimodal and Responsible Affective Computing},
pages={41--50},
year={2025}
}
title={DARE to Disagree: A Multi-Agent Adversarial Debate Framework for Open-Vocabulary Multimodal Emotion Recognition},
author={Huang, Yuesheng and Feng, Meiqi and He, Zhenming and Peng, Yueyuan and Li, Jiawen},
booktitle={Proceedings of the 3rd International Workshop on Multimodal and Responsible Affective Computing},
pages={41--50},
year={2025}
}
ICML NewInML

Can Generated Images Serve as a Viable Modality for Text-Centric Multimodal Learning?
Yuesheng Huang, Peng Zhang, Riliang Liu, Jiaqi Liang
BibTeX
@misc{huang2025generatedimagesserveviable,
title={Can Generated Images Serve as a Viable Modality for Text-Centric Multimodal Learning?},
author={Yuesheng Huang and Peng Zhang and Riliang Liu and Jiaqi Liang},
year={2025},
eprint={2506.17623},
archivePrefix={arXiv},
primaryClass={cs.MM},
url={https://arxiv.org/abs/2506.17623},
}
title={Can Generated Images Serve as a Viable Modality for Text-Centric Multimodal Learning?},
author={Yuesheng Huang and Peng Zhang and Riliang Liu and Jiaqi Liang},
year={2025},
eprint={2506.17623},
archivePrefix={arXiv},
primaryClass={cs.MM},
url={https://arxiv.org/abs/2506.17623},
}
CMC 2024

Sentiment Analysis Using E-Commerce Review Keyword-Generated Image with a Hybrid Machine Learning-Based Model
Jiawen Li, Yuesheng Huang, Yayi Lu, Leijun Wang*, Yongqi Ren and Rongjun Chen
GB/T
Li J, Huang Y, Lu Y, et al. Sentiment Analysis Using E-Commerce Review Keyword-Generated Image with a Hybrid Machine Learning-Based Model[J]. Computers, Materials & Continua, 2024, 80(1).
MLA
Li, Jiawen, et al. "Sentiment Analysis Using E-Commerce Review Keyword-Generated Image with a Hybrid Machine Learning-Based Model." Computers, Materials & Continua 80.1 (2024).
APA
Li, J., Huang, Y., Lu, Y., Wang, L., Ren, Y., & Chen, R. (2024). Sentiment Analysis Using E-Commerce Review Keyword-Generated Image with a Hybrid Machine Learning-Based Model. Computers, Materials & Continua, 80(1).
Engineering Letters

An Improved Hybrid CNN-LSTM-Attention Model with Kepler Optimization Algorithm for Wind Speed Prediction
Yuesheng Huang, Jiawen Li, Yushan Li, Routing Lin, Jingru Wu, Leijun Wang, and Rongjun Chen
GB/T
Huang Y, Li J, Li Y, et al. An Improved Hybrid CNN-LSTM-Attention Model with Kepler Optimization Algorithm for Wind Speed Prediction[J]. Engineering Letters, 2024, 32(10).
MLA
Huang, Yuesheng, et al. "An Improved Hybrid CNN-LSTM-Attention Model with Kepler Optimization Algorithm for Wind Speed Prediction." Engineering Letters 32.10 (2024).
APA
Huang, Y., Li, J., Li Y., Lin, R., Wu, J., Wang, L., & Chen, R. (2024). An Improved Hybrid CNN-LSTM-Attention Model with Kepler Optimization Algorithm for Wind Speed Prediction. Engineering Letters, 32(10).
🏆 竞赛获奖
- 2025.08 ACM MM 2025 MER Challenge(DES Track)冠军(团队负责人)。
- 2025.02 中国大学生技术创新创业大赛信息技术、医疗健康、现代服务赛道三赛道一等奖。
- 2024.06 广东挑战杯创业计划竞赛银奖,广东省教育厅。
- 2024.05 美国大学生数学建模竞赛(MCM/ICM)E题Finalist奖(全球前2%),COMAP。
- 2023.11 中国大学生数学建模竞赛广东赛区一等奖。
- 2023.08 中国大学生计算机设计大赛广东赛区一等奖。
- 2023.08 国际高校数学建模竞赛特等奖。
- 2023.07 全国大学生电工数学建模竞赛一等奖,中国电机工程学会。
- 2021.12 Kaggle Lux AI竞赛银牌。
🎓 教育背景
- 2021.09 - 2025.06, 物联网工程 工学学士学位(ESI前1%), 计算机科学学院, 广东技术师范大学(优秀毕业生)。(GPA:92.1/100, 排名:1/111)(同届全校最高分)
基于多模态数据与大模型赋能的学生情感智能分析与监测系统设计摘要
随着人工智能与深度学习技术的深入发展,多模态情感分析在教育领域的应用潜力日益显现。传统单模态情感识别方法在捕捉学生复杂情绪状态方面存在局限,而多模态分析通过整合面部表情、语音信息与生理信号,能显著提升情感识别的准确性。当前教育信息化背景下,学生心理健康监测需求迫切,但现有方法存在时效性差、主观性强、难以规模化等问题,限制了其在校园环境的普及。
针对上述挑战,本文提出并实现了一套基于ESP32与ESP32S3硬件平台,结合轻量化多模态融合算法及大语言模型的学生情感智能分析与监测系统。该系统旨在利用低成本、高集成度的嵌入式技术,融合面部、语音、心率等多源数据,为教育工作者、家长及学生提供实时、准确、便捷的情感监测与支持工具。
在硬件层面,采用ESP32与ESP32S3双主板分布式架构。ESP32主板集成ESP32CAM、心率传感器等,实现面部表情识别、生理数据采集及基础反馈;ESP32S3主板集成数字麦克风、音频功放、显示屏等,实现基于百度文心一言API的智能对话功能。软件层面,基于Node.js构建服务端,采用SQLite进行数据存储,开发了面向教师、学生、家长的多角色Web应用界面。算法层面,设计了基于Deepface的面部情绪识别、基于文心一言API的语音情感分析,设计了动态权重决策级多模态融合算法,并引入基于数据量的多模型情绪趋势预测方法。同时,利用提示词优化了大模型在情感支持对话任务中的表现。
设计完成后,完成了系统硬件平台的搭建与调试,并对软件系统进行了全面的功能测试与验证,包括白盒测试与黑盒测试。测试结果表明,系统各模块运行稳定,功能符合设计要求,能够有效整合多模态数据进行学生情感状态分析与监测,验证了该设计的可行性与有效性。
关键词:多模态情感分析;学生情感监测;ESP32;大语言模型;数据融合 - 2018.09 - 2021.06, 普通高中, 韶关市翁源中学
📖 研究课题
- 2023.05-2024.05, “基于高斯树的MIMO系统检测算法研究与实现”, 大学生创新创业计划项目, 主持。(项目已结项)
- 2024.01-2026-01, “基于深度学习的多模态数据融合细粒度情感分析研究”, 广东省科技创新战略资金, 45,000元, 主持。(项目已结项)
- 2024.05-2025.05, “神经侦探:用于神经退行性疾病诊断的可解释多模态对比学习框架”, 大学生创新创业计划项目, 主持。(项目已结项)
- 2024.05-2025.05, “DASAM:用于数字桑基鱼塘的通用农业视觉大模型”, 国家级大学生创新创业计划项目, 参与。(项目已结项)
©️ 专利与版权
- 2025, “基于多模态大语言模型的学生情感智能分析系统平台 V1.0”, 中国软件著作权, 2025SR1585138, 第一完成人
- 2024, “基于Flask的医学图像分割平台V1.0”, 中国软件著作权, 2024SR0877362