吴兴蛟

发布者：何靖宇发布时间：2024-10-22浏览次数：960

个人简介

吴兴蛟，男，博士，副教授，硕士生导师。曾获上海市超级博士后。主要研究方向为AI4Science、数字药物，人在回路计算。在重要国际会议/期刊发表学术论文50余篇，其中ESI全球热点论文（近10年内发表且被引次数排在相应学科领域全球前0.1%以内的论文）1篇，ESI高被引论文（全球前1%以内）2篇，SCI一区/CCF A类14篇(其中一作/通讯9篇)，SCI二区/CCF B类15篇(其中一作/通讯7篇)。发表在 FGCS上的论文获 Editor’s Choice Papers（一区期刊，入选率0.5%），McGE ’23 会议上论文获Best paper Award（CCF A类会议Workshop）。主持国家自然科学基金青年科学基金、上海市2024年度“科技创新行动计划”新一代信息技术关键技术攻关（第一批）项目、上海市多维度信息处理重点实验室开放课题项目、华东师范大学优秀博士生学术创新能力提升计划项目，作为子项目负责人主持华为诺亚方舟实验室合作项目等。研究工作获上海市技术发明一等奖一项、上海市科技进步二等奖一项，博士期间获中国大学生自强之星、上海市优秀毕业生等荣誉称号。

电子邮箱：xjwu@pharm.ecnu.edu.cn

教育背景

2018.9-2022.6 华东师范大学计算机应用技术工学博士，导师：贺樑教授，研究方向：多媒体信息处理，计算机视觉，人机混合

2015.9-2018.6 昆明理工大学计算机软件与理论工学硕士导师：吴晟教授，研究方向：算法研究，软件开发

2011.9-2015.6 昆明理工大学计算机科学与技术工学学士

工作背景

2024.10-至今华东师范大学药学院副教授，研究方向：AI4Science、数字药物，人在回路计算

2022.6-2024.9 复旦大学博士后（上海市超级博士后、复旦大学超级博士后）合作导师：金城教授，研究方向：计算机视觉，生成式人工智能，数字药物，人在回路计算

主要研究工作

基于情感可控的个性化多模态数字药物生成（现阶段）

在AIGC（人工智能内容生成）研究中，通过文字控制图像和视频的生成已经达到了较好效果，然而通过人的感受反馈，特别是情感反馈来控制音乐、图像和视频的AIGC技术仍存在挑战。本研究方向关注能够实时和“个人情感”对齐的多内容（音乐，视频，图像，脑电，文本等）生成技术、鲁棒性的个性化多模态数字内容生成框架和基于HITL的质量评估及反馈研究等，以通过AIGC生成能让人情绪乐观的数字内容来缓解焦虑症、抑郁症等精神类疾病。目前已在一区期刊INF以及IPM上提出了跨模态的情感细粒度对齐以及融合方法（论文-6, 7）；在CCF B类会议ICASSP上提出了用于多模态情感交互的多通道注意力图卷积网络（论文-16）；在CCF A类会议的Workshop McGE 上首次提出了关注人工设计图像质量评估的方法，获Best paper Award（论文-2）。

基于逆强化学习的人在回路计算（现阶段）

依靠挖掘海量数据中的规律来解决领域问题已经取得显著成效，然而如何使用有限数据解决依赖于专家知识的领域问题（如医学、法律、教育）仍是难点，这就需要探索有效路径使智能体依靠专家知识实现持续自我进化。本研究关注领域智能体演进过程中关键表征数据的小样本挖掘技术、具有较强适应性的人机知识融合框架以及能够高效反馈的人机交互方法。以期构建专家领域知识介入下的可持续演进领域智能体。目前已在一区期刊提出使用基于逆强化学习的人在回路方法（论文-1）；在CCF B类会议ICME上提出由场景级专家和对象级专家组成的双专家蒸馏网络获取小样本中的关键表征数据的方法（论文-12）；在一区期刊Knowledge-Based Systems提出了一种有效的聚类算法，作为该研究的有效支持（论文-8）；研究工作中所提出的基于人机混合的人群计数方法作为核心技术贡献参与申报并获得了2022年度上海市技术发明一等奖。

基于深度学习的复杂文档版面布局分析

简单版面文档理解随着大模型的发展已经逐渐成熟，然而如何理解复杂布局的文档（杂志、古籍以及古代医学书籍）仍是挑战。本研究方向关注复杂版面的生成、复杂版面的挖掘以及复杂版面的生成与评估。打通复杂文档布局生成分析、评估的完整工作，构建从文档生成到评估的完整体系，构建产学研用的完整通路。目前已在CCF B类会议ICME会议提出了基于图层建模的复杂文档生成方法（论文-11）；在文档处理顶级会议ICDAR提出了基于VAE的文档布局生成框架（论文-18）；在一区期刊INFORMATION SCIENCES期刊提出了基于显式边缘嵌入的文档布局分析方法（论文-3）；在一区期刊IPM以及CCF B类会议ICME上提出了基于动态残差特征融合的文档布局分析统一框架（论文-4,10）；核心技术获华为认可并启动了与华为诺亚方舟的合作，核心指标在InfographicVQA 任务上居于榜首（截止2023年11月，领先谷歌17%）；参与CCF技术公益黑客马拉松大赛获最佳方案奖；研究工作中所提出的基于显式边缘嵌入的文档布局分析工作参与申报并获得了2022年度上海市科技进步二等奖（排名6/10）。

学术成果（部分）

--------------------------------------------------------2025-----------------------------------------------------------------------------------------------------------------------------------------------------------

T. Huai, J. Zhang, X. Wu, J. Jin, L. He. Efficiency is the rule: Domain adaptive semantic segmentation with minimal annotations[J]. Expert Systems with Applications, 2025, 274: 126892.（通讯作者，中科院一区，IF=7.5）
Z. Zhou, X. Du, Y. Zheng, X. Wu, C. Jin, An Exemplar-based Framework for Chinese Text Recognition, AAAI, 2025 (CCF A类会议)
Z. Xie, C. Han, J. Shi, W. Cui, X. Zhao, X. Wu, J. Zhao. RMoA: Optimizing Mixture-of-Agents through Diversity Maximization and Residual Compensation，ACL，2025(CCF A类会议)
J. Shi, J. Zhao, X. Wu,R. Xu, Y. Jiang, L. He. Mitigating reasoning hallucination through Multi-agent Collaborative Filtering[J]. Expert Systems with Applications, 2025, 263: 125723.（中科院一区，IF=7.5）
X. Du，Z. Zhou，Y. Wang，Y. Zheng，X. Wu，P. Gong，C. Jin. Unleashing the Semantic Adaptability of Controlled Diffusion Model for Image Colorization, IJCAI,2025(CCF A类会议)
T. Huai, J. Zhou, X. Wu, Q. Chen, Q. Bai, Z. zhou, L. He. CL-MoE: Enhancing Multimodal Large Language Model with Dual Momentum Mixture-of-Experts for Continual Visual Question Answering, CVPR, 2025(CCF A类会议)

--------------------------------------------------------2024-----------------------------------------------------------------------------------------------------------------------------------------------------------

X. Wu, L. Xiao, X. Du, Y. Zheng, X. Li, T. Ma, C. Jin, L. He,Cross-domain document layout analysis using document style guide, Expert Systems with Applications，2024（中科院一区，IF=7.5）
L. Xiao, X. Wu*, J. Xu,W. Li,C. Jin,L. He. Atlantis: Aesthetic-oriented Multiple Granularities Fusion Network for Joint Multimodal Aspect-based Sentiment Analysis, Information Fusion, 2024.（通讯作者，中科院一区，IF=14.7, ESI高被引）
J. Liao , X. Wu*,Y. Wu and J. Shu. K-NNDP: K-means algorithm based on nearest neighbor density peak optimization and outlier removal, Knowledge-Based Systems, 2024.（通讯作者，中科院一区，IF=7.2）
X. Du,Z. Zhou, X. Wu*,Y. Wang,Z. Wang,Y. Zheng,C. Jin*. MultiColor: Image Colorization by Learning from Multiple Color Spaces,ACM Multimedia, 2024.（共同通讯作者，CCF A）

--------------------------------------------------------2023-----------------------------------------------------------------------------------------------------------------------------------------------------------

Y. Wan, W. Li, X. Wu*, J. Xu, and J. Yang. Auto-matic Image Aesthetic Assessment for Human-designed Digital Images. McGE ’23.2023.[Best paper] (通讯作者，CCF A类会议Workshop)
X. Wu, T. Ma, X. Du, Z. Hu,J. Yang,L. He, DRFN: A unified framework for complex document layout analysis, Information Processing & Management., 2023.（中科院一区，IF=7.4）
L. Xiao, X. Wu*, S. Yang,J. Xu,J. Zhou,L. He. Cross-modal Fine-grained Alignment and Fusion Network for Multimodal Aspect-based Sentiment Analysis, Information Processing & Management, 2023.（通讯作者，中科院一区，IF=7.4）
T. Ma, X. Wu†, X.Du, Y. Wang, C. Jin, Image Layer Modeling for Complex Document Layout Generation, ICME, 2023.（共一，CCF B类会议）
J. Zhang, Z. Zhuang, L. Xiao, X. Wu*, T. Ma, L. He, Dual-Expert Distillation Network for Few-Shot Segmentation. ICME, 2023.（通讯作者，CCF B类会议）
X Li, T Ma, Y Hou, B Shi, Y Yang, Y Liu, X Wu, Q Chen, Y Li, Y Qiao, L He. Logonet: Towards accurate 3d object detection with local-to-global cross-modal fusion[C]. CVPR. 2023: 17524-17534.

--------------------------------------------------------2022-----------------------------------------------------------------------------------------------------------------------------------------------------------

X. Wu, L. Xiao, Y.Sun, J.Zhang,T. Ma, L. He, A Survey of Human-in-the-loop for Machine Learning, Future Generation Computer Systems,2022.[ Editor’s Choice Papers(编委会从近五年发表论文中提名评选，入选率约0.5% )，ESI热点论文、ESI高被引论文]（中科院一区，IF=6.2）
L. Xiao, X. Wu†, W. Wu ,J. Yang,L. He. Multi-channel Attentive Graph Convolutional Network With Sentiment Fusion For Multimodal Sentiment Analysis. ICASSP, 2022.（共一，CCF B类会议）

--------------------------------------------------------2021-----------------------------------------------------------------------------------------------------------------------------------------------------------

X. Wu, Y. Zheng, T. Ma, H. Ye, L. He, Document Image Layout Analysis via Explicit Edge Embedding Network, Information Sciences, 2021.（中科院一区，IF=8.1（2022））
X. Wu, Z. Hu, X. Du, J. Yang,L. He. Document Layout Analysis via Dynamic Residual Feature Fusion. ICME, 2021.（CCF B类会议 Oral）

--------------------------------------------------------2020之前-----------------------------------------------------------------------------------------------------------------------------------------------------

X. Wu, Y. Zheng, H. Ye, W. Hu, J. Yang,L. He, Adaptive Scenario Discovery for Crowd Counting. ICASSP, 2019.（CCF B类会议）
X. Wu, B. Xu, Y. Zheng, H. Ye, J. Yang, L. He . Fast video crowd counting with a Temporal Aware Network. Neurocomputing, 2020.（中科院二区，IF=5.5）
X. Wu, Y. Zheng, H. Ye, W. Hu, T. Ma, J. Yang, L. He, Counting Crowds with Varying Densities via Adaptive Scenario Discovery Framework[J], Neurocomputing , 2020.（中科院二区，IF=5.5）
X. Wu, S. Kong, Y. Zheng, H. Ye, J. Yang,L. He, Feature channel enhancement for crowd counting. IET Image Processing, 2020.（中科院四区，IF=2.0）
J. He, X. Wu†, W. Hu, J. Yang,LSTMVA: vivid layout via LSTM-based Variational Autoencoder framework. ICDAR, 2021.（共一，CCF C类会议文档处理顶级会议）
吴俊斌,吴晟,吴兴蛟*.一种用于求解TSP问题的随机最佳插入烟花算法[J].计算机工程与科学,2020,42(11):2080-2087.（CCF C (中文)，中文核心，通讯作者）

项目经历

抑郁症数字疗法关键技术研究.国家自然科学基金青年基金(国家自然科学基金)，2025-2028, 项目负责人（在研）
基于人在回路的具身智能学习方法研究.上海市2024年度“科技创新行动计划”新一代信息技术关键技术攻关（第一批）项目，2025-2027, 项目负责人（在研）
基于人在回路的复杂文档布局分析关键技术研究.上海市多维度信息处理重点实验室2023年度开放课题(上海市多维度信息处理重点实验室), 2023-2024, 项目负责人（结题）
文档视觉特征统一建模技术.华为技术有限公司(华为诺亚方舟实验室), 2022-2023, 子项目负责人（结题）
人工智能技术赋能文化艺术创作的创新应用.上海市促进文化创意产业发展财政扶持资金拟支持项目（上海市文创办），2024-2025，合作方项目负责人（在研）
人机混合智能下的模型轻量化以及模型更新关键技术研究(华东师范大学）.华东师范大学优秀博士生学术创新能力提升计划, 2020-2022, 项目负责人（结题）
基于人机混合的中药识别关键技术研究.云南省教育厅科学研究基金项目(云南省教育厅), 2021-2022, 主要参与人（结题）
基于人机混合的模糊缺陷分类技术研究.上海市科学技术委员会科技创新行动计划(上海市科委), 2020-2022, 主要参与人（结题）

奖励荣誉

2022年度上海市科学技术奖（技术发明奖一等奖）（上海市人民政府）（2023，排名13/15，唯一学生）
2022年度上海市科学技术奖（科技进步奖二等奖）（上海市人民政府）（2023，排名6/10）
2020中国大学生自强之星（共青团中央、全国学联）(2021，华师大当年度唯一入选)
上海市优秀毕业生（上海市教育委员会）（2022）
中国研究生数学建模竞赛英才（中国研究生数学建模竞赛组委会）（2023，20年间评选出30人）
2023年CCF技术公益黑客马拉松大赛中荣获最佳方案奖（中国计算机学会）（2023，全场得分最高）
2021-2022年度华东师范大学优秀学位论文（华东师范大学）（2022）
华东师范大学优秀学生干部（华东师范大学） (2021)，华东师范大学优秀学生（华东师范大学） (2020)
全国大学生电工数学建模竞赛一等奖（中国电机工程学会电工数学专委会） (2017)

社会工作

担任TPAMI、TNNLS、CVPR、ECCV、ICCV、ACCV、AAAI、ICLR、TIP、TMM、Information Processing & Management、IEEE Transactions on Cybernetics等会议/期刊审稿人
《信息与控制》期刊青年顾问团专家
CCF专业会员，CCF人机交互专委会委员、CCF计算机视觉专委会委员

导航

吴兴蛟

友情链接