王智慧

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:女

毕业院校:大连理工大学

学位:博士

所在单位:软件学院、国际信息与软件学院

学科:软件工程

办公地点:大连理工大学开发区校区信息楼317室

联系方式:zhwang@dlut.edu.cn

电子邮箱:zhwang@dlut.edu.cn

其他联系方式Other Contact Information

邮箱 : zhwang@dlut.edu.cn

扫描关注

个人简介Personal Profile

个人简介:

王智慧,1982.10,大连理工大学软件学院、国际信息与软件学院,教授,博导。主要研究方向为AI4Science、多模态信息融合感知、计算机视觉。研究兴趣广泛,在包括TPAMI、CVPR、TIP、TMI、TGRS、MICCAI等重要国际会议和期刊发表论文150余篇;申请及授权国内外专利50余项;承担新一代人工智能国家重大专项(参与单位负责人)、国家自然科学基金项目、JW基础研发项目等10余项,主持项目总经费超千万;完成3项科技成果转化落地。

2000.09 --- 2004.07 东北大学 学士

2004.09 --- 2007.01 大连理工大学 保送硕士

2007.01 --- 2010.07 大连理工大学 博士

2010.08 --- 2012.10 大连理工大学 师资博士后

2010.10 --- 2011.11 华盛顿大学 访问学者(HostProf. Mingt-Ting Sun) 2012.08 --- 2013.12 大连理工大学 讲师

2013.09 --- 2013.11 新加坡国立大学 访问学者(HostProf. Tok Wang Ling)

2013.12 --- 2020.12 大连理工大学 副教授、数字媒体技术专业副系主任、专业教工党支部书记

2020.12 --- 现在    大连理工大学 教授  

代表性论文:

1.   H. Zhang, Y. Teng, H. Li, Z. Wang: STRobustNet: Efficient Change Detection via Spatial Temporal Robust Representations in Remote Sensing. IEEE Trans. Geosci. Remote. Sens. 63: 1-15, 2025

2.       S. Chen, X. Ma, H. Zhang, H. Li, Z. Wang*: Propagating Sparse Depth via Depth Foundation Model for Out-of-Distribution Depth Completion. IEEE Trans. Image Process. 34: 5285-5299, 2025

3.       S. Chen, X. Ma, H. Zhang, H. Li, B. Sun, Z. Wang*: Real-Time Depth Completion With Multimodal Feature Alignment. IEEE Trans. Neural Networks Learn. Syst. 36(9): 16100 16112, 2025

4.       B. Sun, N. Wang, X. Ma, A. Zou, Y. Lu, C. Fan, Z. Wang*, K. Lu, Z. Wang: RobAVA: A Large-scale Dataset and Baseline Towards Video based Robotic Arm Action Understanding. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2025

5.       X. Yang, R. Xu, X. Ye, Z. Wang, M. Zhang, Y. Wang, X. Fan, H. Wang, Q. Yue, X. He, Y. Chen: Video Masked Echocardiography. MICCAI (13): 171-180, 2025

6.       B. Sun, Y. Wang, X. Ma, Z. Wang, K. Lu, Z. Wang*: Toward an Effective Action-Region Tracking Framework for Fine-Grained Video Action Recognition, IEEE Transactions on Neural Networks and Learning Systems, 2025

7.       S. Wang, J. Chang, Z. Wang, H. Li, W. Ouyang, Q. Tian: Content-Aware Rectified Activation for Zero-Shot Fine-Grained Image Retrieval. IEEE Trans. Pattern Anal. Mach. Intell. 46(6): 4366-4380, 2024

8.       S. Wang, Z. Wang, H. Li, J. Chang, W. Ouyang, Q. Tian: Accurate Fine-Grained Object Recognition with Structure-Driven Relation Graph Networks. Int. J. Comput. Vis. 132(1): 137 160, 2024

9.       C. Liu, H. Li, Z. Wang: FastTrack: A Highly Efficient and Generic GPU-Based Multi-object Tracking Method with Parallel Kalman Filter. Int. J. Comput. Vis. 132(5): 1463-1483, 2024

10.    S. Chen, H. Zhang, X. Ma, Z. Wang*, H. Li: Learning Pixel-Wise Continuous Depth Representation via Clustering for Depth Completion. IEEE Trans. Circuits Syst. Video Technol. 34(7): 6303-6317, 2024

11.    X. Ye, Y. Guo, B. Sun, R. Xu, Z. Wang, H. Li: C2ANet: Cross-Scale and Cross-Modality Aggregation Network for Scene Depth Super-Resolution. IEEE Trans. Multim. 26: 2574-2584, 2024

12.    C. Liu, H. Li, Z. Wang, R. Xu: Addressing Challenges of Incorporating Appearance Cues Into Heuristic Multi-Object Tracker via a Novel Feature Paradigm. IEEE Trans. Image Process. 33: 5727-5739, 2024

13.    X. Ma, Y. Wang, Y. Zhang, Z. Xia, Y. Meng, Z. Wang*, H. Li, W. Ouyang: Towards Fair and Comprehensive Comparisons for Image-Based 3D Object Detection. ICCV 2023: 6402 6412

14.    J. Shi, B. Sun, X. Ye, Z. Wang*, X. Luo, J. Liu, H. Gao, H. Li: Semantic Decomposition Network With Contrastive and Structural Constraints for Dental Plaque Segmentation. IEEE Transactions on Medical Imaging (TMI) 42(4): 935-946, 2023

15.    B. Sun, X. Ye, Z. Wang*, H. Li, Z. Wang: Exploring Coarse-to-Fine Action Token Localization and Interaction for Fine-grained Video Action Recognition. ACM Multimedia 2023: 5070-5078

科研业绩:

纵向项目:

1. 新一代人工智能国家科技重大专项项目“面向重大需求场景的科研智能”(2025ZD0121800),(2025-2028,240万,大连理工大学负责人),参与课题“面向材料设计的科研智能方法研究”,负责面向材料设计的多模态数据表征及融合算法研发、支撑材料设计多模态大模型研发。

2. 多模式信息融合(2020-2022,330万,负责人)。项目聚焦提升无人作战平台的智能感知能力,实现全天候(红外+可见光)和超广角多目联合场景深度感知和目标精准定位。

3. 水下近距离场景的智能立体视觉感知(2019-2023,国家自然科学基金,71万,负责人)。本项目致力于研究水下近距离智能立体视觉感知中的深度估计、目标检测和语义分割的理论、方法和技术,发布了近距离水下真实场景的目标检测和语义分割数据集。

4. 恶劣海洋环境下的具身智能系统精准感知与交互协同(2025-2029,国家自然科学基金,1488万,参与人)。项目围绕恶劣海洋环境下智能具身系统关键科学问题,拟开展主动行为引导的多模态精准感知,作业行为驱动的定位与动态路径规划,异构多智能体行为交互与协同的精细作业,感知与行为融合的自主进化等理论与技术研究,并构建面向恶劣海洋环境的具身智能系统与应用验证平台。

横向项目:

1. 基于全景视频场的用于生产车间异常行为检测和预警的集成化AI装置开发(2024-2025,中物技术有限公司,86.5万,负责人)。开发一套基于全景视频场的用于生产车间机械安全行为异常检测(包括形态异常、运动异常等)和预警的嵌入式AI装置。

2. 便携射线数字成像系统(2021-2022,中广核检测技术有限公司,41.9万,负责人)。开发一套便携式CT的核工业焊接缺陷检测软件系统,对标完成荷兰某软件系统的国产化替代及升级。

3. 基于大数据平台的数据安全(数字水印和同态加密)技术课题研究合作协议(2019-2019,360智慧科技有限公司,60万,负责人)。提出基于大数据平台的数据安全解决方案,聚焦于数字水印和同态加密,旨在确保数据的隐私、完整性和可追溯性,同时允许数据在需要时进行安全的共享和处理,以满足合规性要求并降低数据泄露的风险。

4. 一种基于Unity3D的GIS数字孪生系统,科技成果转化,非独占授权,70万,负责人。

5. 基于判别学习的细粒度图像分类算法,科技成果转化,专利转让,20万,负责人。

重要成果:

1. 地震监测新突破:SeisMoLLM模型以低成本实现跨模态迁移。联合上海人工智能实验室、中国地震局地震预测研究所及上海交通大学的联合研究团队提出了一项创新解决方案——SeisMoLLM模型。该模型首次将预训练大语言模型的序列建模能力成功迁移到地震波形分析中,采用跨模态迁移技术,旨在构建一个用于地震监测的基础模型框架,为解决地震学长期面临的数据异质性和模型泛化能力等关键挑战提供了全新思路。

2. 提出了RobAVA,一个专为基于视频的机器人臂动作理解而设计的大规模、细粒度数据集。该数据集填补了现有资源在真实、复杂机器人操作场景中的空白,其特点在于包含多视角视频序列,并提供了密集的时空动作标注、自然语言指令及机器人末端执行器轨迹。此外,我们还为RobAVA设计了全面的基准任务,包括原子动作检测、时序动作定位与轨迹预测,并系统评估了多种先进的视频理解模型,揭示了该领域的关键挑战。此数据集与基线为机器人学习、动作理解及人机交互等研究提供了至关重要的基准平台与推动力。

3. 作为核心成员研制了车载多波段立体视觉感知单元样机,负责联合标定和测距模块,辅助团队在陆军装备部1518万全社会公开实物招标项目中获得全国第一名,申报专利25项。在视觉理解方面,提出了直接深度采样和监督的双目深度估计网络、色彩嵌入的点云空间三维目标检测网络(ICCV),平面偏差拟合的非结构化道路分割网络等,这些成果受到德国戴姆勒公司(奔驰)、日本丰田公司、商汤、华为等研究组的关注和引用,相关研究获批军委科技委GF基础科研项目“多模式信息融合”(330万)

4. 构建了第一个机器人和蛙人拍摄的海洋牧场真实场景数据集UDD,整理标注了目前最大的水下目标检测数据集(UDO),并给出了最新的Bencmark,单篇论文引用量近500。此外,针对水下嵌入式平台对检测算法实时性和准确性两方面并重的要求,设计了轻量级的水下目标检测网络,并提出了无监督水下自适应深度估计网络(TCSVT),获取水下目标的距离信息。相关研究获批国家自然科学基金面上项目“水下近距离场景的智能立体视觉感知“

获得奖励/专利:

1. 基于相关学习的图传播的弱监督细粒度图像分类算法.授权公告号:CN111062438B.

2. 一种基于生长的栅格地图障碍物检测方法.授权公告号:CN110969102B.

3. 基于轨迹特征配准的多光谱立体相机自标定算法.授权公告号:CN111080709B.

4. 基于判别性特征导向的高斯混合模型的细粒度图像识别算法.授权公告号:CN111242102B.

5. 基于深度神经网络的多信息渐进融合的深度超分辨率方法.授权公告号:CN111738921B.

6. 一种基于深度神经网络的多信息渐进融合的场景深度超分辨率方法.授权公告号:CN111738921A.

7. 一种基于显著性检测的商品目标快速检索方法.授权公告号:CN108717436B.

8. 面向烟雾检测应用的预处理方法.授权公告号:CN107992799B.

9. 多波段立体相机的深度估计加速方法.授权公告号:CN111210481A.

10. 引入注意力图谱的双目视差估计方法.授权公告号:CN111259945A.

11. 于上采样及精确重匹配的视差估计优化方法.授权公告号:CN111242999A.

12. 一种多波段立体相机的视差图像融合方法.授权公告号:CN111260597B.

13. 基于渐进式对抗生成网络的多目标草图生成图像的方法.授权公告号:CN110111236B.

14. 基于双色彩空间引导的动漫线稿自动上色方法.授权公告号:CN10223359B.

15. 基于用户颜色引导的语义级别线稿上色方法.授权公告号:CN108830913A.

 


  • 教育经历Education Background
  • 工作经历Work Experience
  • 研究方向Research Focus
  • 社会兼职Social Affiliations
  • 人工智能

  • 计算机视觉