PG电子- PG电子官方网站- APP下载试玩本周六大咖讲座预告
2026-04-20PG电子,PG电子官方网站,PG电子试玩,PG电子APP下载
本报告聚焦多模态大模型在部署应用中遇到的挑战,介绍了一系列高效训练与压缩的技术创新。针对大模型参数量巨大、计算与存储资源消耗高、边缘部署困难等核心问题,本报告提出了一套覆盖高效迁移与高效压缩的综合性解决方案,具体包括:1)基于混合模态适配的高效视觉-语言指令微调技术(LaVIN),实现了低成本、防遗忘的多模态能力注入;2)结合动态结构跳跃的高效参数与计算迁移学习方法(PCETL/DAS),在推理时减少了计算开销;3)无需重训练的动态稀疏化方法,可对大模型进行秒级快速稀疏恢复;4)基于仿射变换的后训练量化技术(AffineQuant),突破了传统量化方法的优化空间限制;5)通过矩阵扩展消除量化中异常极大值的方法(IM-Unpack),实现了更低比特的精确量化。这些技术在保持模型性能的同时,显著降低了模型的存储需求和推理延迟,并已成功应用于“思源”(MindSource)系列多模态大模型,为大模型在消费级显卡等资源受限设备上的高效部署和广泛应用提供了关键技术支撑。
本报告聚焦大语言模型在医学影像分析领域的应用,深入探讨其面临的机遇与挑战。针对医学影像分析中语义鸿沟、数据标注难题、模型可靠性等关键问题,课题组提出一系列创新方法。运用动态语义自适应方法,有效解决医学视觉问答(Med-VQA)中的语义偏差,在相关数据集测试中展现出较高准确率;设计残差对齐框架,实现差异视觉问答(DiffVQA)的精准推理,辅助医生评估疾病进展。通过文本注入增强病理图像分类模型,整合视觉与文本信息提升分类性能。在弱监督学习方面,采用多级文本提示法优化伪标签质量,增强模型分割效果;创新文本增强混合专家模型和文本增强视觉对齐模型,提升半监督医学图像分割精度。此外,提出视觉不确定性增强语义熵方法,有效检测医学多模态大语言模型中的幻觉现象。未来,将持续探索通用医学多模态大模型构建,加强可解释性研究并推动其在临床场景的深度应用,为医学影像智能化发展提供有力支撑。
夏勇,西北工业大学人工智能学院副院长、长聘教授、博导、空天地海一体化大数据应用技术国家工程实验室成员,研究方向为医学影像智能计算,主持国家自然科学基金项目4项,近5年在JAMA Network Open、Radiology、IEEE-TPAMI、IEEE-TMI等本领域期刊和会议上发表学术论文100余篇,谷歌引用2万余次,H-Index = 69,现为中国体视学学会理事、中国计算机学会数字医学分会常委、IEEE-TMI Guest AE等,曾担任MICCAI 2019、MICCAI 2020、MICCAI 2025、ICASSP 2023、IJCAI 2025、AAAI 2026等学术会议的Session Chair或Area Chair,入选全球前2%顶尖科学家终身科学影响力排行榜。
舒祥波,南京理工大学计算机学院/人工智能学院/软件学院副院长、教授,社会安全信息感知与系统工信部重点实验室副主任、国家优青获得者、江苏省杰青获得者。研究方向为具身智能、人体行为计算,在TPAMI、CVPR、ICCV、ICLR、ACM MM等期刊/会议上发表论文100余篇,其中ESI高被引论文8篇;获江苏省自然科学一等奖、中国电子学会自然科学一等奖、ACM MM 2015最佳论文提名、MMM 2016最佳学生论文、CCBR2026最佳论文、江苏省优博、中国人工智能学会优博、江苏省行业领域优秀科技进展、全球前2%顶尖科学家(2021—2025年);主持国家自然科学基金联合重点项目、国家重点研发课题、国家重大科研仪器项目课题、国家自然科学基金面上项目、江苏省杰出青年基金等项目。担任CSIG青工委副秘书长,以及TNNLS、TCSVT、TIFS、Pattern Recognition等期刊编委。
AI与人们生产生活需求已深度融合,各种垂域大模型拓展了相关领域的能力边界,这也带来了信息新环境的重大变革,多模态大模型的规模化落地速度远超安全治理体系的建设进度,安全风险的爆发式扩散已凸显研究的极端紧迫性。当下数据泄露、算法偏见、深度伪造等风险持续蔓延,不仅威胁个人隐私与商业安全,更冲击社会治理秩序,乃至关乎国家数字安全。强化大模型安全的研究,既是应对当下风险的迫切需求,也是防范未来隐患、推动产业健康有序发展的必由之路,此报告将围绕多模态大模型的安全问题,从生成式大模型的内容安全和隐私安全两个方面深入探讨该领域最新技术和趋势。
李亮,中科院计算所研究员,博士生导师,国家级青年人才(优青)。研究领域为生成式人工智能、多模态学习和大模型,发表TPAMI等CCF-A类期刊和会议论文90余篇,谷歌引用7000余次,获得国际会议最佳论文奖4次(包括CCF-A类会议ACM MM2024最佳论文奖),6项工作入选ESI高被引论文;参与完成科技部和基金委相关项目等20余项,担任CCF-A类期刊IEEE TMM等6个国内外期刊编委,顶会ACL/ICLR/NeurIPS/AAAI/ACM MM/EMNLP领域主席,15次相关领域国内外会议的组织主席。获2025年教育部技术发明一等奖、2024年中国图象图形学学会青年科学家奖、2022年浙江省科技进步奖一等奖、2020年吴文俊人工智能自然科学一等奖、2013年中国科学院院长奖。相关技术在华为、淘宝、大华、华数传媒等公司使用。
徐行,现任同济大学计算机科学与技术学院教授,青年百人计划A岗,博士生导师,国家高层次青年人才。主要研究方向为多模态信息感知与理解、跨媒体智能分析、多模态大模型应用。已发表人工智能、多媒体、计算机视觉相关领域的中国科学院JCR 1区/CCF A类论文80余篇,ESI高被引/热点论文10余篇,授权国内外发明专利30余项。获得2025年教育部科学研究优秀成果奖自然科学奖一等奖,2025年中国电子学会自然科学一等奖,2022年吴文俊人工智能自然科学一等奖;获得国际多媒体大会ACM Multimedia (CCF A) 2017最佳论文奖,多媒体顶级期刊IEEE Transactions on Multimedia 2020最佳论文奖,人工智能顶级期刊IEEE Transactions on Fuzzy Systems(中科院JCR 1区)2024杰出论文奖;获得国际多媒体展览会IEEE International Conference on Multimedia & Expo(CCF B)2017最佳会议论文铂金奖和2022最佳学生论文奖等科技成果及国际学术奖励。入选第十四批四川省学术和技术带头人及后备人选。主持包括国自然青年科学基金(B类、C类)及面上项目、四川省科技厅重大专项,并参与科技部、国自然及省部级科研项目20余项。
王国庆,电子科技大学计算机学院教授、博导。担任四川省人工智能学院副院长、首批全国高校“双带头人”教师党支部工作室书记、四川省人工智能智能青年突击队队长。入选全国新时代青年先锋、国家级青年人才计划、四川省/成都市人才计划、江苏省U35计划。任四川省重点实验室学带和委员、某计划专家组秘书。主要关注多模态信息的成像、融合及感知大模型设计,并设计面向天空海自主无人平台的原型系统。目前在IEEE TPAMI、IJCV等发表论文100余篇,获ACM MM最佳论文提名奖、CSIG青年科学家奖、学会科技进步奖一等奖、全球遥感类竞赛一等奖等。出版学术专著2部,主持国家自然科学基金重点项目2项、国家重点研发计划项目1项。担任ACM MM、AAAI、ICME等会议领域主席和主题主席、Pattern Recognition等SCI期刊客座编委。
黄开竹,现任昆山杜克大学电子计算机与工程长聘教授、数字创新研究中心主任。2004年获香港中文大学博士学位,并先后在中国香港、日本、英国等多家知名科研机构学习和工作。曾荣获富士通实验室“社长奖”、亚太神经网络学会青年科学家奖、2024年IEEE ICDM 10年最高影响力论文奖等荣誉,并在国际人工智能会议获得十项最佳论文或提名奖。其研究领域涵盖可信人工智能、鲁棒机器学习以及相关视觉与医学等应用领域。迄今已发表9本英文书籍及280余篇国际期刊与会议论文,其中IEEE/ACM Transactions及CCF A类论文90余篇。受邀担任Elsevier CSSI主编以及六个国际期刊副主编或编委,主持五项国家自然科学基金面上及重大项目。
雷灵光,博士,厦门理工学院教授,硕士生导师。博士毕业于中国科学院信息工程研究所,美国乔治梅森大学访问学者,福建省B类高层次人才。长期从事Android移动安全、系统安全、密码应用安全等方向研究,在CCS、TDSC、TIFS、ESORICS、ACSAC等信息安全领域顶级/重要会议和期刊发表论文40余篇,参研国家标准5项,授权发明专利10余项(含美国发明专利1项),获党政密码科技进步奖一等奖2项(省部级)。主持国家重点研发计划课题、国家自然科学青年基金项目及“十三五”密码基金课题等国家及省部级项目7项,直接负责经费近800万元。


