沈阳自动化所机器视觉研究多篇论文获AAAI2026录用|行业头条|头条|全球电机网

近日，国际人工智能顶级会议AAAI 2026论文接收结果公布，中国科学院沈阳自动化研究所在机器视觉研究方面的多篇研究论文获录用。

　　在多模态大模型视觉生成方面，研究团队提出了一种专家表征对齐的多模态大模型训练框架ARRA，可有效促进大模型学习跨模态表征，实现多任务通用多模态生成。相关研究成果Unleashing the Potential of Large Language Models for Text-to-Image Generation through Autoregressive Representation Alignment被大会选为口头汇报(Oral)论文，论文第一作者为博士生谢兴，通讯作者为范慧杰研究员与屈靓琼助理教授。

　　在多模态大模型方面，研究团队提出了创新的物体分词框架ObjecTok，显著提升了模型以物体为中心的感知与推理能力。相关成果论文为ObjecTok: Learning Holistic and Robust Object Tokens for MLLMs，第一作者为博士生王思翰，通讯作者为刘西瑶副研究员。

　　在具身智能操作方面，研究团队提出了一种仿人知识总结与继承的终身学习框架，赋予智能操作机器人持续演进、不断适应新技能的终身学习能力。相关研究成果论文为Lifelong Language-Conditioned Robotic Manipulation Learning，第一作者为博士生王旭东与沈阳自动化所实习生韩泽斌，通讯作者为韩志研究员。

　　在具身智能导航方面，研究团队提出了一种基于分层规划策略的导航智能体，可提升智能机器人在复杂大场景中具身导航的鲁棒性。相关研究成果论文为SeqWalker: Sequential-Horizon Vision-and-Language Navigation with Hierarchical Planning，第一作者为沈阳自动化所实习生、中北大学本科生韩泽斌，通讯作者为博士生王旭东。

　　在视频定制化生成方面，研究团队提出了一种连续定制化视频扩散模型，可在连续动态空间中实现任意概念的个性化视频生成。相关研究成果论文为Bring Your Dreams to Life: Continual Text-to-Video Customization，第一作者为沈阳自动化所博士毕业生、穆罕默德·本·扎耶德人工智能大学博士后董家华和沈阳自动化所博士生王旭东，通讯作者为韩志研究员。

　　在生成式世界模型方面，研究团队提出了首个可用自然语言控制的 4D LiDAR 生成模型，实现了高逼真、可编辑的动态点云场景生成，可用于多种下游感知模型的安全验证和闭环仿真。该研究成果LiDARCrafter: Dynamic 4D World Modeling from LiDAR Sequences被大会选为口头汇报(Oral)论文，第一作者为博士生梁奥，通讯作者为赵怀慈研究员。

　　上述研究成果得到了国家自然科学基金、国家重点研发计划、机器人与智能系统全国重点实验室自主项目、沈阳自动化所基础研究项目等支持。

同类

国网葫芦岛供电：守护智能大棚点亮“莓”好时光
0评论2026-03-26

国家电投2026年计划投资2000亿元，同比增长17%

国家电投总经理、党组副书记徐树彪3月23日在该集团举行的2026年第一次新闻通气会上透露，国家电投已对2026年发展作出系统工作部署，其中包括统筹实施跨周期和逆周期调节举措，积极落实国家扩大有效投资部署，突出有

0评论2026-03-2622

降碳24.39%！国网白银供电公司电网绿色转型迎来“开门红”
0评论2026-03-26

护航“国之重器” 助力科技创新鼎和保险为科技金融高质量发展注入强劲动能

近日，广东阳江三山岛海上风电工程海上换流站封顶。将把深远海域的“绿电”输送至粤港澳大湾区，而支撑这颗“海上心脏”稳定跳动，保险保障不可或缺。3月6日，鼎和为广东阳江三山岛海上换流站提供一体化保险服务，保

0评论2026-03-2626

国网甘肃电力：高效完成2027年上半年新能源机制竞价用户告知
0评论2026-03-26