具体内容(突破的关键核心技术):
1.多模态数据采集、融合与对齐技术:搭载多模态传感器(摄像头、麦克风、力传感器、温湿度传感器、电子鼻等),采集同步的多模态环境数据和交互数据;研究多模态数据预处理和对齐方法,包括时间同步、空间校准等。
2.模态感知模型训练与优化:利用大规模多模态预训练模型(如Vision-Language Models、Audio-Language Models)进行迁移学习或端到端训练。研究大规模多模态数据的训练策略,如多任务学习、弱监督学习等,提高模型对少样本或异构任务的适应性;以满足场景的应用推理需求。
产出的标志性创新成果及产业化前景:
人工智能多模态感知系统实现不同模态数据的高效融合与协同理解,是推动人机交互、智能机器人、自动驾驶等领域发展的核心。
本项目研发适用于不同场景的多模态感知算法和预训练模型,开发人工智能多模态感知系统,面向通信、教育、工业巡检、智能陪护等场景的终端应用,具有巨大的市场潜力。
项目实施突破关键技术2项,新增专利(软著)4项,形成新产品3个,项目执行期内累计实现销售收入1000万元以上,完成技术合同交易登记额600万元以上。
扫一扫在手机打开当前页