(资料图片)
5月6日,在华为昇腾ai开发者峰会上,中国科学院自动化研究所“紫东太初”大模型研究中心常务副主任王金桥研究员透露,基于华为全栈国产化软硬件平台昇腾ai与开源ai框架昇思mindspore,自动化研究所和武汉人工智能研究院正在联合打造“紫东太初”2.0全模态大模型,可实现文本、图片、语音、视频、3d点云、传感信号等不同模态的统一表征和学习。峰会上,“紫东太初”开源了这一多模态模型,并开放了大模型服务平台。
从婴幼儿开始,人类的认知学习就是建立在对现实世界图像、声音和文字等多种模态信息基础之上。实现图、文、音等更多模态的通用大模型是人工智能融入现实世界的必然。
2019年开始,自动化研究所在语音、文本、图像等单模态大模型研究和应用基础上,瞄准多模态大模型开始联合攻关,并于2021年7月正式发布了全球首个千亿参数多模态大模型“紫东太初”。
目前,由自动化研究所牵头打造的多模态人工智能产业联合体已吸纳产学研界近70家成员单位。
“紫东太初”大模型已在手语教学、法律咨询、交通出行、医疗机器人、医学影像判读等数十个行业场景领域展现出广阔的落地潜力。比如,“紫东太初”大模型仅用0.546秒就可对法律案件进行拆解、提取关键事件,在办公效率方面实现了案件分析速度的百倍速提升,有效解决律师整体资源匮乏、服务成本高的问题;在智慧交通领域,构建了面向公路网的孪生仿真、调度、养护、节能、服务等数智平台,道路通行率有效提升30%;在医疗领域,基于“紫东太初”打造的颅内微创手术机器人系统已完成国际首例深位颅内活检手术。
本文作者:黄海华
题图来源:图虫
图片编辑:苏唯