爱尚秀 > 社会 > 正文

​携智能单元“全家桶”,RockAI Yan1.3掀起群体智能革命

2024-10-02 21:35 来源:爱尚秀 点击:

携智能单元“全家桶”,RockAI Yan1.3掀起群体智能革命

来源:猎云网

群体智能,未来已来。

9 月 26 日,RockAI" 真端侧 · 智无界 " 开放日活动在上海举行。会上,RockAI 正式推出了全新升级的 Yan1.3 群体智能单元大模型,并展示了其在无人机、机器人、PC、手机等各类终端设备上的超强模力。

相较于 1 月份首发的 Yan1.0,Yan1.3 具备了强大的多模态能力,可高效处理图文及语音等多模态信息,并实现了模型在更广泛设备端上的离线无损部署,普通电脑 CPU 上也能够流畅运行。

CEO 刘凡平表示:" 我们认为,群体智能才是通往通用人工智能的关键路径。因此,RockAI 以 Yan 架构打造群体智能单元大模型,不单是为了提升某个设备的能力,更是为机器注入一种新的、本质性的智能基因,使其拥有超强的环境适应力和自主学习能力。届时,每个部署了 Yan 模型的设备都将成为一个智能单元,通过它们的不断协同、交互,最终激发群体智能的涌现。"

智能单元 " 全家桶 ":多模加成,各显神通

活动现场,RockAI 团队展示了一款部署了 Yan1.3 大模型的 " 飞龙 " 无人机。

区别于大多数云、边、端协同控制的无人机,飞龙的智能大脑 Yan1.3 直接部署于设备端,对突发状况能做出即时判断和处理,无需先传回云端判定再回到设备端执行,大大提升无人机在复杂环境中的适应性和自主性,实现高度的自动化水平和快速反应能力。如与某厂商合作的无人机项目,便能解决设备将高清画面传回云端,所产生的 5G-A 流量成本高的痛点。

在实际应用方面,部署了 Yan1.3 的飞龙无人机,可全面感知复杂环境并在设备端实时处理,支持各类环境下的智能巡检,不仅高效适配电力巡检、安全监控、环境监测等城市治理及工业场景;更可面向个人用户,广泛运用于 AI 拍摄、外出旅游、山地越野等日常生活情景,贴心勘探环境、规划行程的同时,还能够解放双手,自动捕捉最佳角度并挑选出最佳照片。

此外,研发团队还演示了 Yan1.3 在更多端侧设备的广泛应用,比如此前惊艳亮相世界人工智能大会的 " 胖虎 " 智能机器人,能够基于 Yan1.3 的多模态处理能力,在离线状态下识别复杂环境、准确理解用户意图,并据此控制其机械躯体高效完成各类复杂任务,如展现 " 七步成诗 "" 咏春拳法 " 等。

又比如内嵌在 PC 端的迅兔智能助手,可以在离线模式下听懂 " 人话 "、看懂图片并快速搜图,精准完成 " 帮我录音并整理会议记录 "、" 把所有橘猫图片都删掉 " 等模糊指令,保护用户隐私安全的同时,真正让每个人享受到 AI 带来的便利。

RockAI 认为,真正的智能是不应受限的,因此,他们始终坚定地走在非 Transformer 架构、无损部署这条少有人走的路上。如今,未经压缩、裁剪的 Yan1.3 大模型在越来越多设备端展现出的丝滑适配和超强模力,正向行业证实 RockAI 技术路线的合理性,及其最终激发群体智能的充分可能。

在刘凡平看来,基于 Transfomer 架构的通用大模型,未来只有两到三家可能是成立的。但这样的 " 造神式 " 大模型未来解决问题的场景依然有限,相比较而言,以群体智能为目标的群体智能单元大模型更有意义。

锚定群体智能:为机器注入智能基因

顾名思义,群体智能主要指通过多个个体的协作和交互,形成的集体智慧和决策能力。无数智能个体通过协作和交流,可以创造出超越个体的能力,推动自然社会的进步,其多样性、适应性和创造力,是任何单一的大模型都无法完全实现的。

因此,在机器领域,群体智能同样是智能进化的关键,并提出了打造群体智能单元大模型的技术路线——以端侧设备为载体构建可高效适应环境并不断进化的智能单元,不同智能单元之间持续交互、协同和互补,激发更高水平的群体智能。

要想达成这个目标,首先就要为群体中的每个个体,寻求一个高效运转、能持续自主学习的模型大脑。然而当下大部分 Transformer 主流大模型受限于资源及算力,只能通过有损压缩等 " 性能阉割 " 的方式在端侧运行,尚且无法高效运转,更无法根据环境的变化进行自主学习,实现推理和训练的同步进行。

彼时,刘凡平就敏锐认识到,训推同步的目标是能在端侧上运行并做训练,这将是一个很大的进步。

" 我们希望更廉价的训练,而不是更昂贵的。训推同步可理解为模型的训练与推理同步进行,正如人一样,在聊天的时候可以通过语音输出推理,但同时也可以通过耳朵的听觉、眼睛的视觉作为输入进行实时学习。"

于是,RockAI 从对基础架构的突破创新出发研制模型大脑。1 月,国内首个非 Attention 机制的 Yan 架构应运而生,大大降低了模型的算力需求,并成功实现 Yan1.0 模型 "0 压缩 0 裁剪 " 的离线部署,迈出了走向群体智能的第一步。

随后,RockAI 更是迭代提速,3 月,类脑分区激活的工作机制实现;5 月初," 无损 " 跑通树莓派;5 月底,全模态部分视觉支持走通,再从 Yan1.2 进化到当前的 Yan1.3,可以在广泛的设备上部署和应用,得以开启了多元化的硬件生态。

正如会上浙江大学人工智能系主任杨洋教授所说,RockAI 给更多的设备厂商打开了一扇门,让他们能够进入 AI 领域。

多元化适配:打通商业化路径

在 RockAI 的规划中,群体智能的实现包括四个阶段:创新型基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。如果说自主架构的 Yan 模型是走向群体智能的开端,那么此次发布的 Yan1.3 群体智能单元大模型,显然已经快速实现了在多元化硬件设备上的适配。

其在端侧的无损推理基于两大核心技术创新,一是以底层神经网络架构 MCSD 替代 Transformer 的 Attention 机制,二是基于仿生神经元驱动的选择算法实现类脑分区激活,大大减少计算复杂度及算力消耗。

众所周知,Attention 机制是 Transformer 架构的核心,其加权算法决定了计算量会随着序列长度的增加呈增长,对计算的算力要求也会越来越高。而 RockAI 通过 MCSD 机制替换掉 Attention,只把最有效的信息、特征往后传,以线性的方式降低计算的复杂度,提升训练和推理效率。

同时,RockAI 借鉴了大脑分区激活的原理,由选择神经网络自己决定处理某个任务时参与运算的神经元,初始具有随机性,但通过大量数据学习、训练后会变得有迹可循。就像人类一样,随着一件事情做的越多,被激活的那部分神经元就会越确定,反应也就越快。此外,由于不是所有参数参与过程,从而算力需求很低,就可以使得训推同步进行,而且在输出时也能调整参数。

基于该算法实现的模型分区激活,不仅节省了算力成本,还可以通过共享神经元实现多模态的对齐。

经过对不同硬件的研究和大量调试,目前 RockAI 已经适配了英伟达、高通、联发科、英特尔、瑞芯微等平台,商业化进程也在不断加速。随着自主学习机制进入实验室测试阶段,RockAI 也与芯片厂商及终端厂商达成初步合作意向。

刘凡平希望,能与更多合作伙伴构建生态,让更多的设备用上 RockAI 的群体智能单元大模型。

这也就意味着,未来 RockAI 将突破硬件限制,打造越来越多基于 Yan 架构的智能单元,让世界上每一台设备拥有自己的智能,实现在广泛覆盖范围下的普惠人工智能应用。

未来,期待这些拥有不同能力、不同个性的智能单元得以协同,涌现更为宏大、多元的群体智能,最终实现个性化与群体智能的共融共生,开启人与机器的智能新时代。