手机厂商竞速大模型是噱头还是未来？-乐看中文网

在除了折叠屏之外硬件端难见十分明显的创新动向之后，软件层面的手机厂商竞赛正在开启。

上一轮软件层面的竞争，手机厂商竞相采用智能语音助手，其应用多少有些可有可无，不同于此，如今在AI大模型的驱动下，手机这个端侧载体被赋予了更为丰富的职能。

业界普遍认为，手机端侧与AI大模型能力融合后，未来将成为每个人的私人助手。

只是这背后需要庞大的计算资源和能力支撑，对端侧的设计、底层能力储备等，都提出很高要求。此外，AI大模型本身也在持续迭代发展，典型如“幻觉”问题无法忽视，其未来走向尚有进一步探讨空间。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围受访时坦言，AI大模型到今天还存在两大关键问题：逻辑思维链能力不强与出现幻觉。

对于逻辑能力的难题，周围指出，需要从理论层面进行建设和突破，vivo正在寻找科学家和行业解决方案；至于幻觉则需要从算法层面不断优化。

“首先要告诉大模型，你是专家级还是小白级的定义，这是下一代GPT需要解决的；第二需要告知大模型数据库的截止时间。我把这两个挑战都归因为如今大模型较大的缺陷。”他续称，但并不能因此就认为大模型一无是处，其依然是一个至少容纳了2.5个国家级图书馆藏书知识量的载体，假如认为现在自研大模型还是一个初中生，希望到一年后可以实现高中生甚至大学生的水平。

那么应用在手机端的大模型，在现阶段是噱头还是走向未来的起步阶段？AI大模型会成为新的换机动力源吗？

竞速大模型

无论国内外，AI浪潮涌动下，大模型到底该如何在硬件端被承载，都是当下核心要解决的问题。

先有谷歌Pixel 8用自研Tensor G3处理器，集成生成式AI等，交出一份AI手机的答卷；再有国内诸多手机厂商也将把旗下AI大模型融入到智能手机产品中。

11月1日，vivo发布蓝心大模型矩阵，包含覆盖十亿、百亿、千亿三个参数量级的五款vivo自研大模型。其中，10亿量级模型是主要面向端侧场景打造的专业文本大模型，具备本地化文本总结、摘要等能力；70亿模型是面向手机打造的端云两用模型，具有语言理解、文本创作能力；700亿模型是面向云端服务的主力模型，1300亿、1750亿模型也将在更复杂的场景提供智能服务。

据周围介绍，作为一款开源大模型，蓝心大模型并没有基于目前市面上的开源模型进行开发。根本原因在于，vivo团队曾基于开源模型做过微调，但最终发现部分问题无法协调匹配，比如涉及价值观问题等。因此最终选择从最原始的数据进行训练自研。2018年vivo成立人工智能图谱研究院，目前已积累13000T的多种模态数据及2800T高质量中文文本数据。

多名AI界人士都对记者表示，要做好大模型体验，优化“幻觉”问题，数据清洗是一道关键能力，但目前诸如搜索引擎中这类问题都仍需要仔细优化。

对此，周围告诉21世纪经济报道记者，这正是当下要解决的难题之一。“首先要做各种专业图谱建设，比如囊括法律判例和法规条文等，针对性做诸多专业垂类图谱建设，这需要联合合作伙伴完成。”

其次是针对没有完善图谱的方面，可以设置精细化搜索的提示给用户，亦或与搜索公司合作进行能力增强。

至于为什么选择以不同规模的大模型矩阵形式发布，原因在于当下算法还有提升空间的情况下，这会是更好的方案。

比如高净值用户会有极高的隐私保护诉求，本地端需要毫秒级别响应速度，这都是云端无法完成的，且如果完全采用云端的大模型，背后有着高昂的成本。“倘若vivo的3亿用户每天用10次模型，一年算下来有100亿左右的支出，成本非常高。”周围举例道。

据介绍，目前蓝心大模型的应用端口主要包括“蓝心小V”和以公版APP形式推出的自然语言对话机器人“蓝心千询”。

AI大模型的应用再进一步，将是以智能体形式呈现。据周围分析，第一阶段智能体大约需要一年左右时间。无论成熟到什么级别，至少会有产品原型。要具备感知、决策、执行能力，再加上很好的度量和奖励模型，相信整个正循环就能建立起来。

难题与未来

从此轮AIGC浪潮回溯，AI技术是在业界真正跑通了Transformer算法后，才在2021年出现智能涌现的能力。

这一方面意味着技术路线的选择可能出现偏差，另一方面也显示出大模型的发展过程依然曲折。对于集成度更高、功能本身就极为复杂的智能手机来说，更是如此。

“理论上说，大模型的参数量越大，其应用落地效果会更好，但参数量越大，在手机上跑通的概率会越低。”vivo AI解决方案中心总监谢伟钦介绍道，目前能够在手机端侧实现较好效果的能力，主要包括文本总结、摘要、图片生成、图片风格化等。因此选择先把相关能力放入端侧，用户无需上传文件和图片上云，即可实现想要的结果。

从目前vivo旗下的大模型矩阵来说，要运转一个10亿规模大模型至少需要1G内存、70亿模型需要4G内存，130亿目前需要超过7G。

“这对手机存储空间、耗电量等方面都带来很大的技术挑战。”谢伟钦续称，因此需要平衡。“相信到明年70亿或130亿大模型在端上跑起来时，可以慢慢成为智能体，即一个专属私人助理的状态。”

显然，7G内存基本已经接近中高端手机的标准，但同时也对手机性能带来了极大挤压。周围指出，目前来看，130亿规模大模型会是实现智能体能力更好的选择，因其可以更好对复杂的任务进行拆解；当前70亿模型在手机端侧对处理文档摘要等能力会有较好的呈现，但缺点是无法达到中台级别上下文理解的能力，也即无法完成多重复杂的任务。

这些都意味着，要真正迎接更为智能化的端侧手机体验，在当前看，还有诸多挑战要解决。

此外，也有业界人士对记者表示，也许在未来，Transformer算法未必是唯一走向AGI的路途。这也考验着厂商的综合研判能力。

周围对21世纪经济报道记者表示，vivo旗下有专门进行理论研究的算法团队，并跟进前沿进展，再转化成工程实践。

“Transformer算法和ChatGPT的形式，目前我们预判是最合理的路线。因此在这方面会全部投入。”他续称，基于此会从ChatGPT的形式，进一步优化大模型面临的难题。“2017年Transformer算法出现，在此之前的AI更多是基于小数据搭建模型，因此其能力有限，在Transformer之后，才真正可以压缩超大型存储数据。”

“所以算法层面需要持续改善，比如注意力相关算法等，需要逐步学习、调优。”周围表示，此外是备受关注的算力，在外部环境变化下，的确大模型训练会面临算力不够的问题。

智能手机普遍都将搭载自身体系下的AI大模型，这是否会成为新的换机驱动力？

对此周围认为，对于部分场景中，大模型仅仅是增强已有模块的能力部分，则属于锦上添花。但在未来，AI大模型将具备颠覆式能力，一定会改变人们对手机的定义。

“未来的智能体，一定能够成为个人助理的形式。”他续称，届时其将颠覆手机上的产品。

这需要从更长远的时间周期来看，当低至32M-200M主频+32G内存，就可以跑通一个系统并且具备大模型能力时，未来更多轻量化的设备，诸如摄像头、机器狗等都将具备智能表现。倘若再叠加脑机接口等新兴技术进一步成熟，将丰富交互形式，令更多轻量级设备都具备成为行政助理的能力。

从这个角度看，大模型将对手机市场带来颠覆性的改变。“从大模型带来巨大生产效率提升的角度看，我认为大模型是一个历史性、事件级的产物。当大模型做好后，也将必然获得更多高端用户的认可，所以我们也在高规格投入，来迎接人工智能世界的到来。”周围如此表示。

手机厂商竞速大模型,是噱头还是未来？

相关文章