周鸿祎谈“百模大战”:弯道超车的关键在发展多模态
2023-06-15 12:03:26 | 来源:时代周报 |
2023-06-15 12:03:26 | 来源:时代周报 |
本文来源:时代周报 作者:唐洛
(资料图片仅供参考)
" 作为搜索引擎厂商,我们发展大模型不该是等到 ChatGPT 火了才跟进。"6 月 13 日,在三六零(601360.SH,以下称 "360")智脑大模型发布会现场,创始人周鸿祎在谈到大模型行业时说道。
周鸿祎继续称,包括 360 在内的搜索引擎公司,都应该抽自己耳光,因为早在多年前就开始发展大模型,但只顾解决眼前问题,忙着做场景结合," 如果那个时候有员工提出要做通用型人工智能,我想无论是周总、李总还是马总,给出的答案都是:滚一边去。" 在他看来,应该感谢 OpenAI 的执着,给整个 AI 行业指明了正确的方向。
对于国内大模型和国际上的差距,周鸿祎也表达了信心。" 原先我曾说国内大模型和国际差距有一两年,现在我收回这句话,中国大模型的发展速度已经基本赶上国际先进水平,整体的基本水平已经赶上 GPT-3.5,追赶 GPT-4 的速度也超过自己的想象。"
周鸿祎提到,今年年初,在 ChatGPT 发布后,中国已经进入百模大战,各家企业都发布了自己的大模型产品,这三个月相当于人工智能行业过去的三十年。
在这场发布会上,周鸿祎把下半场的重点放在了 360 智脑大模型的多模态能力和应用场景上。360AI 数字人背后是 "360 智脑 4.0",提供多模态能力支撑。周鸿祎表示,GPT 时代中国自研大模型弯道超车的关键在于发展多模态。
国内首发 " 文生视频 " 多模态能力
当天,360 发布了旗下 "360 智脑大模型 " 的 4.0 版本。周鸿祎表示,4.0 版本有三个关键词:多模态、全端应用、数字人。
周鸿祎介绍,认知型通用大模型 "360 智脑 4.0" 具备生成与创作、多轮对话、代码能力、逻辑与推理、知识问答、阅读理解、文本分类、翻译、文本改写、多模态(文本生成图像)十大核心能力。这十大核心能力已通过中国信通院 " 可信 AIGC 大语言模型基础能力 " 评估。360 智脑是国内首个通过中国信通院该项权威评估的大模型产品。
"OpenAI 的 ChatGPT 最先体现出强大的文字生成能力,中国企业追赶 GPT 大模型的速度很快,目前各家企业在文字生成方面的能力已经实现国际领先。预计 GPT-5 全面支持多模态能力,中国自研大模型弯道超车的关键在于发展多模态能力。" 周鸿祎称,在多模态方面,360 已具备跨模态生成能力,包括文生文、文生图、文生表、图生图、图生文、视频理解等功能。
他进一步解释,多模态能力是给大模型增加上眼睛、耳朵、鼻子、嘴巴,而不仅仅只有大脑。下一步,360 计划将 360 智脑升级到 5.0 版本,并发布插件平台,安装上插件是要让它有手和脚的能力,这样大模型的能力才能发挥出来。" 当大语言模型有了多模态能力之后,它获得的知识就不仅仅来自于文字的知识,可以来自于图片,来自于视频。" 周鸿祎说。
值得注意的是,360 此次还发布了 " 文生视频 " 的功能,可以使用任何文字脚本生成视频,这也是国内大模型厂商首次发布此类功能。周鸿祎在现场实时演示了 360 智脑是如何做出一段 " 无中生有 " 的视频,他用文字指令要求 360 智脑生成熊猫划船、企鹅在沙漠中洗澡的视频,就在几秒之后,就生成了一段颇为真实的视频。
AI 数字人也是 360 本次重点发布的新产品。在发布会现场,周鸿祎与诸葛亮、孙悟空、马斯克等数字人开展实时对话问答。
其中,周鸿祎询问了 " 马斯克 " 关于 " 中国电动车产业是否对你构成威胁 "、" 如何评价推特公司 "" 火箭发射失败,对你是否是重大打击 " 等问题。
目前,360 的 AI 数字人拥有 200 多个角色,分为数字名人和数字员工两类。数字名人包括历史人物、偶像明星、文学形象等,让用户在与数字人的开放对话中实现与偶像的近距离接触,与先贤的思想交流。数字员工则可成为企业员的知识助和办公助手,提升企业运营效能。
此外,AI 数字人还支持定制,生成自己的专属数字人。周鸿祎在现场创建了自己的数字人,作为 360 的发言人," 说对了算我的,说错了算他的。"
在周鸿祎看来,在未来的人工智能大模型的应用环节,数字人将成为人机对话的全新入口," 区别于传统数字人只能按既定脚本输出内容,360AI 数字人的特点在于有记忆、有人设和性格,能够复刻思维方式和人生经历,是有灵魂的数字人。"
" 我希望有一天当我要讨论一个新产品的时候,我能跟马斯克、乔布斯、诸葛亮的数字人坐在一起,让大家对我的产品提一些建议。设想一下,如果有多个数字人,有不同的人设,不同的经历,背后都是人工智能在驱动,让他们一起来帮你做脑力激荡,一起来跟你完成共同的目标。" 周鸿祎觉得,这是智脑一个更大的提升,也是 360 提出的 "one more thing"。
" 百模大战 "
当下,人工智能领域鲜花着锦,诸多大模型争相问世,如京东 chatJD 大模型、百度文心大模型、阿里通义大模型等。科技部新一代人工智能发展研究中心日前发布的《中国人工智能大模型地图研究报告》显示,中国 10 亿参数规模以上的大模型已发布 79 个。
但各家都有自己擅长的领域,成熟的业务矩阵,且都是先拿自家的业务当做 " 试金石 ",呈现的结果自然不同。比如阿里云将通义千问接入办公软件 " 钉钉 ",可自动生成群聊摘要、辅助内容创作、总结会议纪要;百度的文心一言,将 B 端 " 生态圈 " 作为宣传和业务重点;华为云盘古大模型提出了 "AI for Industries" 理念。
360 智脑则是融合多模态能力,试图做出一个真正的 AI 数字人。周鸿祎认为,多模态是 360 智脑在 " 百模大战 " 中突围的重要路径。
在他看来,百度、腾讯、头条、阿里、360 都会在自己的固有场景里把自己的 AI 能力赋能。接下来真正比拼的是应用落地的能力,要思考如何让个人和企业更方便、简单地使用 AI 大模型应用。" 大模型的价值不仅仅在于互联网场景,而是把大模型能力通用化、泛化、垂直化,和不同行业、不同企业具体的业务需求深度地融合。这样的产业机会实际上才刚刚开始,未来至少有 10 年的红利时期。" 周鸿祎说。
目前,360 智脑 4.0 版本已接入 360 全端产品,包括搜索、360 浏览器、360 安全卫士等。随着大模型开放内测、应用场景的逐步落地,AI 赋能的或许远不只是产品本身。
" 人工智能的理念还是应该以人为本。我们无论做出多么强大的人工智能,都是在为人类做有史以来最好的工具。通过工具的赋能,让个人、公司、机构都能真正地提高劳动生产率。" 周鸿祎觉得,大模型应该成为人类的朋友和助手。
关键词: