AI 也要被管起来了
2023-04-13 06:05:09 | 来源:地球知识局 |
2023-04-13 06:05:09 | 来源:地球知识局 |
以下文章来源于非凡油条 ,作者小白菜
重要通知
一个好消息,我们在知识星球开辟了第二战场【非凡油条】,有很多在公众号不方便说的东西、一些相对私密的个人见解(涉及经济、投资等)、一些财经方面的重要资料,我们都会发在知识星球的非凡油条专栏上,供大家学习交流。
【资料图】
此外,我们也会在知识星球【非凡油条】不定时开设一些重要的自学课程,比如下周即将开始的 AI 办公工具学习课程。
具体的加入方式,以及更详细的介绍在文末二维码,大家可以到文末查看。
2023 年春季,ChatGPT 无疑是整个互联网世界的 " 顶流 ",其惊人的语言对话能力给 AI 领域带来的冲击更甚于七年前与世界冠军李世石对战围棋的 AlphaGo。3 月下旬,OpenAI 宣布 ChatGPT 接入第三方插件,这意味着它开始从聊天机器人蜕变成开发者平台。国外的 AI 技术不断迭代,国内各大巨头虽有布局,却仍有差距。同时,热度之外,ChatGPT 也因其安全隐患遭多方禁用,人们对新技术的狂热追逐还未退潮,对 AI 可能引发的各种风险的担忧却持续升级。
ChatGPT 火遍全网,却因其缺陷备受质疑
功能单一、数据过时
2022 年 11 月 30 日,美国硅谷初创公司人工智能研究实验室 OpenAI 发布了 ChatGPT(全称为 "Chat Generative Pre-trained Transformer")并开放试用。
短短几天,就吸引了超过 100 万用户注册,仅仅过了 2 个月,月活跃用户就已经过亿,打破了此前 Tik Tok 用九个月时间将用户数累计到 1 亿的速度。
互联网上对 ChatGPT 的讨论热火朝天。无论是传统的 NLP(自然语言处理)任务,如抽取、分类,还是写代码、作诗等,ChatGPT 都可以通过多轮对话的方式给出流畅的结果。
热烈的讨论声中,很多人惊呼:"《流浪地球 2》里那个不断自我学习,最终演化出自主思维的‘ MOSS ’,或许离我们已经不远。"
人工智能现有的基本模型是以逻辑推理为核心的符号主义 AI、以数据驱动为核心的连接主义 AI(深度学习)、以反馈控制为核心的行为主义 AI(强化学习)。而 Chat-GPT 正是对现有人工智能方法和技术的创新性整合。
在 " 数据是燃料、模型是引擎、算力是加速器 " 的驱动下,以深度学习为核心的人工智能正犹如水和电一样赋能人类社会。
ChatGPT 恰如其分地体现了 " 数据、模型和算力 " 的特点:ChatGPT 的训练使用了 45TB 的数据、近 1 万亿个单词(大概是 1351 万本牛津词典所包含的单词数量);使用了深度神经网络、自监督学习、强化学习和提示学习等人工智能模型。
训练 ChatGPT 所耗费的算力大概是 3640 PetaFLOPs/ 天,即用每秒能够运算 1000 万亿次的算力对模型进行训练,需要 3640 天才能完成。
在大数据、大模型和大算力的工程性结合下,ChatGPT 展现出强大的统计关联能力,可洞悉海量数据中单词 - 单词、句子 - 句子等之间的关联性,体现了语言对话的能力。
因此,在不少计算机领域业内人士看来,ChatGPT 的横空出世,给 AI 领域带来的冲击,更甚于七年前的 AlphaGo 战胜围棋世界冠军、职业九段棋手李世石的那场围棋人机大战。
不过,在 3 月之前," 顶流 "ChatGPT 仍然因为一些缺陷和限制而受到质疑:
首先,此阶段的 ChatGPT 本质上更像是一个基于语义模型和预训练的聊天机器人,功能比较单一。
其次,其数据库只更新至 2021 年 9 月,它所具备的参数和数据都是过去的数据,这些数据难以被更新,意味着我们无法通过它获得新闻或最新的数据。
这也是为什么一旦用户提出的问题涉及到该时间点以后的内容,ChatGPT 不是回复 " 不支持 ",就是直接向用户返回编造的错误信息。
第三,ChatGPT 并不具备 " 记忆功能 " 和 " 理解功能 ",这意味着你先前所询问的一些问题,GPT 无法记住,当你重复询问同样一个问题,会获得截然不同的甚至是随机的答案,因为它不 " 理解 " 你的问题。
最后,ChatGPT 会生成甚至伪造许多的参考文献、不存在的网址或者生成大量 " 不负责任 " 甚至极其随机的回答。
比如,随着全球的用户参与训练,很多种族主义的词汇或者是一些奇怪的异国概念进入数据库中,当这些对话被作为参数参与训练 AI 很可能得到完全无法理解的结果。
ChatGPT 接入插件,不再只能 "Chat"
聊天机器人变开发者平台
面对数据过时、功能单一、随机性回答等缺陷,OpenAI 终于要做出改变了。
当地时间 3 月 23 日,OpenAI 宣布 ChatGPT 能够支持第三方插件接入,这些插件是专门为 " 以安全为核心原则的语言模型设计的工具 ",可帮助 ChatGPT 访问最新信息、运行计算或使用第三方服务。
本次接入的插件包含两大类:
ChatGPT 直接从互联网上实时获取内容之后,在体验上已经与微软的 New Bing 不相上下。
其次是来自其他公司的第三方插件,首批参与插件创建的厂商包括 Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram 和 Zapier。
除了联网,这些插件使得 ChatGPT 能连接到第三方应用程序,之后 ChatGPT 便能够与开发人员定义的 API 进行交互,从而增强 ChatGPT 的功能并允许其执行范围广泛的操作:
举例来看,上述名单中,Wolfram 开发的 Wolfram Alpha 是一套十分强大的科学问答系统,其数据来自各大学术网站、出版刊物与科学机构,用户可以从 ChatGPT 中选择并安装 Wolfram 插件,从而提高其计算智能。
Open Table 插件允许聊天机器人搜索可预订餐厅;Instacart 插件允许 ChatGPT 在本地商店购物;Zapier 可以与谷歌表格、Trello 和 Gmail 等应用程序连接,适用于办公场景。
为了促进新插件的创建,OpenAI 已经开源了知识库检索插件的代码,开发者可以在其中创建并分享自己的插件,以造福用户。
如果说 ChatGPT 是人工智能的 iPhone 时刻,那么加入了第三方插件,就是 ChatGPT 的 App Store 时刻了。
这使得 ChatGPT 不再只是一个聊天机器人,而成为一个开发者平台,从而进一步巩固其主导地位。
在商业层面,先前单纯的 AI 聊天机器人其实并没有太大的盈利想象空间,毕竟如今大众对于 ChatGPT 的热衷主要是新鲜感在驱动,单纯靠 ChatGPT Plus 这一付费订阅无法负担其惊人的算力成本。
但当 ChatGPT 实现接入第三方插件之后,相当于是 Chrome 有了 Chrome 应用商店,从而有了更广阔的盈利空间。
目前,OpenAI 优先考虑少数开发者以及 ChatGPT Plus 的付费用户能够使用测试版插件,未来会更大规模地向更多用户开放。
值得注意的是,ChatGPT 的联网可能也会带来一些风险:联网之后它可能会执行恶意指令,例如发送欺诈性和垃圾邮件、绕过安全限制误导用户或滥用他人信息。
不过 OpenAI 表示,已经在内部和外部实施多项保障措施以防止上述情况发生。他们仍在不断学习,希望能打造出既有用又安全的 AI。
巨头们纷纷出手,中国 GPT 时刻来临
"BAT",华为,京东都在布局
美国的 ChatGPT 不断迭代进化,压力给到中国的大厂这边。
当 ChatGPT 横扫中国舆论场时,国人无比期盼自己人能开发出同类产品,并与之同台竞技。而过去 10 年在 AI 领域投入超过 1100 亿元研发费用的百度,自然成为被关注的对象。
在外界的翘首以盼中,文心一言的新闻发布会如期而至。
3 月 16 日下午,百度开启新一代大语言模型、生成式 AI 产品文心一言测试,从而成为第一家加入该赛道竞争的中国企业。
在发布会现场,百度创始人、董事长兼首席执行官李彦宏通过问答的形式,展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个使用场景。
除了百度推出中国版 ChatGPT,腾讯、阿里、华为、京东等巨头都有布局大模型的研发,而且也有相应的产品推出。
2022 年 4 月,腾讯对外披露混元大模型。
今年 3 月 22 日,腾讯科技发布 2022 年年度报告,表示在 AI 大模型(预训练大模型)领域,腾讯混元 AI 大模型覆盖 NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业与领域模型,未来腾讯将继续投入大模型技术以促进产品创新及运营效率。
阿里也不甘落后,2022 年 9 月,阿里发布通义大模型系列。
同年 11 月,阿里推出 AI 开源社区 " 魔搭 "(ModelScope),旨在打造下一代开源的模型即服务共享平台,致力降低 AI 应用门槛。
2023 年 3 月,阿里在 " 魔搭 " 上线了 " 文本到视频生成扩散模型 ",只需要在该模型中输入文本,即可返回符合文本描述的视频,并且该模型能够基于文本描述进行推理,。
据官方介绍,该整体模型参数约 17 亿,目前仅支持英文输入。
华为的盘古系列也深受市场关注。
据悉,华为在 2020 年就开始布局大模型,2021 年 4 月的华为开发者大会 2021(Cloud)上,华为云便发布了盘古系列超大规模预训练模型,其中鹏城盘古大模型是业界当时首个千亿级生成和理解中文自然语言处理大模型。
在产业化方面,华为已发起了智能遥感开源生态联合体、多模态人工智能产业联合体,智能流体力学产业联合体等。
2 月 10 日,京东云旗下言犀人工智能应用平台宣布将整合过往产业实践和技术积累,推出产业版 ChatGPT:ChatJD,其参数量预计为千亿级别,并公布了 ChatJD 的落地应用路线图 "125" 计划。
"125" 计划包含一个平台、两个领域(零售和金融)、五个应用(内容生成、人机对话、用户意图理解、信息抽取、情感分类)。
国内大厂纷纷官宣各自国产版 ChatGPT 的规划及进度,人工智能产业的发展看起来一片繁荣,但我们不得不承认的是:迄今为止,国内尚未有任何一家公司或者科研机构能够做出与 ChatGPT 同等效果的成果。
俗话说,万事开头难。从乐观的角度看,国内 GPT 百家争鸣的现状总还是一个好兆头,这预示着一个正在进步的人工智能市场。只有不断优化产品和完善技术,推进行业内的合作和交流,才能够推动人工智能技术的发展和普及,更好地满足用户的需求和创新。
多次涉嫌泄密,ChatGPT 遭多方禁用
该何去何从?
ChatGPT 的风险远不止联网带来的执行恶意指令风险,更重要的是安全隐患。
前不久,据 SBS 等韩媒报道:三星刚引入 ChatGPT 还不到 20 天,就发生了 3 起机密数据泄漏事件,涉及三星半导体设备测量资料、产品良率等信息。
实际上,最初三星因担心内部机密外泄,一直禁止员工在工作中使用 ChatGPT。
然而,随着 ChatGPT 进入各个企业的步伐加速,越来越多员工认为技术需要迭代变化,加之半导体本身就是构建 " 生成式 AI" 的核心要素,于是三星决定:3 月 11 日起,半导体设备解决方案(DS)部门可开始使用 ChatGPT。
一般来说,企业在引入新技术时,都会对员工进行相关的培训和教育,让员工了解新技术的使用方法和注意事项,避免因为员工的不当操作而导致机密泄漏等安全问题。所以,三星向员工发出了提醒:" 注意公司内部信息安全,不要输入私人内容。"
但现实是,三星刚允许员工使用 ChatGPT 不到 20 天,已掌握到的数据泄露事件就有 3 起—— 2 起设备信息泄露和 1 起会议内容泄露。
此外,Cyberhaven 的一项统计结果告诉我们,ChatGPT 提高工作效率是真的,但它会把对话内容作为训练数据也是真的。
近 160 万名打工人中,有 8.2% 的员工在工作场所使用过它——许多人称,因为使用 ChatGPT,他们的工作效率 " 提高了 10 倍 "。同时,有 6.5% 的员工表示会将公司数据复制到 ChatGPT 中,更有 3.1% 的员工表示曾将公司的机密数据放入 ChatGPT。
与之相对应的,越来越多企业因担心机密数据外泄,禁止员工访问 ChatGPT。
除了上文的三星,还有摩根大通、美国银行、花旗集团、高盛、德意志银行等。近期,软银也向全体员工通报了禁止向 Chat-GPT 输入机密信息等注意事项。
除了会把对话内容作为训练数据,从而泄露企业机密,ChatGPT 还曾泄露用户隐私。
3 月 20 日,多名 ChatGPT 用户表示在自己的历史对话中看到了他人的对话记录。还有不少 ChatGPT Plus 用户在 Reddit 和 Twitter 等平台发出截图,表示在他们的订阅页面上看到了其他人的电子邮件地址。
3 月 25 日,OpenAI 发布声明承认,由于开源代码库中存在一个漏洞,部分用户能够看到另一个用户的聊天标题记录,此前已将 ChatGPT 短暂下线并紧急修补此漏洞。
此外,OpenAI 表示,在特定的 9 小时窗口期内,1.2% 的付费版用户的个人支付信息可能被泄露。部分用户可能会看到另一名活跃用户的姓名、电邮、支付地址、信用卡后 4 码、信用卡到期时间等信息。
为此,意大利个人数据保护局 ( DPA ) 以 " 非法收集个人资料;未成年人年龄核实系统缺失 " 之名宣布禁用 ChatGPT。DPA 声称,对 ChatGPT 可能侵犯隐私以及未能按要求验证用户年龄为 13 岁或以上表示担忧,并将开始立案调查。
这成为第一起政府禁止使用聊天机器人的案例。
海量数据的积累确实可以带来人工智能的生产力质变,同时,从互联网诞生起就始终萦绕左右的数据安全、隐私保护等问题,也成为了人工智能大模型无法回避的伴生难题。
如何确保数据授权、界定数据安全的责任与科技公司的义务,规避隐私泄露、知识产权等风险,这些都将是人工智能在大规模介入公共领域后,必须首先解决的问题。
在全球大赛跑的背景下,既要提前设定红线和规则以保护公民数据安全,同时,又要防止监管过度带来的创新不足问题,这是各国共同面对的政策难题,只有找到两者之间的平衡,才能既能享受新技术发展带来的便利,又能保护信息安全。
于是昨天国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见,其中就提到了提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗。
AI 还是要 " 管 " 起来。
在知识星球【非凡油条】里,你可以获得的:
1
重大财经新闻的分析,主要针对它对我们普通人的影响,以及可能的对 A 股大盘形势的影响。
2
免费提问,随时可以向我提出财经或是生活上的问题,在不涉个人隐私的情况下我尽量解答。
一些公众号上不方便谈的话题,都会在知识星球里发布。
3
财经方面的资料分享,比如行业研报,相关论文,都会发在里面。
4
不定时开设一些自学课程,比如下周开始的 AI 办公工具学习课程,我会带着大家一起学习前沿新知识,提高工作能力
" 非凡油条 " 目前年费为 100 元,非常优惠,以后会逐渐提价。这个价钱很值,能让你避免几十倍、几百倍的损失。
关键词: