当前消息!ChatGPT 大火,AI 语音助手似乎有救了?
2023-03-13 23:24:13 | 来源:天极网 |
2023-03-13 23:24:13 | 来源:天极网 |
继区块链、元宇宙之后,ChatGPT 突然之间也火了,近段时间以来,似乎每个行业都在聊 ChatGPT。于是,以 ChatGPT 为代表的生成式人工智能,再次席卷整个互联网行业,有学者更将其称之为 " 思维变革 ",认为它会在未来逐渐改变人类思考和处理问题的方式,甚至带来颠覆性的变革,并由此重塑整个世界。
什么是 ChatGPT?
【资料图】
ChatGPT ( Chat Generative Pre-Trained Transformer,聊天生成式预训练转换器 ) 是人工智能公司 OpenAI 开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成撰写邮件、文案、视频脚本、代码等一系列任务。
从功能性来看,ChatGPT 作为一款生成式人工智能工具,直接冲击的肯定是 " 搜索引擎 " 这类常用工具,其具备搜索引擎所不拥有的准确整合信息、高效产出内容等优势,能够大幅提高学习与办公的效率,发展到一定程度完全有可能会取代传统的搜索引擎。
基于它有庞大的数据库做支撑,并且能够迅速准确地给予用户反馈,这不禁让我联想到 AI 语音助手。从某种程度上来看,ChatGPT 与 AI 语音助手有着相似的地方,都是对话类型的聊天工具,区别在于唤醒方式,一种是文字,一种则是语音。
陷入尴尬困境的 AI 语音助手
如果你用过 AI 语音助手,那么你肯定会和我持一样的观点:" 它真的很难用 "。
纵观如今市面上的 AI 语音助手,主要有 Siri、小爱同学、小度、天猫精灵等这几款主流的 AI 语音助手,被用在手机、电脑、电视、音箱等多种电子产品上,也是串联起各种智能家居产品的中枢。但是,从用户的实际使用体验来说,它们确实不怎么样。
一方面,AI 语音助手的识别度不高。单从唤醒方式来说,有的语音助手呼叫几遍,它都没有反应,例如:苹果的语音助手 Siri,有时候需要连续呼叫几次,才会唤醒成功。而有的语音助手,时不时就自动被唤醒,例如:小米的语音助手小爱同学,半夜自动唤醒,可能还会自动播放音乐。
另一方面,它们依赖的数据库不够完善。通过语音进行提问,所提供的答案基本不准确,答非所问,甚至还会回复 " 我不知道 "、" 我不清楚 " 之类的话语。当然,这其中不排除有版权限制的因素,但其内在的逻辑自然是令人很费解的。
用户的使用体验不佳,自然也就逐渐失去了交互的兴趣。厂商也明白这一点,慢慢地将 AI 语音助手转向功能性的开发,通过简单的指令来简单控制智能家居,实现产品之间的联动,倒是有了新的成效,但也仅此而已,指令识别偶尔也会失误。
对比之下,我们不难发现,AI 语音助手的处境属实比较尴尬,完全处于半抛弃状态,没有多少用户会去使用它,与 ChatGPT 更是不可同日而语。那么,很多人可能会认为,既然 ChatGPT 如此强大,那是否会取代 AI 语音助手?
答案自然是否定的。在我看来,虽然两者存在一定的相似度,但 AI 语音助手与 ChatGPT 是两种不同形态,且发展方向的产品。AI 语音助手旨在帮助用户通过语音唤醒,获得更为便捷高效的功能需求,尤其是针对老人、孩子这种对于文字输入、触控交互有难度的特定用户,有着 ChatGPT 不能比拟的简单、易上手等特性。同时,ChatGPT 它是基于互联网而形成的聊天工具,存在于虚拟层面,无法像 AI 语音助手那样,跟现实的智能家居产生联动,自然也就不存在谁替代谁。
不过,ChatGPT 的出现,倒是为 AI 语音助手提供了一条全新的发展思路:我们是否能够采用 ChatGPT 的底层学习逻辑,完成对 AI 语音助手的优化,让其变得更加智能化?
ChatGPT 能否拯救 AI 语音助手?
根据相关实验室数据显示,用于训练 ChatGPT 的数据集至少包含 4990 亿个词语,覆盖了博客、书籍、新闻资讯、网站等海量内容。有了如此庞大的数据库支撑,ChatGPT 才能通过不断地学习,再结合人类的反馈微调,进而逐步提升答案的准确性。具体来看,主要分为以下四个步骤:
首先,AI 学习来自网络的文本数据,汇总相关有可能性的答案 ; 其次,AI 能够通过人工构建的问答数据微调模型,更准确地理解人类提问的意图 ; 再者,人工对 AI 生成的结果进行排序,训练其奖惩模型,使 AI 模仿人类评分标准给不同的答案进行打分 ; 最后,根据打分来更新参数,强化 AI 学习,训练 AI 得出高质量的答案。
在我看来,这种底层的学习逻辑,本质上还是一种学习与训练的过程。只不过,ChatGPT 仅需构建一个模型即可完成几乎所有内容的学习。它相比起那些面对不同的领域需要构建不同的模型,并且学习时间很长的 AI 来说,确实来得更加高效便捷。
所以,从 ChatGPT 底层的学习逻辑来看,它对于 AI 语音助手来说有着一定的借鉴意义。我们完全可以通过 ChatGPT 强大的自然语言理解和沟通能力,来改善如今极其不好用的 AI 语音助手。
其实,自从 ChatGPT 爆火之后,各大科技巨头均在生成式人工智能领域有所布局,其中不乏对于 AI 语音助手的尝试性优化。例如:2 月初,小度官宣 AI 语音助手小度未来将会融合百度文心一言的全面能力,打造针对智能设备场景的人工智能模型 " 小度灵机 ",并应用到小度全系产品。
由此来看,借助 ChatGPT 来优化 AI 语音助手的设想,其实具备较高的可行性。如果能够让 AI 语音助手达到 ChatGPT 的学习逻辑能力,那么现在被吐槽得一无是处的 AI 语音助手,将会成为用户日常生活或工作中,真正高效智能的助手,其用途的广泛性也会再一次得以彰显。
写在最后
ChatGPT 的诞生,很多人都忧心忡忡,认为它会让很多以内容创作为主的从业者面临失业的困局。即使是微软 CEO 纳德拉也认为,对于知识型工作者来说,这不亚于一场工业革命。
作为同样以内容创作为主的从业者,我觉得并不需要过分担忧。从它的内容选择上来看,ChatGPT 是从庞大的数据库中获取最优解,而并非人自由意志的选择,具备同质化的倾向,而这也不是社会发展所需。简而言之,以 ChatGPT 为代表的生成式人工智能缺乏人的创造性。
另一方面,ChatGPT 改变的只是人类思考和处理问题的方式,并未限制人的思维。所以,ChatGPT 并不会淘汰所谓的内容创作者,它只会淘汰不懂得利用工具的平庸者。毕竟,对于人类发展而言,创造性地提出问题远比如何回答好问题要来得更重要。
关键词: