当前消息！ChatGPT 大火，AI 语音助手似乎有救了？

2023-03-13 23:24:13 | 来源:天极网 |

继区块链、元宇宙之后，ChatGPT 突然之间也火了，近段时间以来，似乎每个行业都在聊 ChatGPT。于是，以 ChatGPT 为代表的生成式人工智能，再次席卷整个互联网行业，有学者更将其称之为 " 思维变革 "，认为它会在未来逐渐改变人类思考和处理问题的方式，甚至带来颠覆性的变革，并由此重塑整个世界。

什么是 ChatGPT？

【资料图】

ChatGPT ( Chat Generative Pre-Trained Transformer，聊天生成式预训练转换器 ) 是人工智能公司 OpenAI 开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成撰写邮件、文案、视频脚本、代码等一系列任务。

从功能性来看，ChatGPT 作为一款生成式人工智能工具，直接冲击的肯定是 " 搜索引擎 " 这类常用工具，其具备搜索引擎所不拥有的准确整合信息、高效产出内容等优势，能够大幅提高学习与办公的效率，发展到一定程度完全有可能会取代传统的搜索引擎。

基于它有庞大的数据库做支撑，并且能够迅速准确地给予用户反馈，这不禁让我联想到 AI 语音助手。从某种程度上来看，ChatGPT 与 AI 语音助手有着相似的地方，都是对话类型的聊天工具，区别在于唤醒方式，一种是文字，一种则是语音。

陷入尴尬困境的 AI 语音助手

如果你用过 AI 语音助手，那么你肯定会和我持一样的观点：" 它真的很难用 "。

纵观如今市面上的 AI 语音助手，主要有 Siri、小爱同学、小度、天猫精灵等这几款主流的 AI 语音助手，被用在手机、电脑、电视、音箱等多种电子产品上，也是串联起各种智能家居产品的中枢。但是，从用户的实际使用体验来说，它们确实不怎么样。

一方面，AI 语音助手的识别度不高。单从唤醒方式来说，有的语音助手呼叫几遍，它都没有反应，例如：苹果的语音助手 Siri，有时候需要连续呼叫几次，才会唤醒成功。而有的语音助手，时不时就自动被唤醒，例如：小米的语音助手小爱同学，半夜自动唤醒，可能还会自动播放音乐。

另一方面，它们依赖的数据库不够完善。通过语音进行提问，所提供的答案基本不准确，答非所问，甚至还会回复 " 我不知道 "、" 我不清楚 " 之类的话语。当然，这其中不排除有版权限制的因素，但其内在的逻辑自然是令人很费解的。

用户的使用体验不佳，自然也就逐渐失去了交互的兴趣。厂商也明白这一点，慢慢地将 AI 语音助手转向功能性的开发，通过简单的指令来简单控制智能家居，实现产品之间的联动，倒是有了新的成效，但也仅此而已，指令识别偶尔也会失误。

对比之下，我们不难发现，AI 语音助手的处境属实比较尴尬，完全处于半抛弃状态，没有多少用户会去使用它，与 ChatGPT 更是不可同日而语。那么，很多人可能会认为，既然 ChatGPT 如此强大，那是否会取代 AI 语音助手？

答案自然是否定的。在我看来，虽然两者存在一定的相似度，但 AI 语音助手与 ChatGPT 是两种不同形态，且发展方向的产品。AI 语音助手旨在帮助用户通过语音唤醒，获得更为便捷高效的功能需求，尤其是针对老人、孩子这种对于文字输入、触控交互有难度的特定用户，有着 ChatGPT 不能比拟的简单、易上手等特性。同时，ChatGPT 它是基于互联网而形成的聊天工具，存在于虚拟层面，无法像 AI 语音助手那样，跟现实的智能家居产生联动，自然也就不存在谁替代谁。

不过，ChatGPT 的出现，倒是为 AI 语音助手提供了一条全新的发展思路：我们是否能够采用 ChatGPT 的底层学习逻辑，完成对 AI 语音助手的优化，让其变得更加智能化？

ChatGPT 能否拯救 AI 语音助手？

根据相关实验室数据显示，用于训练 ChatGPT 的数据集至少包含 4990 亿个词语，覆盖了博客、书籍、新闻资讯、网站等海量内容。有了如此庞大的数据库支撑，ChatGPT 才能通过不断地学习，再结合人类的反馈微调，进而逐步提升答案的准确性。具体来看，主要分为以下四个步骤：

首先，AI 学习来自网络的文本数据，汇总相关有可能性的答案 ; 其次，AI 能够通过人工构建的问答数据微调模型，更准确地理解人类提问的意图 ; 再者，人工对 AI 生成的结果进行排序，训练其奖惩模型，使 AI 模仿人类评分标准给不同的答案进行打分 ; 最后，根据打分来更新参数，强化 AI 学习，训练 AI 得出高质量的答案。

在我看来，这种底层的学习逻辑，本质上还是一种学习与训练的过程。只不过，ChatGPT 仅需构建一个模型即可完成几乎所有内容的学习。它相比起那些面对不同的领域需要构建不同的模型，并且学习时间很长的 AI 来说，确实来得更加高效便捷。

所以，从 ChatGPT 底层的学习逻辑来看，它对于 AI 语音助手来说有着一定的借鉴意义。我们完全可以通过 ChatGPT 强大的自然语言理解和沟通能力，来改善如今极其不好用的 AI 语音助手。

其实，自从 ChatGPT 爆火之后，各大科技巨头均在生成式人工智能领域有所布局，其中不乏对于 AI 语音助手的尝试性优化。例如：2 月初，小度官宣 AI 语音助手小度未来将会融合百度文心一言的全面能力，打造针对智能设备场景的人工智能模型 " 小度灵机 "，并应用到小度全系产品。

由此来看，借助 ChatGPT 来优化 AI 语音助手的设想，其实具备较高的可行性。如果能够让 AI 语音助手达到 ChatGPT 的学习逻辑能力，那么现在被吐槽得一无是处的 AI 语音助手，将会成为用户日常生活或工作中，真正高效智能的助手，其用途的广泛性也会再一次得以彰显。

写在最后

ChatGPT 的诞生，很多人都忧心忡忡，认为它会让很多以内容创作为主的从业者面临失业的困局。即使是微软 CEO 纳德拉也认为，对于知识型工作者来说，这不亚于一场工业革命。

作为同样以内容创作为主的从业者，我觉得并不需要过分担忧。从它的内容选择上来看，ChatGPT 是从庞大的数据库中获取最优解，而并非人自由意志的选择，具备同质化的倾向，而这也不是社会发展所需。简而言之，以 ChatGPT 为代表的生成式人工智能缺乏人的创造性。

另一方面，ChatGPT 改变的只是人类思考和处理问题的方式，并未限制人的思维。所以，ChatGPT 并不会淘汰所谓的内容创作者，它只会淘汰不懂得利用工具的平庸者。毕竟，对于人类发展而言，创造性地提出问题远比如何回答好问题要来得更重要。

关键词：