主页 > 数码 > 正文

全球头条：经济观察：人工智能狂飙厦企发力AI安全

2023-06-07 19:41:21 | 来源:厦门日报 |

鉴伪“深度合成”内容

快商通与美亚柏科、华侨大学联合申报的“基于深度学习的可信多媒体鉴定关键技术研究及其产业化应用”课题入选厦门市重大科技项目，这一项目就是对“深度合成”内容进行鉴别，判断多媒体内容是否属于伪造。

研究反生成式AI

(相关资料图)

美亚柏科正对包括反生成式AI在内的AI安全及监管领域进行研究，并根据业务需要布局相关产品。

推出声音克隆服务引入智能检测算法

复刻你的声音还能加“防伪码”

最近，“AI孙燕姿”成了新“顶流”，其通过AI训练，可以用歌手孙燕姿的声音演唱任何你想听到的歌曲，有网友感慨“真假难辨”。

事实上，“AI孙燕姿”背后的声音克隆技术并非新生事物，其应用已涉及娱乐、教育等多个领域。在我市，已有人工智能企业探索声音克隆的应用场景，还有的研究鉴伪技术，防止技术滥用。

声音克隆已用于多种场景

厦门大学信息学院副教授洪青阳说，声音克隆可用在电影配音、有声书、播客等领域，“人们可以根据自己喜好，选择某个已获授权的声音来演绎。再比如，可以克隆已故亲人的声音，让记忆永存。

不久前，厦企云知芯的母公司云知声就上线了“声音克隆”服务。据云知声介绍，其“声音克隆”可全面学习用户的音色和风格，仅需用户二十句左右的原始录音，就可以合成贴近真人的数字声音，且能做到“朗读的语气、语调、情感堪比真人”。

在具体的应用中，云知声方面描绘了几个场景:智能语音音箱中传来儿女的声音，提醒年迈的父母注意天气变化；儿童点读机里生硬的机械音被妈妈轻柔的呢喃所取代……

厦企快商通也将声音克隆技术应用于其研发的数字人软件中。“用户只需提供一段3~5分钟有真人出镜、包含人声的视频，通过我们的软件，就可以根据需求，自动生成一段全新的视频，这个数字人的声音跟真人几乎一模一样。”快商通联合创始人李稀敏说。

用AI反制AI 防止滥用

AI虚拟歌手的风靡，引发人们对声音安全问题的担忧:用AI技术模拟声音进行诈骗的违法行为屡见不鲜，我们如何识别出原版和翻版的声音？

技术产生的问题，当然也能通过技术来解决。去年底，快商通与美亚柏科、华侨大学联合申报的“基于深度学习的可信多媒体鉴定关键技术研究及其产业化应用”课题入选厦门市重大科技项目，这一项目就是对“深度合成”内容进行鉴别，判断多媒体内容是否属于伪造。

与此同时，快商通在其自主研发的数字人、声音复刻等AIGC（生成式AI）技术中，也引入独特的智能检测算法，用于AIGC内容的追踪溯源。李稀敏说:“我们在视频或者音频中隐藏了一个信道，这里头传输的信息有独特的标识，相当于身份名片。退一步说，哪怕信息丢失了，我们也能通过算法检测出声音真伪。”

“任何技术都具有两面性，AIGC在赋能产业数字化进程方面大有作为，但也极其容易被犯罪分子滥用。因此，发展AIGC的同时，也需要持续深化可信技术。”李稀敏说。

【解密】

训练一位AI歌手 仅需三步

任何曲风都能驾驭，且没有违和感，“AI孙燕姿”是怎么炼成的？

厦门大学信息学院副教授洪青阳告诉记者，以“AI孙燕姿”为代表的AI虚拟歌手，由语音转换（Voice Conversion）技术打造，属于声音克隆的一种。所谓语音转换，简单理解，就是把A的音色转换成B的音色，与此同时，保留A说话或唱歌的内容以及语气、语调等细节。

洪青阳说，训练AI歌手的过程大致分为三步，以“AI孙燕姿”翻唱周杰伦的《发如雪》为例:先用专门的音频软件，把《发如雪》的伴奏和周杰伦的人声分离；再用处理好的孙燕姿的干声（去噪的无音乐纯人声）数据，向机器“投喂”，训练出一个具备孙燕姿音色的声学模型；最后用这一模型对《发如雪》歌曲文件进行音色转换，最终得到“AI孙燕姿”翻唱的《发如雪》。

“完成语音转换的前提是，需具备所模仿对象B的目标音频，所以它并不是无中生有的。”洪青阳说，除了语音转换以外，声音克隆还包括个性化语音合成技术（TTS），可以实现文本转语音，其优点是不需要被模仿对象B说过同样的话，内容定制更自由，比如，“写一首全新的歌让AI演唱，但这种情况下，因为没有‘依葫芦画瓢’的目标音频，AI唱得可能像孙燕姿的音色，但不像周杰伦的唱法。”

【记者手记】

眼见 不一定为实

耳听 也可能为虚

今年以来，AI频频出圈，除了技术更新迭代快以外，还有一个重要原因是，AIGC（生成式AI）使创作门槛降低了。正如福建省人工智能协会会长陆阳所言，当AI从感知智能走向认知智能，极大提升了个人用户的生产力，“人们可以不断地生产图像、视频、音频……未来，人人都可以是AI创作家。”

不过，AIGC仍处于发展的早期阶段，其相关法律法规、标准体系等尚不健全。有法律人士提醒，站在被翻唱歌曲权利人的角度，AI歌手存在侵权问题。当我们利用AI工具生产内容的同时，得紧绷知识产权这根弦。与此同时，我们也应提高防骗意识，毕竟，在AI狂飙的时代，眼见不一定为实，耳听也可能为虚。

大模型广泛应用赋能近百个大数据项目

“最强大脑”直面算力难题

昨日，苹果发布首款混合现实（MR）头戴式设备Apple Vision Pro（简称“苹果头显”），继ChatGPT之后，再次引发大家对人工智能的广泛关注。今年以来，我市多家电子信息企业紧跟行业趋势，纷纷涉足脑机接口、大模型等人工智能新领域。

根据发布会介绍，苹果头显将聚焦游戏、工作、交流，这款设备将把世界带入“空间计算”。除了硬件之外，算力也是其发挥作用的一个重要支撑。

值得一提的是，随着AI技术不断升级，其安全也愈发受到重视，美亚柏科正对包括反生成式AI在内的AI安全及监管领域进行研究，并根据业务需要布局相关产品。

算力支撑

依托超算平台 推动大模型应用

在ChatGPT之后，基于各自算力，国内行业“大咖”百度、腾讯、阿里、华为等先后发布大模型。前不久，云知声山海大模型也在北京发布，展示了其在语言、逻辑、数学等领域的十大核心能力。这一大模型的背后，正是依托东南区域最强超算平台——厦门Atlas智算中心提供的高效稳定算力，近200P算力支撑千亿规模的模型训练，在两个月内完成。

云知声东南总部总经理陆阳向记者透露，为了满足山海大模型的需求，他们在厦门Atlas智算平台和DCML模型工厂基础上，扩充算力，攻关工程优化和数据优选。这期间，厦门区域完成了算力扩容、算法验证、并行加速、数据优选等，实现GPT为核心的架构升级。

另一家厦企美亚柏科的MYAI大模型目前在顺利推进，日前，其相关负责人透露，大模型已在公共安全、政务、税务、企业数字化转型等多个领域的近百个大数据项目建设中，得到广泛应用。美亚柏科建设的厦门市超级计算中心，截至目前有1000多台服务器，算力达1966万亿次/秒，主要为大数据、人工智能技术基础研发提供算力支撑。

软硬发力

关注并参与脑机接口领域

作为人工智能的新领域，脑机接口也正在受到关注，其主要是实现脑与设备的信息交互。为促进我国脑机接口领域的交流合作，推动脑机接口技术产学研用全链条发展，由厦企盈趣科技参与承办的“首届脑机接口大会”将于下个月召开。

前不久，盈趣科技“牵手”天津大学等，在我市成立北洋脑机接口与智慧健康创新研究院，将围绕新型神经信号感知与检测、组织工程与神经仿生、新一代高通量脑机交互技术、人机共融基础核心器件开发转化平台等方向开展科学研究，旨在构建完整的自主知识产权集群，实现脑机交互技术链条全覆盖。

盈趣科技为客户定制化研发的合作模式，使得其核心能力从早期的精密塑胶件，逐渐延伸至核心电子组件、人机交互系统（电助力自行车人机交互系统、车载hud）等，也是他们与其他电子ODM企业的核心差异。

另一家厦企弘信电子则在电子元器件上发力，日前他们在互动平台上也透露，他们关注并看好脑机接口带来的发展机遇，成功独家为小米铁蛋机器人，提供全套电路板解决方案。同时，他们的产品正应用到多款智能眼镜及AR、VR硬件产品中，今年以来，这个领域的订单显著增长。

值得一提的是，前不久，弘信电子与燧原科技签订合作协议，双方正共同开发高算力、高能效比的人工智能训练推理能力，打造适合人工智能应用与训练基础能力的国产化算力平台。

关键词：

上一篇：广东：对购买首套自住房的多子女家庭有条件的城市可适当提高公积金贷款额度　下一篇：最后一页