韩流开始用AI了:让艺人声音永远“活下去”、超越人类

【专稿,转载请注明出处】

报道/对于Metaverse(元宇宙),很多人比较感兴趣的一个话题是“数字永生”:即便有一天真人不在了,他也可以通过数字化的形象住在虚拟的元宇宙里,按照生前的思维、性格和习惯继续存在、获得永生。

当然,“数字永生”的想法目前还有点天马行空,模仿人类思维的技术迄今为止仍未出现。不过,人类的声音却是能够模仿的,而且还有公司已经打造了能够以假乱真的AI系统。比如Supertone就通过语音AI系统合成了韩国知名歌手(已故)金光石(Kim Kwang-seok)的声音,甚至连他的家人都觉得与真人无异。

让艺人的声音“活下去”:AI可以模仿歌手唱新歌

2月份的时候,韩国流行组合BTS(防弹少年团)所属公司Big Hit Entertainment旗下的新品牌Hybe向AI音频公司Supertone投入了360万美元资金,这是该公司2020年上市之后的首个重大动作。

Supertone的技术可以创造能够唱歌的超现实声音,简单来说,Supertone的系统克隆并合成声音,该系统可以学习人类的声音,然后比任何系统都更快速地合成全新声音,而且与真人声音很难分辨。

这家AI初创公司是娱乐行业重要的变革者,尤其是在COVID-19疫情爆发之后。去年该技术公开的时候,全球的企业都纷纷与之洽谈合作,Hybe就是其中之一。

Supertone公司联合创始人兼首席运营官Choi Hee-doo之前在接受采访时说,“受到疫情影响,线下音乐业务几乎完全停滞,所有的音乐会和现场演出都转到了线上,但在此过程中,人们意识到,在网络环境中,真实与接近真实之间的差距几乎是很小的,这打开了新的业务机会”。

随着AI语音成为娱乐新业务的核心部分,声音合成技术可能并不算什么新鲜事。

去年,韩国SM娱乐联合韩国电信发布了艺人AI语音提示服务,选用了EXO伯贤、Red Velvet Joy和NCT泰容等艺人的声音。2月份的时候,游戏公司NCSoft在他们的粉丝社区平台Universe开启了虚拟通话服务,粉丝们可以通过该服务与他们喜欢的偶像进行(AI语音)通话。

不过,Supertone的技术更进一步。Choi强调,Supertone的歌唱语音合成技术可以展示感情,据他透露,他们已经克服了“诡异谷”难题,解决了物体或者机器人唱歌无法表达情感的问题,比如,该公司已经能够让韩国一位传奇歌手的声音继续“活下去”。

金光石是韩国乐坛早期的灵魂人物,凭借感人的声线和富有震撼力的声音,他出道之后迅速成功,但令人唏嘘的是,在《无法寄出的信》、《我的生命之光》和《在旷野》等名曲发行之后,1996年却因抑郁症在家中自缢,时年32岁。

离世25年之后,他的声音再次出现在韩国国家级电视台中,并且还演唱了新歌。今年年初的时候,韩国首尔广播公司播出的电视节目“世纪对决:AI vs人类”当中,金光石的声音就用来表演了本世纪知名歌手金范秀在2002年发行的民谣“I Miss You(想念你)”。

据AI技术支持公司Supertone透露,其打造的音频AI系统“Singing Voice Synthesis(简称SVS)”学习了金光石的20首歌曲,随后还通过训练工具,用金光石的声音练习了700多首韩国歌曲以提高准确度,因此该系统能模仿金光石,并且用他的风格唱新歌。

节目制作人Kim Min-ji此前在接受采访时说,“我们最关心和最担心的就是得到金光石家人的许可。当我们在他家人面前播放AI语音之后,他们非常开心,一开始是很谨慎,但听到了歌声之后,他们说就像是金光石现场唱的一样”。

节目制作人Nam Sang-moon和Kim Min-ji

节目首席制作人Nam Sang-moon表示,想要准确发音,声音和表演带有足够的感情是很重要的,“要用感情唱歌,每个音符都要很自然地连起来,这样才能表达情感,这是该技术的关键点,开发者们训练AI精确地模仿人类的发声器官”。

金光石一位30多年的粉丝说,“恢复之后的声音很像他,就像是金光石在线录制的”。

版权与道德问题之外,虚拟娱乐的新机会

对于用AI模仿人类的声音,一些首尔居民并不认同。

比如29岁的Im Uk-jin说,“我最大的担忧是,AI表现的像个人类,有些原始技能和习惯是只有人类可以拥有的,如果AI能够模仿这一切,未来地球将会被AI统治,而不是人类,这让我很担心”。

不过,两位制作人表示,对AI版权和潜在道德问题的担忧应该被解决,但不应该让整个领域黯然失色。Nam说,“我们不仅应该从版权方面看待AI,还应该思考用AI技术作为工具帮助人类并给我们带来快乐的方法”。

韩国流行文化行业在沉浸式粉丝体验方面推出了大量创新,尤其是自疫情爆发之后。SM和JYP迅速合作,通过Naver的流媒体平台V Live推出了虚拟音乐会“Beyond Live”系列。今年年初,Hybe还将V Live集成到Weverse当中,粉丝见面会也被搬到了线上,Naver的角色平台Zepeto还拿到了来自Hybe和YG娱乐的投资。

Choi说,“传统娱乐行业存在的障碍正在快速被突破,此前只提供平台的公司也在制作他们自己的内容,加入了娱乐内容之争。所以,如何在虚拟环境中通过视听技术,真实、流畅的实现这些内容,比以往任何时候都更加重要”。

Supertone联合创始人兼CEO Lee Kyo-gu表示,“其中一个可能是给粉丝举办个性化的音乐会,虽然3D音频、动态屏幕是目前虚拟直播演唱会采用的为数不多的技术,我们的技术则可以它通过移动平台打造更个性化的内容”。

比如,该技术可以让观众听到歌手在虚拟音乐会期间叫他们的名字,或许可以跟他们说“生日快乐”,全球的粉丝都可以用自己听得懂的语言收到来自韩国艺人的真实问候。

Supertone的技术还与“数字艺术家”的趋势非常一致,娱乐和游戏公司,包括Supertone的主要和作者,都推出了虚拟亿人,比如拳头游戏的K/DA和SM娱乐的aespa,都是由真实与虚拟成员组成的女团。

Lee解释称,“虽然目前这些角色背后都是真人歌手配音,但在我们系统的帮助下,通过混合几位艺术家的声音,就可以带来与这些虚拟角色形象匹配的全新声音”。

更重要的是,AI语音不仅将拓展新机会,还将缓解公司和艺人的风险。随着韩国组合的流行,他们面临的不可预测的风险也在增加,尽管合成语音替代不了真人团体,但面对这样的风险,合成语音可能是比较有效的解决方案。

Supertone是由首尔国立大学融合科技学院音乐和音频调研组成员创办的初创公司,发起人是Lee Kyo-gu教授,他将自己所有的时间都用在了音频AI机器学习领域,去年成立Supertone的目的就是让该小组的技术商业化。

虽然该公司成为焦点是因为与Hybe的合作,但Supertone的技术对于单个艺术家依然是有用的,毫无疑问,这与该公司11名成员本身都是狂热的音乐家本身有一定的关系。“我们都是热爱音乐的人,最基础的目标是给艺术家提供一个充分利用他们创作的解决方案。自2000年代中期以来,韩国在声带发明、数字歌手以及相关技术方面投入了很大的努力,但工作室之间使用的大多数设备都还是外国品牌”。

虽然一些歌手担心AI语音可能取代他们的位置,但Supertone已经参与了制作人和歌手都愿意用该工具拓展自身能力的项目。比如,一位以独特嗓音闻名的韩国流行创作型歌手也积极参与到了其他艺术家合作的音乐创作中,他建议将自己的声音换成女声。

Choi说,“我们最主要想做的是用原有的声音创造新的业务,或者创造一个新的声音。因此,最重要的点不是与现有的艺术家或者唱片公司竞争,而是与他们合作”。

该公司也承认,Supertone技术有取代人类声音的潜在危险。

“我们最初的愿望是为每个音乐人做一个项目,但意识到它很有可能被用于非法活动。所以我们自然而然的寻求与控制这些音乐版权的公司合作,当BigHit找到我们合作之前,我们先敲开了与小品牌合作的大门”。

为了合理使用他们的技术,Supertone还在官网设立了自己的道德观。“我们将自己看作一个乐器制造公司,我们的软件是艺术家的工具,例如合成器是一种简单制作电子音频信号的乐器,音乐家们根据自己的目的去使用它,这就产生了可以融入到音乐中的声音。艺术家是能够创造性地利用乐器创作音乐的人,我们希望Supertone的技术能够最大限度发挥他们的创造力”。

结论

不可否认,用AI模仿真人唱歌的方法是可取的,而且是很有创意的。除了音乐行业之外,游戏业也能够将该技术用于和知名艺人的深度联动,让音乐与游戏重叠用户得到更个性化的体验。

不过,回到开头的那个话题,尽管AI能够模仿真人有感情的说话,但那就意味着歌手可以用声音的方式“永生”吗?即便有一天,AI技术可以模仿人类思维,但同样不容忽视的是,同一个人的思维和生活方式也是随着年龄和生活变化的,如果只是模仿一个人某个阶段的思维,这种意义的“数字永生”,还算是“永生”吗?

Author: cnmei123

发表评论

您的电子邮箱地址不会被公开。