我是一个喜欢听音乐的人,前一阵我抛弃了傻逼的网易云音乐,转移到了 Spotify。随着逐渐对这个新平台的适应,我开始在上面发掘一些喜欢的歌曲,很快一个奇怪的组合引起了我的注意:

这是一个“虚拟歌手组合”,名字叫做コンナノコ(konanoko),主打日语歌曲,风格为 City Pop 和传统日式 Disco,带有一些 80 年代的蒸汽波的特点,很多歌曲从旋律到律动都十分的优秀。

而且更让我吃惊的是……这个组合产量惊人,几乎一个月可以发售一张完整的专辑,而且风格也会随着专辑的推出不断的微调。面对这么巨大的产量,我开始产生了怀疑……

Screenshot From 2026-06-09 17-28-02.png

是的,这个所谓的“虚拟歌手组合”,是不是本身就是一个来自“人工智能”的产物,因为正常人是不可能达到这种产能的。

于是我开始了调查,发现这个组合十分神秘,你甚至找不到所有关于它的太多信息。不过在她们的官网上倒也没有遮掩:

コンナノコ(konanoko)是一个完全由AI技术驱动的日本虚拟女子音乐组合。定义为“凭借100%的AI力量诞生的、大家都理想的3人女孩组合”,组合由
conaco、nanako 和 nocco 三位设定鲜明的虚拟角色组成。她们的音乐主打“赛博朋克 × 80年代复古”概念,将经典的City
Pop、迪斯科舞曲与充满未来感的人声巧妙融合,形成了一种极具中毒性的魔性风格。

它们所有的作品都是通过 Tonecore 发行,走的是常规发行渠道,除了有惊人的高产,并且还十分的神秘,你不知道幕后是谁,是团队,是大公司,还是一个人。在短短两年左右的时间里,这个神奇的组合凭借高度自动化的AI工作流,在各大流媒体发行了超140首单曲和20余张专辑。从词曲编排、人声合成到MV中的视觉素材与舞蹈动作,均由生成式AI完成。其幕后操盘手抹去了所有真实企业或个人信息,日本有一些人推测其为精通AI提示词工程与专业后期混音的独立极客团队。而且为了让这个“虚拟组合”足够真实,甚至还为每个角色写了详细的背景故事和个人设定,包括喜好和如何爱上音乐的小故事等。

使用 AI 来制作音乐早已经不是什么秘密,无论是 B 站还是 Youtube 都有一堆,甚至 Youtube 还成了一种产业,各种“Japanese 80s Music”的合集,主打的就是那种对复古蒸汽波歌曲的喜爱,对于那些用 SunoV5 制作出来的 AI 歌曲,估计大部分人和我一样都听过,属于初听很惊艳,挺多了很同质化的类型。

Screenshot From 2026-06-09 17-31-15.png

而且 AI 的歌曲特点除了听起来同质化严重之外,就是歌手“唱功过于完美”带来的疲惫感,一个正常的歌手唱歌是不可能全程情绪饱满的,会有起伏,所以演唱会有技巧,在需要用力的时候用力,在其他时间稍微松弛一点。但是 AI 歌手不存在这个体力问题,你可以看到它们疯狂的飙高音 3 分钟,并且音准可怕,这种过于完美的感觉反而让人感觉很“假”,比较知名的就是歌手袁娅维挑战 AI 的那首“大东北是我的家乡”,你可以明显的感受到真人演唱歌曲的优势,那就是“活人感“与”感情“,这是 AI 无法具备的,也是无法代替真人歌手的。

但对于コンナノコ这种主打电子舞曲的虚拟歌手来说,AI 可以说是极大程度的避开了短板,毕竟舞曲里的 Vocal 很多时候“活人感”都不强,甚至或需要用切片和 scrach 的方式降低活人感,强调律动。只要节奏带感,一切都不是问题。所以 コンナノコ 的作品听起来也没那么差劲,甚至比起大部分舞曲来说要更好。

而且还有一个最让我惊讶的地方就是同为 AI 制作歌曲,コンナノコ的作品是有十分专业完善的后期处理的,歌曲会有十分十分专业的混音,无论是人声的处理,对于响度的优化,以及乐器分离的处理,都是专业团队才能做到的手笔。这更加让人对这个虚拟形象幕后的工作人员产生好奇,如果不是某音乐大公司做的试验,那至少也是专业的音乐人才能做到这种程度。有人甚至分析过,コンナノコ的音乐应该是有音乐人先做出旋律 Demo,然后喂给 AI 进行二次创作和修饰的,很多细节上的编曲以及旋律特点纯靠 AI 是无法生成的。

所以,コンナノコ并非是一个“随便玩玩”或者“素人产物”的 AI 造物,更像是一群本就很有实力的音乐人,使用 AI 大幅提高了产能的成果。

正当我为コンナノコ所惊叹的同时,网络上也开始了对于“AI制造”的抵制浪潮。目前互联网上似乎对于“AI造物”达成了一个共识,就是,量产且低劣。所以我们看到很多游戏制作商会在显眼的地方声明自己的作品没有使用 AI 技术,而是纯手搓。以及知名的 Youtube 电台 Lo-Fi Girl 也在简介里说自己的音乐都是来自各种有才华的音乐人,而没有使用 AI 技术。

仿佛一瞬间,人们都开始讨厌 AI,仿佛使用 AI 成为了一种原罪。但是在暗处,人们也都在偷偷的积极使用 AI,毕竟 AI 真的好用。所以 AI 成为了一种舆论中的”黄色电影“,大家都在偷偷使用,但是却又尽量避免在公共舆论中承认自己在看。颇为滑稽。


从 2024 年开始,人工智能就成为了一个火热的话题,有人说科技的发展需要到一个“奇点”而迎来爆发,也有人确信“大模型与人工智能”的到来这代表着这一刻已经成为了现实。

然而各种大模型内容生成工具的普及,带来的是更多的“造屎”能力,机械式的文本充斥着各种社区,各种粗制滥造的内容出现在各种平台上,让人避之不及。在这种低劣内容的冲击下, AI 也逐渐成为了一种“劣质”的代名词。但 AI 那强大的制造和模仿能力,又让许多人类产生了危机和不信任,他们主动抵制,生怕某一天出现真正的智械危机,效率低下的人类成为了 AI 的奴隶。

我曾几何时也是讨厌 AI 的,我其实愿意相信人类的荣光,维护人类的尊严,我也坚持认为 AI 是无法代替人类的创作能力的。但渐渐的我也产生了一些动摇,在和同学谈论中,我发现 AI 的确只能模仿,归纳总结,缝合,无法真正的创造,没有真正的 Creativity,但是又有大量人类,他们别提创造了,他们连归纳的能力都很低下,在与 AI 的对比之中,他们真的不如 AI。

所以未来 AI 应该不会代替人类,但是会促进人类进一步进化到是真的。某种程度上来看,AI 的确是一种新的工业革命。

在我看来,比起开始一股脑抵制 AI,倒不如应该学会“掌控 AI”,让 AI 成为人类创造的新工具,才是正确之道。就像是コンナノコ这个神秘企划一样,在专业的音乐人手中,AI 成为了大幅提升生产效率的黑魔法,反而对其他还在手搓的互联网音乐制作人产生降维打击,如果制作人们都善用 AI 提升工作效率,那些用 AI 制作的“互联网抽象大粪“,自然也会失去了生存空间。

曾几何时有人认为武器是有罪的,而对此最佳的辩护词就是“ Guns don't kill people, people do.”


这里说一个趣闻,我儿子两岁多的时候,热衷于听音乐,楼下经常有大妈跳广场舞,我儿子就跟我说,家里的儿歌听着“不带劲”,我明白他的意思是儿歌太过于舒缓,节奏太慢,而且编曲上的确是有点过于空洞和简单了。但是他的年龄直接听那种“动词大慈”的抖音神曲也不太合适。而且现在的儿歌呈现两极分化,新版本的儿歌过于傻逼,甚至有《拉臭臭》这种抽象歌曲,而老儿歌虽然经典,旋律也不错,但太老了,已经无法适应这个时代,尤其是我儿子都觉得“不带感”。

所以我想起了 AI,就把他常听的儿歌放到 Sunov5 里进行了重新编曲,在 Gemini 和 ChatGPT 的协助下进行了提示词调整,最终得到了很多”十分新潮的新编曲儿歌”,最后我儿子听着十分开心,我甚至都觉得这些编曲十分新潮。

Screenshot From 2026-06-09 17-22-20.png

这应该就是 AI 在实际应用中的一种特殊场景吧。