如何让AI兼具“技术理性”与“艺术感性”?答案可能在语言音乐规律中

【导语】中科院院士管晓宏团队研究发(fā)现(xiàn),语(yǔ)言(yán)节(jié)奏(zòu)、歌(gē)曲(qū)旋(xuán)律(lǜ)都(dōu)藏(cáng)着(zhe)相(xiāng)同(tóng)“数(shù)学(xué)规(guī)律(lǜ)”,该(gāi)规(guī)律(lǜ)不(bù)仅(jǐn)可(kě)解(jiě)释(shì)为(wèi)何(hé)某(mǒu)些(xiē)音(yīn)乐(lè)更(gèng)悦(yuè)耳(ěr),还(hái)能(néng)优(yōu)化(huà)AI大(dà)模(mó)型(xíng)训(xun)练数据,提升生成内容自然度,未来或为通用人工智能发展开辟新赛道。

如何让AI兼具“技术理性”与“艺术感性”?答案可能在语言音乐规律中

你知道吗?不管是人们说话的节奏、用词习惯,还是歌曲的旋律变化,都藏着一种相同的“数学规律”。掌握这种规律,能让人工智能(AI)写文章更通顺、创作音乐更动听,为大模型技术发展提供新方向。

中国科学院院士、西安交通大学教授管晓宏介绍,这种“数学规律”在自然界和工程领域很常见,比如城市人口分布、网络节点连接等都遵循类似规则。他带领团队花了多年时间,分析了大量音乐作品——从巴赫、贝多芬的古典乐曲,到周杰伦等歌手的流行音乐,发现不管是哪种风格、哪个时代的音乐,旋律的起伏变化都符合这一规律。

“这不是巧合,而是音乐本身的数学特性决定的。”管晓宏用通俗的语言解释,团队通过研究总结出音乐旋律的三个关键特点:一是不同音高之间的间隔分布相对稳定;二是旋律的走向像“平滑的曲线”,不会突然出现特别突兀的跳跃;三是旋律会追求“多样性”,避免长时间重复单一节奏或音高。基于这些特点,团队建立了数学模型,最终证实:好听的音乐,其旋律变化都能通过这种规律来解释,这也回答了“为什么大家觉得某些音乐更悦耳”的问题。

更让人意外的是,这种规律在语言领域同样适用。管晓宏举例说,人们日常说话时,句子的长短节奏、常用词汇(huì)的(de)出(chū)现频率,甚至文章的段落安排,都能找到这一规律的影子。而当前AI大模型的性能提升,也和训练数据量增长遵循类似规律。“这就意味着,我们可以用这种规律优化大模型的训练数据。”他表示,比如筛选更符合语言规律的文本数据,或按照音乐规律调整AI作曲的参数,就能让AI生成的内容更贴近人类习惯,自然度大幅提升。

针对“为什么人们能感觉到旋律好听”,管晓宏还提出一个猜想:符合这种规律的旋律,更容易让人产生愉悦感。目前,他的团队正联合清华大学脑科学研究团队、中央音乐学院音乐人工智能团队,通过脑机测量等实验方法验证这一想法。如果得到证实,不仅能帮AI更好地“理解”人类的音乐喜好,还能为AI音乐治疗、情感陪伴等新应用提供科学依据。

值得一提的是,管晓宏还是中央音乐学院音乐人工(gōng)智(zhì)能(néng)和(hé)信(xìn)息(xi)科(kē)技(jì)团(tuán)队(duì)成(chéng)员(yuán),既懂科学又懂艺术。他表示,这次的研究成果恰恰说明,科学思维和艺术创作是相互促进的。“语言和音乐看似是两种不同的表达形式,底层却藏着(zhe)相(xiāng)同(tóng)的(de)规(guī)律(lǜ)。”他(tā)认(rèn)为(wèi),未(wèi)来(lái)通(tōng)过(guò)深(shēn)挖(wā)这(zhè)种(zhǒng)跨(kuà)领(lǐng)域的(de)共(gòng)性(xìng)规(guī)律(lǜ),能(néng)让(ràng)AI大(dà)模(mó)型(xíng)既(jì)具(jù)备(bèi)“理(lǐ)性(xìng)的(de)技(jì)术(shù)能(néng)力(lì)”,又(yòu)拥(yōng)有(yǒu)“感(gǎn)性(xìng)的(de)艺(yì)术(shù)感(gǎn)知(zhī)”,为通用人工智能发展开辟新赛道。

作者:宋雅娟

审核:管晓宏 中国科学院院士、西安交通大学教授

更多资讯内容!欢迎关注大数据官方微信()