如何让AI兼具“技术理性”与“艺术感性”？答案可能在语言音乐规律中

【导语】中科院院士管晓宏团队研究发(fā)现(xiàn)，语(yǔ)言(yán)节(jié)奏(zòu)、歌(gē)曲(qū)旋(xuán)律(lǜ)都(dōu)藏(cáng)着(zhe)相(xiāng)同(tóng)“数(shù)学(xué)规(guī)律(lǜ)”，该(gāi)规(guī)律(lǜ)不(bù)仅(jǐn)可(kě)解(jiě)释(shì)为(wèi)何(hé)某(mǒu)些(xiē)音(yīn)乐(lè)更(gèng)悦(yuè)耳(ěr)，还(hái)能(néng)优(yōu)化(huà)AI大(dà)模(mó)型(xíng)训(xun)练数据，提升生成内容自然度，未来或为通用人工智能发展开辟新赛道。

你知道吗？不管是人们说话的节奏、用词习惯，还是歌曲的旋律变化，都藏着一种相同的“数学规律”。掌握这种规律，能让人工智能（AI）写文章更通顺、创作音乐更动听，为大模型技术发展提供新方向。

中国科学院院士、西安交通大学教授管晓宏介绍，这种“数学规律”在自然界和工程领域很常见，比如城市人口分布、网络节点连接等都遵循类似规则。他带领团队花了多年时间，分析了大量音乐作品——从巴赫、贝多芬的古典乐曲，到周杰伦等歌手的流行音乐，发现不管是哪种风格、哪个时代的音乐，旋律的起伏变化都符合这一规律。

“这不是巧合，而是音乐本身的数学特性决定的。”管晓宏用通俗的语言解释，团队通过研究总结出音乐旋律的三个关键特点：一是不同音高之间的间隔分布相对稳定；二是旋律的走向像“平滑的曲线”，不会突然出现特别突兀的跳跃；三是旋律会追求“多样性”，避免长时间重复单一节奏或音高。基于这些特点，团队建立了数学模型，最终证实：好听的音乐，其旋律变化都能通过这种规律来解释，这也回答了“为什么大家觉得某些音乐更悦耳”的问题。

更让人意外的是，这种规律在语言领域同样适用。管晓宏举例说，人们日常说话时，句子的长短节奏、常用词汇(huì)的(de)出(chū)现频率，甚至文章的段落安排，都能找到这一规律的影子。而当前AI大模型的性能提升，也和训练数据量增长遵循类似规律。“这就意味着，我们可以用这种规律优化大模型的训练数据。”他表示，比如筛选更符合语言规律的文本数据，或按照音乐规律调整AI作曲的参数，就能让AI生成的内容更贴近人类习惯，自然度大幅提升。

针对“为什么人们能感觉到旋律好听”，管晓宏还提出一个猜想：符合这种规律的旋律，更容易让人产生愉悦感。目前，他的团队正联合清华大学脑科学研究团队、中央音乐学院音乐人工智能团队，通过脑机测量等实验方法验证这一想法。如果得到证实，不仅能帮AI更好地“理解”人类的音乐喜好，还能为AI音乐治疗、情感陪伴等新应用提供科学依据。

值得一提的是，管晓宏还是中央音乐学院音乐人工(gōng)智(zhì)能(néng)和(hé)信(xìn)息(xi)科(kē)技(jì)团(tuán)队(duì)成(chéng)员(yuán)，既懂科学又懂艺术。他表示，这次的研究成果恰恰说明，科学思维和艺术创作是相互促进的。“语言和音乐看似是两种不同的表达形式，底层却藏着(zhe)相(xiāng)同(tóng)的(de)规(guī)律(lǜ)。”他(tā)认(rèn)为(wèi)，未(wèi)来(lái)通(tōng)过(guò)深(shēn)挖(wā)这(zhè)种(zhǒng)跨(kuà)领(lǐng)域的(de)共(gòng)性(xìng)规(guī)律(lǜ)，能(néng)让(ràng)AI大(dà)模(mó)型(xíng)既(jì)具(jù)备(bèi)“理(lǐ)性(xìng)的(de)技(jì)术(shù)能(néng)力(lì)”，又(yòu)拥(yōng)有(yǒu)“感(gǎn)性(xìng)的(de)艺(yì)术(shù)感(gǎn)知(zhī)”，为通用人工智能发展开辟新赛道。

作者：宋雅娟

审核：管晓宏中国科学院院士、西安交通大学教授

更多资讯内容！欢迎关注大数据官方微信（）