音乐中的定量规律科普报告

 

 

报告人:管晓宏

中国科学院院士/IEEE Fellow

报告内容

管晓宏院士首先为我们介绍自然与工程系统中的幂律关系,一共举了三个例子:

  • 地震强度与发生概率形成幂律关系;(左上图)
  • 蛋白质相互作用网络(配对数)形成幂律关系;(右上图)
  • 同一部电影中合作演员数形成幂律关系;(左下图)
  • 个人财富(美国)形成幂律关系。(右下图)

瑞士联邦理工大学实验地质系主任许靖华教授研究了半音为单位的音乐旋律相邻音符的变化,发现概率密度函数是幂函数。如下图所示:

笔者之前做过MIDI风格分类的相关探索,并且使用过jSymbolic。jSymbolic 是一个用于音乐信息检索 (MIR)、音乐学和音乐理论领域的研究工具。其主要目的是从以 MIDI 或 MEI 等文件格式符号存储的音乐数据中提取统计信息。这种统计信息被表述为特征值,可以直接输入自动分类系统,可以用于查询大型音乐数据集,或者可以被音乐学家和音乐理论家用于进行实证音乐研究。事实上管晓宏院士所提到的相邻音符的半音数只是jSymbolic227个特征中的1个特征,但管晓宏院士所做的最让笔者震撼的是其对该幂律关系的推导。

管晓宏院士提出了本报告的第一个问题:为什么音乐旋律服从幂律关系?然后便根据作曲理论,发现旋律的三个数学特征并推导出幂律关系,取得了重要进展。

旋律的第一个数学特征:大量重复以及高度统一的组织使得旋律音程分布为稳态分布。音乐作品中的动机和主题的展开像胚芽生长,不是叶片和茎秆的相加总和,使整个音乐作品成为具有逻辑性、连贯性、统一性的生命体。旋律的稳态分布如下式所示。

\lim_{N \rightarrow ∞}{p(i, N)} = p(i)

旋律的第二个数学特征:旋律曲线具有明显的波动特征,级进进行在旋律创作中大量使用。旋律音程分为狭和广两种(狭音程有同度、二度、三度,广音程有四度、五度、六度、七度、八度)。狭音程应用多,广音程应用少,二度称为级进,而大于三度称为跳进。级进是较长旋律连接的调节者,有利于追求旋律的线条波动,是旋律写作的结构原则和推动旋律进行的重要手段,使得旋律流动更加均匀平稳。由此定义的旋律曲线光滑性趋于一较小常数“旋律光滑吸引子”,公式如下所示:

S = \sum_{i=k}^{n}{p(i)logi} = E(logx) \rightarrow m

旋律的第三个数学特征:各种音程的特性各异,随着音乐的进行,旋律需要得到足够充分的发展。主调音乐是“发展的变奏”,乐曲的“胚芽”是基本动机,通过重复来运用,可以是精确的、变化的和发展的。有变化的重复通过变奏产生,可克服精确重复带来的单调。在旋律变奏中的回绕、填充、变形、加花、扩张、紧缩、倒转、逆行和摄取等手法,形成新的素材,使更多的对比和冲突得以体现,呈现出更立体的形象和更丰富的含义。不同的音程发展出富有变化的音乐语言,各种旋律音程需要充分混合使用,从而使得“音程熵”最大。音程熵的定义如下:

max H_{I} = -\sum_{i}^{}{p(i)logp(i)}

综合以上三式,便可以建立如下数学模型:

求解过程如下,我们可以最终推导出调性音乐的旋律音程逆累积概率分布函数服从幂律

管晓宏院士同时也提出一个特例:现代主义音乐主要代表勋伯格提出的十二音体系无调性音乐,不符合幂律

随后,管晓宏院士提出了本报告的第二个问题:没有受过专业音乐训练的非音乐人为什么喜欢优美的旋律?或者说,是否符合旋律变化、符合幂律的音乐更能使人产生愉悦感?这个问题的答案需要脑科学、生物医学实验证明。这个问题也是管晓宏院士目前在和王小勤教授合作研究的课题之一。

管晓宏院士下面介绍了他在乐器音质分析领域做的一些工作:基于智能信息处理的音质分析与评判。传统来说,器乐演奏的音质评级主要由专家评定,它的优点是能充分利用人对音乐的理解,缺点则是主观、标准不一、工作量大。因此管晓宏院士便使用基于信息科技的评定方法,优点是标准统一、高效,挑战是机器理解艺术。目前正在进行的工作是音乐声学机理 + 信号处理 + 机器学习。

整套基于智能信息处理的音质分析框架如下图所示:

管晓宏院士给出了利用上述框架分析单簧管音质的评价结果:

  • 发现了单簧管簧片的声音信号可以由谐波解耦得到;
  • 提出了评估单簧管簧片质量造成音质差异的有效特征(HTQR);
  • 相比传统音频特征(MFCC),在准确率有较大提升。

相关结果发布在文章《Harmonics Based Representation in Clarinet Tone Quality Evaluation》中,文章放在附件1。

更深入的,管晓宏院士给了一套基于信号解耦的乐器音质分析模型,如下图所示:

音质是一种与共振峰、谐波能量与位置、明亮度、粗糙度、MFCC等等相关的特征,没有标准定义。但音质与音高、响度、时长无关。因此基于音质与音高、响度和时长的独立性,管晓宏院士团队设计了音质表示学习卷积神经网络TQNet,用于进行一般音质评价,里面包含三个模块:

最终形成了论文:《Tone Quality Evaluation for Woodwind Music Instrument Based on Reed-Pulse Features Evaluation》,目前文章正在投递,还没有公开。

管晓宏院士最后总结到:

  • 定量模型与分析方法有助于分析作曲理论中的计算智能,探索人工智能辅助作曲的定量化方法
  • 科学方法有助于艺术创作的创新和把握探索方向
  • 音乐声学机理+信号处理+机器学习融合的方法,有助于开发基于智能信息处理的音质分析与评判的智能系统

附件

  1. 「文件」 文章《Harmonics Based Representation in Clarinet Tone Quality Evaluation》
首页    音乐中的定量规律科普报告