基于智能信息处理的音质分析与评判
传统来说,器乐演奏的音质评级主要由专家评定,它的优点是能充分利用人对音乐的理解,缺点则是主观、标准不一、工作量大。因此管晓宏院士团队便使用基于信息科技的评定方法,优点是标准统一、高效,挑战是机器理解艺术。目前正在进行的工作是音乐声学机理 + 信号处理 + 机器学习。
整套基于智能信息处理的音质分析框架如下图所示:
利用上述框架分析单簧管音质的评价结果:
- 发现了单簧管簧片的声音信号可以由谐波解耦得到;
- 提出了评估单簧管簧片质量造成音质差异的有效特征(HTQR);
- 相比传统音频特征(MFCC),在准确率有较大提升。
相关结果发布在文章《Harmonics Based Representation in Clarinet Tone Quality Evaluation》中。
更深入的,管晓宏院士给了一套基于信号解耦的乐器音质分析模型,如下图所示:
音质是一种与共振峰、谐波能量与位置、明亮度、粗糙度、MFCC等等相关的特征,没有标准定义。但音质与音高、响度、时长无关。因此基于音质与音高、响度和时长的独立性,管晓宏院士团队设计了音质表示学习卷积神经网络TQNet,用于进行一般音质评价,里面包含三个模块:
最终形成了论文:《Tone Quality Evaluation for Woodwind Music Instrument Based on Reed-Pulse Features Evaluation》,目前文章正在投递,还没有公开。
最后总结:
- 定量模型与分析方法有助于分析作曲理论中的计算智能,探索人工智能辅助作曲的定量化方法
- 科学方法有助于艺术创作的创新和把握探索方向
- 音乐声学机理+信号处理+机器学习融合的方法,有助于开发基于智能信息处理的音质分析与评判的智能系统