论文题目:Graph modeling for vocal melody extraction from polyphonic music
第一作者:WeiweiZhang
通讯作者:WeiweiZhang,QiaolingZhang
收录期刊:Applied Acoustics
期刊级别:中科院二区
论文概述:
声乐旋律提取一直是音乐信息检索领域的热点和难点。针对这一难点问题,本文提出了一种基于图建模的声乐旋律提取方法。首先,对混合音频信号进行恒Q变换。然后,将几个相邻帧的幅度谱连接在一起以构建输入特征。然后,构造一个无向图来建模旋律提取问题,并通过图卷积网络(GCN)估计逐帧旋律音高,其中音高估计问题被视为一个多类分类问题。频率点被视为节点,频率点的底层连接关系被定义为边。最后,根据在基于GCN估计的音高的平滑旋律轨迹的特定范围处定义的显著性函数,对量化的逐帧音高进行微调。所提出的方法根据不同频率点的潜在连接关系来定义GCN的边,以一种可解释的方式解决了声乐旋律提取问题。实验结果表明,该方法在轻量级参数情况下取得了良好的性能。