两个新的研究论文已经在过去的学期期间cnmat产生。

 

  • 学习,概率和逻辑:实现基于内容的音乐信息检索的统一方法,通过小时。温度。 Crayencour和c。即地窖,数字人文学科前沿(杂志),2019年4月
    • 摘要:在过去的15年中,(MIR)音乐信息检索领域取得了算法组织和分析不断增加的大变化量的音乐和提供数字音乐相关数据的发展的巨大进步。然而方法,基于内容的检索的发展,使或改善媒体仍然是主要挑战。在这种观点文章中,我们仔细审视从录音音频为基于内容的算法瓶颈的案例研究,并指出了一些当前的方法自动和弦估计的问题:表现力和灵活性获得鲁棒性和副牺牲反之亦然;信息多可用来源少剥削;建模的多面和强烈的音乐相关信息只限于利用当前的体系结构;通常模式仅限于短期分析没有考虑音乐信号的那个时间层次结构。处理音乐数据需要应对复杂的关系这两个不确定性和结构的表征多层次的能力。有传统的方法一般这两个方面分开处理,概率和学习的常用方法是代表知识的不确定性,逻辑表示,而通常的方式是表示知识和复杂的关系信息。我们所倡导电流的方法下的障碍鉴定是可以克服由人工智能统计关系(starai)的领域的最新发展,它统一了概率,逻辑和(深)学习。这表明我们在MIR用现行方法找到强大的扩展功能和unifications在starai,我们认为我们解释为什么现在是时候考虑尽在这个充满希望的领域研究的新视角。

 

  • 音频估计未观测到的特征为targed基于业务流程中,J。吉利克,C。即塞拉和d。 Bamman,ISMIR 2019
    • 抽象:基于目标的编排可以辅助的思想为搜索声音以匹配目标声音的最佳组合的过程中,给定样本的一个数据库,一个相似性度量,并且一组约束。是a拟议到溶液ESTA管弦乐分数的典型问题,其中候选人由相似性是 - 吐温目标声音和在数据库中的音频样本对应于分数的音符的混合物一些特征空间中排名;在管弦乐的设置,有效数十分数可能含有同时发出仪器。

      一般来说,基于目标的系统包括辅助编排的组合优化算法和约束求解器经过优化,以找到共同的解决方案有效。在优化的关键步骤涉及属,从数据库阿婷大量的声音的组合并且然后比较声音的各混合物与目标声音的特征。由于高计算成本的需要合成一个新的音频文件,然后计算功能为声音的每个组合,在实践中,存在估算使用组成组合的因迪维杜阿尔源文件的预先计算功能的每个新的混合物,而不是功能系统。目前,国家的最先进的系统使用一个简单的线性组合进行预测这些,即使在使用中的功能不是线性的自己。

    • 在这项工作中,我们探索的神经模型估计从部件的声音的声音特征的混合特征,发现可以是标准的功能,预计显着优于表示,目前尚处于辅助编排系统中使用的方法的精度。我们提出定量比较和讨论我们的研究结果基于目标配器问题的启示。