更新时间:2021-12-09 14:01:40
Demucs是脸书人工智能的一个新的研究项目。它旨在将音轨分成不同的乐器或声音,类似于人类如何检测特定的乐器并解决现有方法的问题。从长远来看,Demucs还可以应用于其他AI任务。
对于机器来说,音乐来源的分离可能是一项艰巨的任务,而对于人类来说,更容易区分人声、低音或鼓声。为了帮助完成这项任务,脸书人工智能研究科学家亚历山大笛福开发了Demucs(音乐源深度提取器)。
正如著名的“鸡尾酒会效应”所说,人类可以在嘈杂的环境中进行特定的对话。分离声源的任务给机器带来了困难。让我们来看看人工智能工具是如何管理这项任务的,以及是什么让Demucs与众不同。
频谱图和波形
正如笛福指出的,最常见的是,人工智能通过分析光谱图来分离音乐来源。虽然这种方法非常适合单频共振仪器,但基于谱图的方法也有其缺点。例如,萨克斯和吉他频率可以相互抵消。
这就是德姆库斯发挥作用的地方。——是基于AI的波形模型。它的设计原理类似于计算机视觉如何检测图像中的模式。“它检测波形中的模式,然后增加更高比例的结构,”杜佛斯解释说。换句话说:“德姆库斯可以再现它认为存在但与之混合的音频。”
微软让Windows 11 浏览器切换更容易
Oppo的Reno 5系列将于12月10日首次亮相
TENAA:Realme Race照片曝光
亚马逊正在计划将壁挂式Echo用于控制您的智能家居
据报道Facebook正在开发具有健康功能的智能手表
Google即将让iPhone用户使用Face或Touch ID锁定隐身标签
了解有关索尼PlayStation的Pulse 3D耳机的更多信息
特斯拉在两周内从比特币中赚了6亿美元
苹果正计划从英特尔向ARM处理器进取转型
苹果可以改善FaceTime的三种方法
从Android切换到iPhone这是苹果手机成功与失败的地方
学习廉价的StackSkillsUnlimited的新技能