软件开发客服
首页 > 上上资讯 > 自由通用声音分离资料集FUSS

自由通用声音分离资料集FUSS

2020-04-12 16:25:16编辑:上上定制浏览量:235

谷歌发表了自由通用声音分离资料集(FUSS),以促进社群在于声音分离的研究。FUSS的目的是要来支援声音分离模型的研究,让研究人员利用模型,从包含多个声音来源的录音中,分离出各种声音。过去要从录音中分离这种不同的声源,其分离工作著重在从混合录音中,分离出少量声音类型,像是从录音中分离出语音与非语音,或是分出录音中两位说话者的语音,而在分离之前,还需要预先知道录音中存在声音的数量。

自由通用声音分离资料集FUSS

所创建的FUSS资料集,是要来解决更加普遍通用的问题,希望可以将录音中,随意数量的声音彼此分开,这个领域训练模型,有一个主要的障碍,是即便拥有了高品质的录音,也无法简单地以基准真相标注这些声音;而这也就出现了以高品质模拟来克服此一限制的方法,但要达到良好的效果,使用者需要使用逼真的房间模拟器,编排各种元素以取得真实、多音源以及多重等级的基准真相声音。


FUSS则具备了这些特性,其运用了freesound.org上CC授权的音讯剪辑,共取得约23小时的录音,其中包含了12,377种可用于混音的声音,利用自家开发的模拟器,处理这些音讯剪辑,共创建了2万个用于训练的混音,1千个验证用混音和1千个评估用混音。


採用Tensorflow开发自家的房间模拟器,研究人员可利用此模拟器,产生具声源以及麦克风位置资讯的录音,其所产生出来的音讯媲美昂贵的房间模拟器。发布了遮罩分离基准模型,即便录音中存在2到4个声音来源,该模型也能维持良好的效能。这次发布的内容,包含各种声音的FUSS资料集、音讯样本的声音组成编码,还有基准模型,未来可能也会发布模拟器程式码。

标签: FUSS

21

相关资讯

您的网站自适应的么?

您的网站自适应的么?

自适应网站设计是一款互联网界面设计布局,其核心理念是:集中化建立网页页面的图片排版尺寸,能够智能化地依据用户个人行为及其应用的机器设备环境开展相对应的合理布局。近些年,各种各样显示

标签: 自适应网站 响应式网站

国产鸿蒙操作系统你知多少?

国产鸿蒙操作系统你知多少?

前不久华为产品研发的鸿蒙UI曝出并且于2019年开发者大会上首次发布了,它是一款基于微内核的分布式操作系统,其设计方案与EMUI相一致,让诸多华为老客户安心。鸿蒙操作系统方案早就在

标签: 鸿蒙 鸿蒙操作系统 鸿蒙OS

无代码软件定制平台AppSheet并入谷歌

无代码软件定制平台AppSheet并入谷歌

谷歌近期公布现已收购完成无代码软件定制(no-code)应用程序开发平台AppSheet,AppSheet技术团队将来将融入GoogleCloud。惟彼此仍未公开买卖额度。AppS

标签: 软件定制 无代码软件定制 AppSheet