软件开发客服
首页 > 上上资讯 > 自由通用声音分离资料集FUSS

自由通用声音分离资料集FUSS

2020-04-12 16:25:16编辑:上上定制浏览量:149

谷歌发表了自由通用声音分离资料集(FUSS),以促进社群在于声音分离的研究。FUSS的目的是要来支援声音分离模型的研究,让研究人员利用模型,从包含多个声音来源的录音中,分离出各种声音。过去要从录音中分离这种不同的声源,其分离工作著重在从混合录音中,分离出少量声音类型,像是从录音中分离出语音与非语音,或是分出录音中两位说话者的语音,而在分离之前,还需要预先知道录音中存在声音的数量。

自由通用声音分离资料集FUSS

所创建的FUSS资料集,是要来解决更加普遍通用的问题,希望可以将录音中,随意数量的声音彼此分开,这个领域训练模型,有一个主要的障碍,是即便拥有了高品质的录音,也无法简单地以基准真相标注这些声音;而这也就出现了以高品质模拟来克服此一限制的方法,但要达到良好的效果,使用者需要使用逼真的房间模拟器,编排各种元素以取得真实、多音源以及多重等级的基准真相声音。


FUSS则具备了这些特性,其运用了freesound.org上CC授权的音讯剪辑,共取得约23小时的录音,其中包含了12,377种可用于混音的声音,利用自家开发的模拟器,处理这些音讯剪辑,共创建了2万个用于训练的混音,1千个验证用混音和1千个评估用混音。


採用Tensorflow开发自家的房间模拟器,研究人员可利用此模拟器,产生具声源以及麦克风位置资讯的录音,其所产生出来的音讯媲美昂贵的房间模拟器。发布了遮罩分离基准模型,即便录音中存在2到4个声音来源,该模型也能维持良好的效能。这次发布的内容,包含各种声音的FUSS资料集、音讯样本的声音组成编码,还有基准模型,未来可能也会发布模拟器程式码。

标签: FUSS

00

相关资讯

Kotlin全新1.3.60版本抢先介绍

Kotlin全新1.3.60版本抢先介绍

编程语言Kotlin发布了全新1.3.60版本升级,这一版本升级稍微改进了言语功能,包含内联类型(InlineClass)还有提示的异常消息,也对IntelliJIDEA功用和Ko

标签: Kotlin

Yelp丛集拓展软件Clusterman正式开源开发

Yelp丛集拓展软件Clusterman正式开源开发

Yelp对外开放开源其內部应用的丛集拓展系统软件Clusterman,而本来该系统软件仅支持Mesos丛集全自动拓展,而如今还能支持Kubernetes丛集,穿透自定义的信号,以更

标签: Clusterman Yelp

识微见远2019英特尔物联网峰会

'识微见远'2019英特尔物联网峰会

今日,以”识微见远”为主题内容的2019intel物联网技术论坛会在厦门市举办。大会上,intel系统详细介绍了其合理布局物联网技术方面的几大基石发展战略,叙述了近些年为助推全世界

标签: 物联网 英特尔