ICASSP2024丨车载多通道语音识别挑战赛,排名结果公布

近期,由希尔贝壳、理想汽车、西工大音频语音与语言处理研究组、新加坡南洋理工大学、天津大学、WeNet开源社区、微软、中国信通院等单位发起的车载多通道语音识别挑战赛(ICMC-ASR)圆满结束,现公布每个赛道取得佳绩的队伍。

 

 

  官网(文末“阅读原文”直接访问)

https://icmcasr.org

 
赛事介绍
随着汽车成为人们日常生活中不可或缺的一部分,而驾驶舱中传统的触摸交互方式容易分散驾驶员的注意力,存在安全风险,因此,车内基于语音的交互方式得到重视。与通常家庭或会议场景中的语音识别系统不同,驾驶场景中的系统面临更加独特的挑战,缺乏大规模的公共真实车内数据一直是该领域发展的主要障碍。因此,特推出车载多通道语音识别挑战赛(ICMC-ASR),作为ICASSP2024的官方挑战议题(Grand Challenge)之一。
本次赛事发布一个真实的车内多通道语音语料库,包含约 1000小时、车内真实录制的多通道普通话语音数据,收音设备包含车内分布式麦克风收集的远场数据,以及参与者的头戴麦克风收集的近场数据。
 
ICMC-ASR吸引了98海内外队伍参赛。历时三个月,最终来自中科大、远鉴、FawAISpeech、同花顺语音、喜马拉雅等参赛队伍在本届赛事取得优异成绩。
 
各赛道的排名如下:
【成绩排名】
 

Track I Automatic Speech Recognition (ASR) 赛道

提供评估集的真实的说话人日志结果。任务目标是开发基于多通道多说话人语音识别系统。参与者需要关注不同通道数据信息融合、背景噪声抑制以及多说话人重叠等。

 

 

 
1   T005  USTC-iFlyTech
 
2   T078  远鉴
 
3   T052  FawAISpeech

 

Track II Automatic Speech Diarization and Recognition (ASDR) 赛道

去除说话人日志的先验知识(如说话人的分割、说话人标签以及说话人人数),参与者需要使用说话人日志和识别技术对评估集中的每个会话进行分割和转录。该任务接受端到端系统以及允许更多的系统灵活性。

 

 

 
1   T005  USTC-iFlyTech
 
2   T054  同花顺语音
 
3   T001  ximalaya speech team

 

ICASSP2024将在2024年4月14-19日韩国首尔举行,会议期间将专门组织本次竞赛的特殊议题,届时竞赛组织方将进行赛事总结,同时邀请排名靠前的队伍分享竞赛方案,敬请期待。
组织单位 

 

 

希尔贝壳,以人工智能民主化为目标