希尔贝壳参展世界人工智能大会 | WAIC 2021

由国家发展和改革委员会、工业和信息化部、科学技术部、国家互联网信息办公室、中国科学院、中国工程院、中国科学技术协会、上海市人民政府共同主办的2021世界人工智能大会终于在今天拉开帷幕,本届大会将以“智联世界,众智成城”为主题,交流产业赋能等相关主题。




本次大会采用“双线”呈现,带你感受最前沿的数字化转型成果,领略最亮眼的智慧之光!



2021世界人工智能大会主要由“会议论坛、展览展示、竞赛评奖、应用体验”四大板块构成。会议论坛为“1+2+11+X”总体架构,即1场开幕式、2场全体会议、11场主题论坛和若干场各具特色的论坛活动;展览展示规模进一步扩大,线下展览面积共4万平方米,较往年翻番;竞赛评奖以“SAIL奖”为引领,聚集AIWIN、算法大赛、云帆奖、青少年人工智能大赛等品牌赛事;应用体验将进一步丰富会场及周边智能化场景,展现数字化转型成果。


此次大会将在前三届大会成功承办的基础上,紧紧围绕“人工智能赋能城市数字化转型”,以“智联世界、AI在西岸”为主题,以“东西联动、会产融合、体验更优”为目标,聚焦数字经济加强AI产业融合发展、数字生活加强AI赋能民生发展、数字治理加强AI支撑城市治理,举办“4+2+1”系列活动。


此次会议展厅在上海世博展览馆,希尔贝壳在H1-A111展台亮相,为行业观众呈现前沿的AI数据服务。



希尔贝壳一直聚焦于场景数据服务,自建数据库也是希尔贝壳的核心业务之一,经过4年的探索之后,高精尖数据库的研发投入也不断扩大。并且,希尔贝壳持续在数据开源的项目上做投入,目前开源的数据库申请规模已经达到了500+,实现了我们开源数据助力产学研共同发展的目的,在希尔贝壳的品牌建设上也树立了口碑,在业务上也给希尔贝壳开拓了新的方向。希尔贝壳的开源数据项目,就是AISHELL系列的精标语音数据集。


AISHELL 的开源项目已经成为了语音技术领域的数据开源标杆,目前已形成了智能语音技术+数据的矩阵开源方案,覆盖语音识别、声纹识别、语音合成、场景智能语音技术应用方案。


展会期间,希尔贝壳发布了最新的开源数据库AISHELL-4——多通道中文会议语音数据库

AISHELL-4是一个通过麦克风阵列实录的八通道中文普通话会议场景语音数据集。该数据集共包含211场会议,每场会议4至8人,数据集共120小时左右。该数据集旨在促进实际应用场景下多说话人处理的研究。AISHELL-4数据包括了实际会议场景下各种重要特性,例如停顿、重叠、说话人轮转、噪声等。同时数据集提供了准确的音字转写文本及时间戳信息,方便研究者进行诸如前端处理、语音识别、说话人分割等单独任务,并可以进行联合优化。


  AISHELL-4 开源地址

http://www.aishelltech.com/aishell_4


AISHELL会持续投入做开源,通过技术引领数据业务的发展,通过数据带动技术产业的成熟,在未来用前沿的数据库去服务开发者和科研人员,降低企业在算法落地层面的成本。还要用更多的开源数据与教育、研发、产品等相结合让技术落地走进更多的场景,为实现人工智能民主化希尔贝壳还需要更努力。

希尔贝壳,以人工智能民主化为目标