News-20161029-2

From cslt Wiki
Revision as of 09:33, 31 October 2016 by Cslt (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Oriental COCOSDA 2016 于2016年10月26日-28日,在美丽的巴厘岛如期召开。O-COCOSDA是东方语音数据库设计、构建、评估、研究与应用等领域最重要的会议之一。此次会议为期3天,逾百名来自亚太地区各国的语言学专家、语音技术研究者出席会议。

  在当今世界,英语无疑是一种最强势的语言。由于历史原因和不可逆转的国际化趋势,英语对其他国家的语言带来了巨大的影响,比如混合语言(Mixlingual)现象的产生。这为语音识别带来了巨大的挑战,因为大规模的混合语言训练数据目前还很少见。

  作为国内领先的语音技术研究机构,清华大学语音语言技术中心(CSLT)联合海天瑞声(SpeechOcean),国内唯一具有多达110种语言能力的数据服务提供商,在此次会议上发起了“Special Session for Mixlingual Speech Processing”,其内容包括(但不限于)混合语言的语音学分析、语音识别、语音合成、说话人识别、语言理解等混合语言处理任务。

  其中,由 “清华大学”和“海天瑞声”的合作论文《OC16-CE80: A Chinese-English Mixlingual Database and A Speech Recognition Baseline》获得了Oriental COCOSDA 2016最佳论文奖。该论文的实验Baseline由清华大学CSLT提供,实验数据OC16-CE80( 80小时中英文混合语音数据库)由海天瑞声提供。

Ocaward-1.jpg

(“清华大学”与“海天瑞声”合作论文获得最佳论文奖)
 

  除此之外,清华大学CSLT和海天瑞声还联合举办了一个中英文混合语音识别竞赛 (OC16 MixASR-CHEN Challenge)。该竞赛的训练数据和测试数据“OC16-CE80”由海天瑞声提供,这是一个录音总长度为80个小时、包括1445名发音人的中英文混合语音数据库(数据详情在文章后面进行介绍)。清华大学CSLT向竞赛提供了实验Baseline和部分中文数据库。

清华大学CSLT的王东老师,在会议上宣布了竞赛结果: 三星中国研究院获得了第一名,语音识别的中英文识别综合WER达到14.75%,并获得了会议颁发的“Best Performance Award”; 第二名是上海师范大学,中英文识别综合WER达到16.11%; 第三名由台湾中央研究院与华硕Da Vinci Innovation Lab合作获得,中英文识别综合WER达到19.05%。

  值得一提的是,在该竞赛的Extended Submission里,来自台北国立科技大学的廖元甫教授提交的识别结果,其中的中英文识别综合WER达到15.89%。

Occlose.jpg

(获奖人员与会议组织者合影)

  获奖人员(上图)从左至右依次为:清华大学王东老师,台湾中研院郑秋豫老师(Organization Committee),Oscar Riandi (Organization Committee) , Hammam Riza(Honorary Chair) , 海天瑞声陈清,三星中国研究院余骁捷,Satoshi Nakamura( General Co-Chair) 。

Ocwangd.jpg

(清华大学CSLT的王东老师,在会议上介绍实验baseline,并宣布竞赛结果)

Ocyuraojie.jpg (三星中国研究院的余骁捷在做论文宣讲)

  海天瑞声介绍了该次竞赛所使用的数据库“OC16-CE80”,及其他混合语言数据库,包括一个台湾语+英语的混合语音库,四个在建的混合语音库(印尼语+英语、印地语+英语、日语+英语、韩语+英语)。海天瑞声拥有大量的、具有自主知识产权的语音识别和语音合成的数据资源。海天瑞声表示在未来其将携手各大国际科研机构推出更多高质量免费的科研学术数据。介绍了在即将举办的APSIPA16(2016年12月14日在韩国济州岛召开)上,与清华大学CSLT共同举办的Oriental Multiple Language Special Session & Language Recognition Challenge。这个活动也是由海天瑞声提供免费实验数据,并由清华大学提供实验Baseline。

Occhenqing.png

(海天瑞声的陈清在介绍试验数据库详情)


  在这次会议上,“海天瑞声”介绍了其多达110种语言的数据服务能力、现存以及在建的多种语音、文本和发音词典等数据资源,得到了听众们的关注和垂询。同时,“海天瑞声”也是目前国内唯一有能力提供稀有语种数据服务的供应商,包括被朝鲜语、希伯来语、加泰罗尼亚语、阿拉伯语、捷克语、波兰语等,给听众们留下了深刻的印象。

  海天瑞声一直致力于为学术界提供高品质的免费数据资源,以支持人机交互和模式识别领域的学术研究的进步。由海天瑞声运营的“天籁数据中心”,旨在为科研机构和高校提供一个可以交换、共享和代销数据的平台,以从一定程度上解决科研数据短缺的问题。

文字选自海天瑞声公众号推送文章 link