近日,我系洪青阳副教授洪青阳和人文学院许彬彬的科研团队研究的闽南话翻译系统近日引起多家主要媒体关注、报道,引起热烈反响。
以下是新闻主要内容:
最近,马克·扎克伯格的一段视频
刷屏了朋友圈
视频中
扎克伯格展示了最新的AI翻译技术
可以实现闽南话和英语的无障碍交流

不过,闽南话翻译
扎克伯格不算是“头号玩家”
早在2019年
来自厦门大学的科研团队就推出了
会听、会说、会写的
闽南话智能语音系统

厦门大学的闽南话智能语音系统出自信息学院洪青阳和人文学院许彬彬的科研团队之手。
可实时翻译还能识别文本
不仅听得懂、说得清
这套系统还会写
可以实现文字和闽南话的互相转换
洪青阳团队认为,从现有资料看,扎克伯格发布的这项技术只是语音到语音的翻译,没有涉及文字。比如,不能形成识别文本,要延伸到其他应用就比较难。在这点上,厦大版闽南话智能语音系统“更胜一筹”。

可以识别不同口音
经过不断的迭代升级
目前厦大的这套语音系统
不仅可以精准翻译
还可以识别不同地区、
不同口音的闽南话
这要归功于科研团队建立的庞大语音资料库,里面有足够多不同人群、不同口音的语音,并及时扩充词典和语言材料。

与此同时
系统后台要不断完善算法
以便学习更多口音和生僻词汇
眼下,研发团队还在开发多语种和方言混杂的智能系统,其中,针对普通话和闽南话混合语音的转换技术预计将在年底上线。


厦门大学信息学院副教授 洪青阳
一个是识别要准,一个是要看得明白,这里面两大挑战都整合在一套系统里面。后面还要更强大,也就是有普通话和闽南话混杂的。我们内部已经有研发了一个版本,还没正式发布,普通话、英文、闽南话三种合起来的,这是我们下一步的目标。
目前,厦大团队的闽南话智能语音系统已经上线,通过小程序和APP,就可以实现闽南话和普通话的无障碍沟通。

同时,经过定制化处理后,系统还被应用在一些特定场景里。
比如乡村的喇叭,农村需要闽南话播报,输入文字就可以直接播报出来,这个很便利。更多的我们还是希望走进千家万户,更多的可能会结合一些硬件,让小孩子可以直接操作,相当于一个益智玩具,真正让更多人感受到方言AI技术给他们带来的便利。
全球约七千万人说闽南话
在美国Meta公司公布闽南话翻译系统后
很多人很吃惊:
为什么是闽南话?
原因也很简单,目前,全世界大约有7000万人在说闽南话,分布在福建的厦、漳、泉地区,台湾地区,广东潮汕,雷州半岛,海南岛部分地区以及浙江温州部分乡镇等,此外还有广阔的东南亚。
与此同时,闽南话被称为“中国最难学方言之一”。
2013年,洪青阳和许彬彬团队开始闽南话翻译系统研究,洪青阳说,这源于团队中不少人都是闽南人,有闽南情怀。而且,闽南话是我国重要方言之一。与此同时,许彬彬深耕闽南方言等汉语方言研究多年。
当然,Meta公司认为,之所以选择闽南话,还有一个原因:为了解决缺乏文字语种的语言翻译难题。但是,洪青阳说,其实闽南话是有用于书面记载的文字和发音词典。
综合整理自:厦视新闻、厦门网
个人简介
洪青阳,厦门大学副教授,天聪智能创始人,全国人机语音通讯会议(NCMMSC)常设委员,公安部安防行业标准(SAC/TC100/SC2)委员。主要研究方向为语音识别、声纹识别,先后主持国家自然基金2项,科技部创新基金2项,省杰出青年基金1项。2014年10月,与清华大学等单位联合制定的公安部第一个声纹识别行业标准《安防声纹确认应用算法技术要求和测试方法》获得颁布。2015年,其主持研发的社区矫正声纹识别系统应用到福建、江苏、广东、辽宁、广西等十三个省市。2018年3月起,研发的声纹识别技术在华为智能手机落地应用。2018年11月,带领厦门大学xmuspeech团队在第三届“东方语言语种识别竞赛”获得第一名。2019年1月,成功研发闽南语识别和合成系统,其中闽南语合成是全国首创。2019年起,其研发的语音识别技术应用到司法、电力、证券等行业。2020年6月,出版专著《语音识别:原理与应用》。担任2020-2021年声纹识别研究与应用学术研讨会主席。2020年以来,发布并升级声纹识别开源工具ASV-Subtools,助力国内外学术研究。
天聪智能创始人,全国人机语音通讯会议(NCMMSC)常设委员,公安部安防行业标准(SAC/TC100/SC2)委员。主要研究方向为语音识别、声纹识别,先后主持国家自然基金2项,科技部创新基金2项,省杰出青年基金1项。2014年10月,与清华大学等单位联合制定的公安部第一个声纹识别行业标准《安防声纹确认应用算法技术要求和测试方法》获得颁布。2015年,其主持研发的社区矫正声纹识别系统应用到福建、江苏、广东、辽宁、广西等十三个省市。2018年3月起,研发的声纹识别技术在华为智能手机落地应用。2018年11月,带领厦门大学xmuspeech团队在第三届“东方语言语种识别竞赛”获得第一名。2019年1月,成功研发闽南语识别和合成系统,其中闽南语合成是全国首创。2019年起,其研发的语音识别技术应用到司法、电力、证券等行业。2020年6月,出版专著《语音识别:原理与应用》。担任2020-2021年声纹识别研究与应用学术研讨会主席。2020年以来,发布并升级声纹识别开源工具ASV-Subtools,助力国内外学术研究。