主页 > 世界生科 >科技部开放AI语音数据资料集,加速台湾中文语音助理服务应用发 >

科技部开放AI语音数据资料集,加速台湾中文语音助理服务应用发

科技部稍早宣布将对外开放AI语音数据资料集内容,首波将提供「科技大擂台 与AI对话」竞赛所使用语音试题资料,内容长度达400小时,除了自行录製资料,更结合内政部警政署警察广播电台,以及教育部国立教育广播电台所提供相关语音资料,透过编辑整理成高品质的数据集,希望藉此让更多以中文为主的人工智慧语音助理应用加速发展。

由于製作精準的语音识别模型,通常需要完整的语音数据资料,并且配合正确的资料标注,如此才能让电脑系统更有效率学习,同时让识别精準度提昇。但因为目前市场缺乏有系统整理且资料长度充裕的中文语音资料集,使得对应中文语音使用的助理服务相对较少,多半仍以中国大陆地区的服务为主,对于台湾地区使用需求相对较无法符合在地用语习惯。

因此,科技部携手国家实验研究院科技政策研究与资讯中心 (STPI)打造高品质的中文语音数据集 (Dataset),同时也由警察广播电台宣介慈及教育广播电台谢忠武两位台长协助建立,并且邀请台北科技大学廖元甫副教授协助语音资料标注,预计对外开放民间企业、学术研究单位免费授权使用,希望藉此加速推动人工智慧相关技术应用研发突破,进而提升台湾市场竞争力。

此次释出长度约达400小时的AI语音数据资料集,将透过国家实验研究院高速网路与计算中心资料集平台 (NCHC DATA MARKET)上架,预计透过对外开放缩减发展语音助理服务过程中所需资料标注人力和时间成本,藉此加快更多人工智慧语音识别应用服务推行。

分享此文:分享到 Twitter(在新视窗中开启)按一下以分享至 Facebook(在新视窗中开启)点这里列印(在新视窗中开启)点这里寄给朋友(在新视窗中开启)请按讚:喜欢 载入中...语音资料资料集数据广播电台ai视窗中文

相关推荐