>>> 哲学 经济学 法学 教育学 文学 历史学 理学 工学 农学 医学 军事学 管理学 旅游学 文化学 特色库
搜索结果: 1-15 共查到语音合成相关记录26条 . 查询时间(0.16 秒)
近日,由内蒙古大学计算机学院主办的"2022年全国人机语音通讯学术会议-面向蒙古语的低资源语音合成竞赛"(简称NCMMSC2022-MTTSC)成功举办。本次竞赛共吸引了来自中科院声学所、中国科学技术大学、天津大学、西北工业大学、微软(中国)有限公司、OPPO、上海维音信息技术股份有限公司、中移在线服务有限公司和浙江核新同花顺网络信息股份有限公司等学术界和工业界的众多单位报名参与。
近日,我校蒙古文智能信息处理技术国家地方联合工程研究中心(蒙古文信息处理技术自治区重点实验室)与香港中文大学李海洲教授团队合作在国际信号处理领域TOP期刊《IEEE/ACM Transactions on Audio, Speech, and Language Processing》上发表了题为“Decoding Knowledge Transfer for Neural Text-to-Spee...
傣语是傣族人民使用的语言,目前仅在中国云南就有近120万人口使用。研究傣语语音合成对推进傣语信息化具有重要意义。本文以开发应用系统为目标,研究了基于HMM框架的傣语语音合成系统的实现方法,并详细阐述了语料收集与挑选、录音、文本归一化、自动分词、文本罗马化与标注、上下文属性与问题集设计、HMM训练以及产生合成语音等模块的实现方法。实验结果表明,采用本文的合成方法,其合成语音有较好的可懂度,而其自然度...
2016年4月15日下午,校党委宣传部就我校计算机学院发布国内首款蒙古语语音识别和语音合成系统举办了新闻媒体发布会。新华社、中国教育报、中国日报、内蒙古日报、内蒙古电视台、内蒙古人民广播电台、北方新报、新华网、北方网等多家区内外媒体出席发布会。研发该系统的计算机学院内蒙古自治区蒙古文信息处理技术重点实验室的全体成员会接受了媒体专访。发布会由校党委宣传部部长李为民主持。
2014年6月18日,北京语言大学申请的发明专利“汉语教学语音合成方法及装置”获得国家知识产权局授权。专利号为“ZL 201 2 1 0207692.8 ”,发明人为“解焱陆、张劲松”,专利权人为“北京语言大学”。
在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,中国科学技术大学语音及语言信息处理国家工程实验室报送的参赛系统在25项测试指标中的11项位列第一,取得了所有参赛系统中最好的综合表现。这是继2006-2013年后,科大语音实验室连续第9次在此活动中取得佳绩。这充分体现了实验室在语音合成技术上稳固的领先地位。
韵律结构生成是改进一个语音合成系统中的合成语音的完整度和自然度的重要组成部分. 韵律词和韵律短语的自动切分是中文层级韵律结构的两个重要的基本层面, 本文调研了这个基本问题, 并提出了一种两层韵律结构生成体系. 为此, 我们建立了条件随机场模型为韵律词和韵律短语的预测选取不同的前端特征. 除此之外, 我们还引入了基于转换的错误驱动学习模块来修正后端的初始预测. 实验结果显示, 这种结合条件随机场和错...
为了有效解决描述嘴唇轮廓的口形特征点定位问题,根据颜色空间中唇部和皮肤颜色的差异提出了一种新的从视频中定位口形特征点的方法。首先将视频文件分解为一帧帧的图片序列,定位并提取出图片中的口形区域,然后利用支持向量机(SVM)将口形区域分为唇部和非唇部区域,最后根据口形图像几何特征的先验知识实现口形特征点的定位。实验结果表明提出的方法具有较高的准确性和鲁棒性。
为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,该文提出“视频三音素”的概念。在此基础上,建立隐马尔可夫(HMM)训练与合成模型,在训练过程中使用了视频音频联合特征,并加入了动态特征。在合成过程中,连接视频三音素HMM模型形成句子HMM,并从中提取特征参数,合成可视语音。从主观和客观评估结果来看,合成视频的真实感强,满意度较...
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。
利用语音合成芯片LR3991各种辅以外围电路设计了一套开发系统。在此系统下,对LR3991睛一些未揭示功能进行了深入研究,得到了几点有实用价值的结果。它对于有效地进行LR3991芯片应用系统的开发具有重要的意义。
汉语是声调语言,同一个音节带上不同的声调可以表述不同的语义。发音时两个或两个以上的音节连在一起时,音节所属调类调值所发生变化的现象称为“连读变调”,目前的语音合成系统没有考虑连续变调,使得合成语音自然度不够。采用TD-PSOLA对具有连续变调现象的语音进行合成,实验表明合成语音的自然度较高,是适合小语料库语音合成的良好算法。
英语中的多音词分成两类,一是因词性不同而读音不同,一是因词义不同而读音不同。前者只需经词性标注,根据其词性标记就可判别其正确的读音。而后者则复杂得多,论文采用了一种基于WordNet语义信息的多音词消歧算法,该算法将多音词的语义信息与上下文中词的语义信息进行匹配,根据匹配结果来判别多音词的读音。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...