搜索结果: 1-15 共查到“语音合成”相关记录26条 . 查询时间(0.16 秒)
内蒙古大学计算机学院成功举办NCMMSC2022-MTTSC蒙古语语音合成竞赛(图)
内蒙古大学计算机学院 NCMMSC2022-MTTSC 蒙古语语音合成竞赛 全国人机语音通讯学术会议
2023/2/26
傣语是傣族人民使用的语言,目前仅在中国云南就有近120万人口使用。研究傣语语音合成对推进傣语信息化具有重要意义。本文以开发应用系统为目标,研究了基于HMM框架的傣语语音合成系统的实现方法,并详细阐述了语料收集与挑选、录音、文本归一化、自动分词、文本罗马化与标注、上下文属性与问题集设计、HMM训练以及产生合成语音等模块的实现方法。实验结果表明,采用本文的合成方法,其合成语音有较好的可懂度,而其自然度...
内蒙古大学举办国内首款蒙古语语音识别和语音合成系统新闻媒体发布会(图)
蒙古语语音识别 语音合成系统
2016/4/18
2016年4月15日下午,校党委宣传部就我校计算机学院发布国内首款蒙古语语音识别和语音合成系统举办了新闻媒体发布会。新华社、中国教育报、中国日报、内蒙古日报、内蒙古电视台、内蒙古人民广播电台、北方新报、新华网、北方网等多家区内外媒体出席发布会。研发该系统的计算机学院内蒙古自治区蒙古文信息处理技术重点实验室的全体成员会接受了媒体专访。发布会由校党委宣传部部长李为民主持。
南京师范大学教育科学学院多媒体原理与技术课件第二章 语音合成
南京师范大学教育科学学院 多媒体原理与技术 课件 第二章 语音合成
2015/7/14
南京师范大学教育科学学院多媒体原理与技术课件第二章 语音合成。
2014年6月18日,北京语言大学申请的发明专利“汉语教学语音合成方法及装置”获得国家知识产权局授权。专利号为“ZL 201 2 1 0207692.8 ”,发明人为“解焱陆、张劲松”,专利权人为“北京语言大学”。
在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,中国科学技术大学语音及语言信息处理国家工程实验室报送的参赛系统在25项测试指标中的11项位列第一,取得了所有参赛系统中最好的综合表现。这是继2006-2013年后,科大语音实验室连续第9次在此活动中取得佳绩。这充分体现了实验室在语音合成技术上稳固的领先地位。
中文语音合成系统中的一种两层韵律结构生成体系
语音合成 字音转换 韵律结构生成 条件随机场
2010/12/3
韵律结构生成是改进一个语音合成系统中的合成语音的完整度和自然度的重要组成部分. 韵律词和韵律短语的自动切分是中文层级韵律结构的两个重要的基本层面, 本文调研了这个基本问题, 并提出了一种两层韵律结构生成体系. 为此, 我们建立了条件随机场模型为韵律词和韵律短语的预测选取不同的前端特征. 除此之外, 我们还引入了基于转换的错误驱动学习模块来修正后端的初始预测. 实验结果显示, 这种结合条件随机场和错...
可视语音合成中口形特征点定位研究
可视语音 唇部分割 特征点定位 支持向量机
2010/3/15
为了有效解决描述嘴唇轮廓的口形特征点定位问题,根据颜色空间中唇部和皮肤颜色的差异提出了一种新的从视频中定位口形特征点的方法。首先将视频文件分解为一帧帧的图片序列,定位并提取出图片中的口形区域,然后利用支持向量机(SVM)将口形区域分为唇部和非唇部区域,最后根据口形图像几何特征的先验知识实现口形特征点的定位。实验结果表明提出的方法具有较高的准确性和鲁棒性。
基于汉语视频三音素的可视语音合成
可视语音合成 视频三音素 隐马尔可夫模型
2009/12/29
为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,该文提出“视频三音素”的概念。在此基础上,建立隐马尔可夫(HMM)训练与合成模型,在训练过程中使用了视频音频联合特征,并加入了动态特征。在合成过程中,连接视频三音素HMM模型形成句子HMM,并从中提取特征参数,合成可视语音。从主观和客观评估结果来看,合成视频的真实感强,满意度较...
德语语音合成中的字音转换研究
德语语音合成 字音转换 有限状态转录机
2009/12/28
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。
LR3991语音合成芯片的性能研究
语音合成 芯片 开发系统
2009/11/11
利用语音合成芯片LR3991各种辅以外围电路设计了一套开发系统。在此系统下,对LR3991睛一些未揭示功能进行了深入研究,得到了几点有实用价值的结果。它对于有效地进行LR3991芯片应用系统的开发具有重要的意义。
汉语连续变调语音合成算法
时域基音同步叠加 文语转换 声调模型
2009/7/22
汉语是声调语言,同一个音节带上不同的声调可以表述不同的语义。发音时两个或两个以上的音节连在一起时,音节所属调类调值所发生变化的现象称为“连读变调”,目前的语音合成系统没有考虑连续变调,使得合成语音自然度不够。采用TD-PSOLA对具有连续变调现象的语音进行合成,实验表明合成语音的自然度较高,是适合小语料库语音合成的良好算法。