首页 >>  正文

text-to-speech

来源:baiyundou.net   日期:2024-09-22

IT之家 11 月 16 日消息,微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。

微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。

据悉,这项 Azure AI Speech text to speech (TTS) avatar 主要包含三个模块,分别是文字分析器、TTS 声音合成器及 TTS 虚拟化身合成器:

文字分析器会先分析用户输入的文字内容,产生音素序列(phoneme sequence)。接着 TTS 声音合成器中的 TTS 语音模型会预测用户输入文字的声学特征,再合成声音。最后,由神经网络声音合成模型 Avatar,根据上述声学特征预测人物的唇形影像,最终形成虚拟化身影像。

微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能,还能呈现更自然的互动体验。

IT之家发现,微软举例声称,用户可利用 Azure AI Speech TTS avatar 批量制作各种视频内容,例如企业文化影片、产品介绍或 CEO 在大会上的数字分身。也可以制作虚拟直播数字人、聊天机器人、业务机器人、或线上教学的 AI 老师等。

微软表示,Azure AI Speech text to speech (TTS) avatar 目前已经向 Azure 订阅用户推出,支持各种语言,用户可以从预设的虚拟化身选项中挑选想要的角色,也可以自行定制虚拟化身。

如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure 平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。

相关阅读:

《12 月上线,微软发布 Personal Voice:最短 60 秒实现用户自建 AI 音频》

","gnid":"9d7e05035b4437d11","img_data":[{"flag":2,"img":[{"desc":"","height":"644","title":"","url":"https://p0.ssl.img.360kuai.com/t01943367d19c8b3da2.jpg","width":"1440"},{"desc":"","height":"555","title":"","url":"https://p0.ssl.img.360kuai.com/t014ad28f03dfeb8691.jpg","width":"1440"},{"desc":"","height":"557","title":"","url":"https://p0.ssl.img.360kuai.com/t012c007c3f3a5b34f1.jpg","width":"1440"},{"desc":"","height":"469","title":"","url":"https://p0.ssl.img.360kuai.com/t01b8b8cc85d9c9898c.jpg","width":"1440"},{"desc":"","height":"659","title":"","url":"https://p0.ssl.img.360kuai.com/t01b4d0f225bf366934.jpg","width":"1440"}]}],"original":0,"pat":"art_src_1,fts0,sts0","powerby":"pika","pub_time":1700116648000,"pure":"","rawurl":"http://zm.news.so.com/d388e346bb75e908465860bf4c10b045","redirect":0,"rptid":"0e5ba97d68634044","rss_ext":[],"s":"t","src":"IT之家","tag":[{"clk":"ktechnology_1:微软","k":"微软","u":""},{"clk":"ktechnology_1:azure","k":"azure","u":""}],"title":"微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人

周眨知3292n1的语音包菜场的名字是什么啊
耿中董13026782100 ______ 楼上的,TTS全称是:Text-To-Speech Extended,支持多国语言,普通话和粤语有的,不过发音就不太标准,语调古怪,听上去感觉就是老外说话,英语还算是标准的,在我接受范围内.市场上有的,搜索一下就有.补充一个,Say My Name这个来电报名字的也挺好用,这个软件就需要TTS的,没装TTS,这类软件好像用不了.报读短信的软件好像也是 需要TTS的.

周眨知3292哪里个朗读软件最好用? -
耿中董13026782100 ______ TTSUU (Text-to-Speech Universal Utility) 是一款文本转语音软件,能朗读和复读几乎任何语言的文本内容,具有20级音调变声和20级语速调节能力,能把文本内容导出成Wav和MP3文件并且能同时导出LRC以及SMI同步歌词字幕文件.TTSUU录...

周眨知3292在线日语发音器我爱你 -
耿中董13026782100 ______ 艾丝爹路(日语:我爱你)

周眨知3292用程序控制电脑说英语?
耿中董13026782100 ______ 现在,应用 Microsoft 提供的一套文字朗读引擎(Text-To-Speech Engine,简称 TTS),可以在程序中编写代码来使安装了声卡的电脑流畅的朗读英文.如果安装了“金山词霸2000”,那么 Windows 文件夹下会有一个 Speech 文件夹,里面的...

周眨知3292手机出现Error occurred while initalizing Text - To - Speech engine -
耿中董13026782100 ______ 以下的表是可以卸载的系统程序 注意:1. 有*号是绝不可删的,否则会出现严重问题;2. 删除系统自带程序前,请注意备份;3. 因不同版本的Android系统和不同品牌手机的定制,会有差异导致系统自带程序行表有差异,但大体上一致,请大家...

周眨知3292英语中的TTS发音是啥意思? -
耿中董13026782100 ______ 语音合成技术(Text to Speech engine),指电子词典,相对于真人发音而言.

周眨知3292寻找可以发音的阅读软件 -
耿中董13026782100 ______ Labs Natural Voices Text-to-Speech由两个部分组成.即由用来阅读文本(text-to-speech)的引擎和声音程序库“Natural Voice fonts”所构成.前者为用自然的语调阅读文本用的语音合成引擎.而后者则具有可开发特定语音的功能.例如可以合...

周眨知3292微软为XboxOne/Win10游戏带来了什么功能?
耿中董13026782100 ______ 微软正为Xbox One/Windows 10 PC用户带来文字和语音的(text-to-speech/speech-to-text)互相转化功能,该功能在游戏的团队语音/文字聊天可发挥重要作用,减少输入时间,同时也能够让支持XPA跨平台联机的游戏更好地沟通.《光环战争 2》将是首个能够启用这项功能的Xbox One/Windows 10 PC游戏.在游戏中的团队聊天里,PC玩家更倾向于使用键盘输入文字(交流起来没有亲切感),而Xbox One玩家更倾向使用语音(很容易带出脏话影响感情),开启语音/文字互转后,既能够让平台玩家们快速沟通,又能够减少隔阂.

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024