Azure 語音合成再添新聲音，“風格遷移”技術(shù)為不同音色實現(xiàn)多情感演繹

作者：時間：2022-08-17 來源：IT之家

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

微軟 Azure Neural TTS（神經(jīng)網(wǎng)絡(luò)版文本轉(zhuǎn)語音）新增五種聲音模型，讓我們再次體會到了“風格遷移”技術(shù)對 AI 語音模型多情感多風格的強大支持。

本文引用地址：http://www.biyoush.com/article/202208/437407.htm

此次更新的五個美式英語聲音模型，包括青春甜美的 Jane、低沉溫和的 Nancy、隨性且精力充沛的 Davis、響亮激昂的 Jason 和沙啞粗獷的 Tony。在“風格遷移”技術(shù)的支持下，不僅擁有開心 (cheerful)、傷心 (sad)、生氣 (angry)、興奮 (excited)、期待 (hopeful)、友好 (friendly)、不友好 (unfriendly) 和恐懼 (terrified) 等豐富的情感表現(xiàn)，還擁有首次運用的呼喊 (shouting) 和耳語 (whispering) 兩種表達方式。至此，用戶擁有可選擇的美式英語聲音模型已達到 20 個，豐富的情感和風格讓應(yīng)用場景更加多元。

“風格遷移”技術(shù)的原理是把一個聲音模型的韻律和語調(diào)復制到另一個聲音模型上，從而讓后者在本身音色不變的前提下，也可以擁有前者說話的韻律和語調(diào)。過去，聲音風格的搭建主要依靠錄音演員錄制各種風格的聲音數(shù)據(jù)，再使用錄音數(shù)據(jù)來生成多風格的智能語音模型，但是一名錄音演員難以演繹所有風格的聲音。風格遷移技術(shù)創(chuàng)新地解決了這一問題，可以高效地賦予多 AI 聲音情感和風格。

聲音風格和聲音情感模型的持續(xù)更新，讓 Azure Neural TTS 的合成語音在多種業(yè)務(wù)場景中得到了廣泛應(yīng)用，讓用戶感受到了更逼真的語音體驗。例如，游戲平臺可以快速為角色生成多種情感聲音，為游戲增添更多符合情節(jié)的個性化表達，讓虛擬游戲世界栩栩如生。“State of Decay”（腐爛國度）的創(chuàng)作者 —— 微軟亡靈工作室 (Undead Labs) 的使命是為游戲開創(chuàng)嶄新的方向，他們在游戲開發(fā)中就應(yīng)用了 Azure Neural TTS。推出過包括“Psychonauts 2”（精神病患者 2）在內(nèi)的多款游戲的 Double Fine 工作室，也正在利用 Azure Neural TTS 制作未來游戲項目的原型。音頻解決方案提供商 Remixd 在其平臺中集成了 Azure Neural TTS 的聲音模型 Jenny 和 Davis，讓其客戶在創(chuàng)建音頻內(nèi)容時有了更多選擇。

關(guān)于 Azure Neural TTS

微軟 Azure Neural TTS 是 Azure 認知服務(wù)中強大的語音合成功能，能夠讓開發(fā)人員使用 AI 技術(shù)將文本轉(zhuǎn)換為逼真的聲音。截止目前，微軟 Azure Neural TTS 支持全球 140 個國家和地區(qū)的語言，提供 400 個聲音模型，可加速聲音的自動化生產(chǎn)，幫助各種企業(yè)更快地訓練出滿足業(yè)務(wù)場景的聲音，打造出專屬的聲音品牌 —— 無論是呼叫中心、語音助手、有聲書制作、聊天機器人、語音導購，還是影視劇 / 動漫配音、自媒體短視頻、情感電臺、教育培訓等場景。

持續(xù)的技術(shù)迭代和版本更新，讓 Azure Neural TTS 可以為更多企業(yè)、更多場景提供逼真、自然、接地氣的聲音體驗。同時，微軟的所有技術(shù)進步都接受微軟負責任的 AI 流程的指導，遵循公平、包容、可靠性與安全性、透明、隱私與保障、負責的原則，并通過微軟內(nèi)部的負責任人工智能辦公室 (ORA)，人工智能、倫理與工程研究委員會 (Aether)，以及負責任 AI 戰(zhàn)略管理團隊 (RAISE) 來監(jiān)督、實施這些道德標準。

在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

新聞中心

Azure 語音合成再添新聲音，“風格遷移”技術(shù)為不同音色實現(xiàn)多情感演繹

評論

相關(guān)推薦

技術(shù)專區(qū)