在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            新聞中心

            EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > Azure 語音合成再添新聲音,“風格遷移”技術(shù)為不同音色實現(xiàn)多情感演繹

            Azure 語音合成再添新聲音,“風格遷移”技術(shù)為不同音色實現(xiàn)多情感演繹

            作者: 時間:2022-08-17 來源:IT之家 收藏

            Neural TTS(神經(jīng)網(wǎng)絡(luò)版文本轉(zhuǎn)語音)新增五種聲音模型,讓我們再次體會到了“風格遷移”技術(shù)對 AI 語音模型多情感多風格的強大支持。

            本文引用地址:http://www.biyoush.com/article/202208/437407.htm

            此次更新的五個美式英語聲音模型,包括青春甜美的 Jane、低沉溫和的 Nancy、隨性且精力充沛的 Davis、響亮激昂的 Jason 和沙啞粗獷的 Tony。在“風格遷移”技術(shù)的支持下,不僅擁有開心 (cheerful)、傷心 (sad)、生氣 (angry)、興奮 (excited)、期待 (hopeful)、友好 (friendly)、不友好 (unfriendly) 和恐懼 (terrified) 等豐富的情感表現(xiàn),還擁有首次運用的呼喊 (shouting) 和耳語 (whispering) 兩種表達方式。至此,用戶擁有可選擇的美式英語聲音模型已達到 20 個,豐富的情感和風格讓應(yīng)用場景更加多元。

            1660707204660797.png

            1660707243752944.png

            1660707287199599.png

            “風格遷移”技術(shù)的原理是把一個聲音模型的韻律和語調(diào)復制到另一個聲音模型上,從而讓后者在本身音色不變的前提下,也可以擁有前者說話的韻律和語調(diào)。過去,聲音風格的搭建主要依靠錄音演員錄制各種風格的聲音數(shù)據(jù),再使用錄音數(shù)據(jù)來生成多風格的智能語音模型,但是一名錄音演員難以演繹所有風格的聲音。風格遷移技術(shù)創(chuàng)新地解決了這一問題,可以高效地賦予多 AI 聲音情感和風格。

            聲音風格和聲音情感模型的持續(xù)更新,讓 Neural TTS 的合成語音在多種業(yè)務(wù)場景中得到了廣泛應(yīng)用,讓用戶感受到了更逼真的語音體驗。例如,游戲平臺可以快速為角色生成多種情感聲音,為游戲增添更多符合情節(jié)的個性化表達,讓虛擬游戲世界栩栩如生。“State of Decay”(腐爛國度)的創(chuàng)作者 —— 亡靈工作室 (Undead Labs) 的使命是為游戲開創(chuàng)嶄新的方向,他們在游戲開發(fā)中就應(yīng)用了 Neural TTS。推出過包括“Psychonauts 2”(精神病患者 2)在內(nèi)的多款游戲的 Double Fine 工作室,也正在利用 Azure Neural TTS 制作未來游戲項目的原型。音頻解決方案提供商 Remixd 在其平臺中集成了 Azure Neural TTS 的聲音模型 Jenny 和 Davis,讓其客戶在創(chuàng)建音頻內(nèi)容時有了更多選擇。

            關(guān)于 Azure Neural TTS

            Azure Neural TTS 是 Azure 認知服務(wù)中強大的語音合成功能,能夠讓開發(fā)人員使用 AI 技術(shù)將文本轉(zhuǎn)換為逼真的聲音。截止目前,微軟 Azure Neural TTS 支持全球 140 個國家和地區(qū)的語言,提供 400 個聲音模型,可加速聲音的自動化生產(chǎn),幫助各種企業(yè)更快地訓練出滿足業(yè)務(wù)場景的聲音,打造出專屬的聲音品牌 —— 無論是呼叫中心、語音助手、有聲書制作、聊天機器人、語音導購,還是影視劇 / 動漫配音、自媒體短視頻、情感電臺、教育培訓等場景。

            持續(xù)的技術(shù)迭代和版本更新,讓 Azure Neural TTS 可以為更多企業(yè)、更多場景提供逼真、自然、接地氣的聲音體驗。同時,微軟的所有技術(shù)進步都接受微軟負責任的 AI 流程的指導,遵循公平、包容、可靠性與安全性、透明、隱私與保障、負責的原則,并通過微軟內(nèi)部的負責任人工智能辦公室 (ORA),人工智能、倫理與工程研究委員會 (Aether),以及負責任 AI 戰(zhàn)略管理團隊 (RAISE) 來監(jiān)督、實施這些道德標準。



            關(guān)鍵詞: 微軟 Azure AI語音模型

            評論


            相關(guān)推薦

            技術(shù)專區(qū)

            關(guān)閉