具有語(yǔ)音合成功能的嵌入式車載通訊終端的設(shè)計(jì)
1 引言
本文引用地址:http://www.biyoush.com/article/196596.htm據(jù)廣州市公布的《2005年廣州市交通發(fā)展年度報(bào)告》統(tǒng)計(jì),2005年廣州市機(jī)動(dòng)車擁有量為177.4萬(wàn)輛;據(jù)《法制晚報(bào)》報(bào)道2006年5月份北京機(jī)動(dòng)車保有量可突破300萬(wàn)輛。奧運(yùn)時(shí)將突破330萬(wàn)輛;而據(jù)2006年GSM協(xié)會(huì)公布的一組數(shù)據(jù)稱:GSM手機(jī)用戶數(shù)量超過(guò)20億,中國(guó)市場(chǎng)最大。以上三組不同的數(shù)據(jù)顯示:越來(lái)越多的人在駕駛著機(jī)動(dòng)車并通過(guò)GSM終端與外界進(jìn)行通訊。
現(xiàn)階段,許多機(jī)動(dòng)車輛都安裝了車載終端。它主要用于車載導(dǎo)航、車輛調(diào)度、車載監(jiān)控等。而許多終端設(shè)備是依靠手工操作顯示終端來(lái)完成的,如駕駛員查看車輛調(diào)度中心或朋友發(fā)來(lái)的重要短消息。查看導(dǎo)航終端的地圖等。這樣就導(dǎo)致司機(jī)開車時(shí)不能專心,其直接后果可能導(dǎo)致嚴(yán)重的交通事故。
語(yǔ)音交流是人類最自然的交流方式,如果車載終端的很多操作可由實(shí)時(shí)的語(yǔ)音來(lái)代替的話,將有利于減少交通事故的發(fā)生率。例如,GSM Modem收到短消息,司機(jī)不用手動(dòng)查看。語(yǔ)音合成系統(tǒng)可以自動(dòng)播報(bào)出來(lái);可以實(shí)時(shí)地提示司機(jī)行駛的方向與路名;可以實(shí)時(shí)地將交通狀況播報(bào)出來(lái)。讓駕駛員了解當(dāng)前交通狀況,通過(guò)了解道路交通擁堵的實(shí)時(shí)信息,從而避開擁堵路段,更快到達(dá)目的地等。語(yǔ)音合功能成的車載終端可提高車載終端的智能性、車輛駕駛的安全性和舒適性,使用戶使用起來(lái)更加方便,更具有人性化。
2 語(yǔ)音合成及GSM M0dem
2.1 語(yǔ)音合成技術(shù)
語(yǔ)音合成技術(shù)是利用計(jì)算機(jī)、智能系統(tǒng)等設(shè)備,按預(yù)定的程序和指令,人為產(chǎn)生音素、音節(jié)、詞和句子的技術(shù)。
目前,語(yǔ)音合成技術(shù)已發(fā)展到能實(shí)時(shí)地將任意文本轉(zhuǎn)換成連續(xù)可懂的自然語(yǔ)句輸出,相應(yīng)技術(shù)通常稱為文語(yǔ)合成或文語(yǔ)轉(zhuǎn)換(Text To Speech,簡(jiǎn)稱TTS),涉及到聲學(xué)、語(yǔ)言學(xué)、語(yǔ)音數(shù)字信號(hào)處理技術(shù)、多媒體技術(shù)等多個(gè)學(xué)科。文語(yǔ)合成的原理:根據(jù)韻律建模的結(jié)果,從原始語(yǔ)音庫(kù)中取出相應(yīng)的語(yǔ)音基元,利用特定的語(yǔ)音合成技術(shù)對(duì)語(yǔ)音基元進(jìn)行韻律特性的調(diào)整和修改,最終合成出符合實(shí)際的語(yǔ)音。
2.2 語(yǔ)音合成模塊
本設(shè)計(jì)采用安徽中科大訊飛信息科技有限公司研發(fā)的一款高端中文語(yǔ)音合成模塊XF-S4240。該模塊可通過(guò)UART、SPI和12C三種接口接收待合成的文本,直接合成為語(yǔ)音輸出(Line out)。
該模塊采用。InterSound4.0 KT系統(tǒng)作為模塊內(nèi)核,一個(gè)是輕量級(jí)中文連續(xù)語(yǔ)音合成系統(tǒng)。
XF-S4240模塊的特點(diǎn)如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文單詞時(shí)按字母方式發(fā)音;支持四種內(nèi)碼格式:GB2312(簡(jiǎn)體中文編碼)、GBK(國(guó)家標(biāo)準(zhǔn)擴(kuò)展編碼)、Unicode(字符編碼)、Big5(繁體中文編碼);具有雙發(fā)音人:男聲、女聲;具有智能的文本分析處理算法,可正確識(shí)別和處理數(shù)值、號(hào)碼、時(shí)間日期及一些常用的度量衡符號(hào),具備較強(qiáng)多音字處理和中文姓氏處理能力;支持軟件調(diào)節(jié)語(yǔ)速、語(yǔ)調(diào)、音量等。 2.3 GSM Modem
GSM Modem是繼GSM手機(jī)后又一種非常重要的GSM移動(dòng)通信系統(tǒng)的終端設(shè)備。GSM Modem作為一種主要的GSM網(wǎng)絡(luò)接入設(shè)備,它是傳統(tǒng)調(diào)制解調(diào)器與GSM無(wú)線移動(dòng)通信系統(tǒng)相結(jié)合的一種數(shù)據(jù)終端設(shè)備,因此也叫無(wú)線調(diào)制解調(diào)器。它的出現(xiàn)打開了GSM網(wǎng)絡(luò)數(shù)據(jù)通信及其應(yīng)用的大門。本設(shè)計(jì)采用西門子公司生產(chǎn)的第三代GSM雙頻ModemTC35i,該模塊可廣泛應(yīng)用于POS終端、手持式設(shè)備、移動(dòng)電腦、無(wú)線電話、交通控制和導(dǎo)航系統(tǒng)、快速管理安全系統(tǒng)、遠(yuǎn)程監(jiān)視、遠(yuǎn)程抄表、自動(dòng)售賣機(jī)等系統(tǒng)。
3 車載終端的硬件設(shè)計(jì)
系統(tǒng)硬件是以廣州周立功單片機(jī)發(fā)展有限公司的ARM7系列Smart ARM2200嵌入式平臺(tái)為基礎(chǔ)。平臺(tái)主控制器采用飛利浦公司生產(chǎn)的16/32位ARM7TDMI-S微控制器IPC2210,它具有豐富的外部接口,例如工業(yè)標(biāo)準(zhǔn)的UART、高速的I2C接口(400 kb/s)、SPI接口、A/D轉(zhuǎn)換接口等,可以方便地與其他外設(shè)互連。
系統(tǒng)底層軟件采用μCliunx內(nèi)核,該內(nèi)核是針對(duì)微控制領(lǐng)域而設(shè)計(jì)的Linux系統(tǒng),適合無(wú)內(nèi)存管理單元(MMU)的微控制器。
XF-S4240模塊可通過(guò)UART、SPI和I2C接口實(shí)現(xiàn)與其他終端設(shè)備的通訊。本系統(tǒng)設(shè)計(jì)利用SmartARM2200嵌入式平臺(tái)的I2C接口與XF-S4240的12C接口進(jìn)行通訊。XF-S4240設(shè)置為從設(shè)備,默認(rèn)地址為0x80,Smart ARM2200設(shè)置為主設(shè)備。GSM Modem則通過(guò)標(biāo)準(zhǔn)UART口與SmartARM2200嵌入式系統(tǒng)的通用串口2連接。
4 軟件設(shè)計(jì)
4.1 語(yǔ)音模塊合成的通訊協(xié)議
無(wú)論XF-S4240采用UART、SPI還是I2C與其他智能系統(tǒng)連接,語(yǔ)音合成模塊的上層通訊協(xié)議是相同的,下面將介紹語(yǔ)音合成的控制命令。
發(fā)送給XF-S4240的所有命令與數(shù)據(jù)均采用幀的方式進(jìn)行數(shù)據(jù)封裝后傳輸。
其中,幀頭長(zhǎng)度為一個(gè)字節(jié),定義為16進(jìn)制0xFD;數(shù)據(jù)區(qū)長(zhǎng)度占兩個(gè)字節(jié),高字節(jié)在前,低字節(jié)在后。數(shù)據(jù)區(qū)長(zhǎng)度不定,但須小于1 024個(gè)字節(jié)。數(shù)據(jù)區(qū)包含命令字、命令參數(shù)和合成的語(yǔ)音信息。
此幀的含義:0xFD表示幀頭,0x00 0x0A表示數(shù)據(jù)區(qū)長(zhǎng)度為10個(gè)字節(jié)。0x01表示語(yǔ)音合成命令,0x00表示文本格式為GB2312,剩余的16進(jìn)制編碼為中山大學(xué)的GB2312編碼[3]。
4.2 TC35i GSM Modem的通訊協(xié)議
TC35i GSM Modem與其他終端采用通用串行接口進(jìn)行通訊,通訊協(xié)議采用AT指令集。本設(shè)計(jì)主要讀取GSM Modem的短消息。而與短消息收發(fā)有關(guān)的規(guī)范主要包括GSM 03.38,GSM 03.40和GSM07.05。前兩者重點(diǎn)描述的是SMS技術(shù)實(shí)現(xiàn)(編碼方式),后者規(guī)定了SMS的DTE-DCE接口標(biāo)準(zhǔn)(AT命令集)。AT指令是以AT為開頭,如AT+CMGL=0(GSM 07.05版本)表示讀取最新收到的短消息,AT+CMGC表示發(fā)出一條短消息等。
短消息共有3種接收與發(fā)送模式:Block Mode(塊模式),Text Mode(文本模式)和PDU Mode(PDU模式)。PDU模式最常用,支持所有手機(jī),可以使用任何字符集。下面給出一個(gè)PDU模式下的ASCII串,其短消息中心號(hào)碼(SMSC)是+8613800200500,發(fā)送者號(hào)碼是13826468897.消息內(nèi)容是中山大學(xué),則通過(guò)讀取它的PDU串是:08 9l 68 3l 0820 00 05 F0 04 0D 91 68 31 28 46 86 98 F7 00 0860 30 02 11 82 21 80 08 D0 D6 BD C9 F3 B4 A7D1。通過(guò)以上這個(gè)PDU串得知.要得到需要的用戶信息就必須對(duì)PDU串進(jìn)行解碼。下面給出PDU串解碼的數(shù)據(jù)結(jié)構(gòu)。
4.3 應(yīng)用程序的設(shè)計(jì)與流程
嵌入式平臺(tái)SmartARM220的應(yīng)用程序是運(yùn)行于μCliunx內(nèi)核之上,應(yīng)用程序不能直接對(duì)硬件操作。為了實(shí)現(xiàn)硬件與外部設(shè)備通訊,必須調(diào)用相應(yīng)的設(shè)備驅(qū)動(dòng)程序。本文主要涉及UART驅(qū)動(dòng)、I2C驅(qū)動(dòng),嵌入式驅(qū)動(dòng)程序的設(shè)計(jì)方法在這里省略。
5 結(jié)束語(yǔ)
基于語(yǔ)音合成技術(shù)和語(yǔ)音模塊XF-S4240的車載終端可廣泛應(yīng)用于導(dǎo)航系統(tǒng)、車載調(diào)度、車載監(jiān)控等。由于該技術(shù)的通用性,它還可應(yīng)用于其他需要語(yǔ)音合成技術(shù)的場(chǎng)合,如排隊(duì)叫號(hào)系統(tǒng),公交報(bào)站器等。目前語(yǔ)音識(shí)別技術(shù)雖已取得很大的成績(jī),但效果不如語(yǔ)音合成技術(shù),相信不久人們就可利用更加先進(jìn)的語(yǔ)音技術(shù)自然地與機(jī)器進(jìn)行交流!
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評(píng)論