飛行試驗(yàn)是飛行條件為真實(shí)、模擬或虛擬的試驗(yàn)。很多科研人員都會(huì)進(jìn)行一些飛行試驗(yàn),本文是一篇核心期刊快速發(fā)表范文,主要論述了語(yǔ)音視頻信號(hào)混合編碼實(shí)時(shí)遙測(cè)技術(shù)。
【摘 要】在飛行試驗(yàn)中,為了全面掌握試驗(yàn)機(jī)的工作狀態(tài),需要將飛行員的語(yǔ)音信號(hào)進(jìn)行遙測(cè)。本文提出一種將語(yǔ)音和視頻信號(hào)進(jìn)行混合編碼遙測(cè)傳輸?shù)臏y(cè)試方案,該方案將編碼后的數(shù)據(jù)流插入到機(jī)載測(cè)試系統(tǒng)中,通過(guò)數(shù)據(jù)采集單元的PCM數(shù)據(jù)流傳輸進(jìn)行遙測(cè)發(fā)射,地面站接收到遙測(cè)信號(hào)后,利用軟件對(duì)數(shù)據(jù)流進(jìn)行實(shí)時(shí)解碼還原出語(yǔ)音和視頻信號(hào)。該方案節(jié)省了遙測(cè)信號(hào)帶寬資源的占用,語(yǔ)音和視頻信號(hào)通過(guò)一套遙測(cè)設(shè)備進(jìn)行發(fā)射,具有系統(tǒng)設(shè)備使用成本低的優(yōu)點(diǎn)。
【關(guān)鍵詞】語(yǔ)音,視頻,編碼,遙測(cè)
1 引言
在飛行試驗(yàn)中,為了掌握試驗(yàn)機(jī)的人機(jī)工作狀態(tài),飛行員與地面指揮員通過(guò)無(wú)線電臺(tái)進(jìn)行語(yǔ)音交流傳遞信息,這種半雙工的“問(wèn)、答”式工作方式易分散飛行員注意力,不利于試驗(yàn)任務(wù)的執(zhí)行。如果將飛行員“全部語(yǔ)音”傳輸?shù)降孛妫Y(jié)合“問(wèn)、答”方式,試飛工程師和地面指揮員就更容易全面的掌握試驗(yàn)機(jī)的工作狀態(tài)。
同樣機(jī)載測(cè)試的模擬視頻遙測(cè)是將攝像頭輸出的視頻信號(hào)直接調(diào)制發(fā)射傳輸?shù)降孛妫宦芬曨l信號(hào)占用一套遙測(cè)設(shè)備,非常占用資源。
為了解決上述問(wèn)題,首次將語(yǔ)音視頻信號(hào)同時(shí)采集,采用基于ADPCM和MPEG-4的數(shù)字編碼方式[1],通過(guò)IRIG-106標(biāo)準(zhǔn)的PCM數(shù)據(jù)幀將數(shù)據(jù)流實(shí)時(shí)遙測(cè)到地面站,地面站接收信號(hào)后通過(guò)軟件解碼實(shí)時(shí)還原出語(yǔ)音視頻信號(hào)。
2 語(yǔ)音編碼方案
2.1語(yǔ)音編碼的概述
語(yǔ)音編碼的方法有三種:波形編碼、參數(shù)編碼和混合編碼。
波形編碼能使重建語(yǔ)音波形保持原語(yǔ)音信號(hào)的波形形狀,它具有適應(yīng)能力強(qiáng)、語(yǔ)音質(zhì)量好的優(yōu)點(diǎn),但所需的編碼速率高,如脈沖編碼(PCM)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)等;參數(shù)編碼通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取及編碼,保持了語(yǔ)音的語(yǔ)意,所需的編碼速率比較低,但合成語(yǔ)音質(zhì)量較差,如LPC-10、MPE-LPC;混合編碼采用了合成-分析的方法,克服了參數(shù)編碼的缺點(diǎn),在中低速率上獲得了高質(zhì)量的語(yǔ)音編碼,大大節(jié)省了傳輸信道容量及存儲(chǔ)量,為不斷擁擠的通信頻帶提供了一種解決方法,混合編碼有CELP、LD-CELP、ASCELP 等編碼方式。
另外,語(yǔ)音算法的選擇除了壓縮率外, 更應(yīng)該側(cè)重低延時(shí)、低復(fù)雜度和語(yǔ)音的傳輸質(zhì)量。
2.2基于ADPCM原理的語(yǔ)音編碼原理
之所以要對(duì)語(yǔ)音進(jìn)行壓縮,因?yàn)檎Z(yǔ)音信號(hào)本身的A/D轉(zhuǎn)換會(huì)導(dǎo)致存儲(chǔ)容量需求的增加及傳送信道帶寬的增加。如一段44.1KHz,量化精度為16bit的立體聲語(yǔ)音信號(hào),其一分鐘占約10M的存儲(chǔ)容量。如果直接用PCM碼對(duì)之進(jìn)行編碼并存儲(chǔ)和傳輸則存在非常大的冗余度,可對(duì)其進(jìn)行4:1或16:1的壓縮。
脈沖編碼調(diào)制(簡(jiǎn)稱:PCM)是使用最為廣泛的調(diào)制方法。在PCM的調(diào)制過(guò)程中,將輸入的模擬信號(hào)進(jìn)行取樣,量化和編碼。這種方法通過(guò)用脈沖編碼來(lái)代表取樣后的模擬信號(hào)的幅度。語(yǔ)音信號(hào)通過(guò)PCM編碼后得到的信號(hào),最能夠保持其真實(shí)度,但是其需要的存儲(chǔ)空間及傳輸帶寬也很大,所以就有了ADPCM語(yǔ)音編碼技術(shù),要了解ADPCM語(yǔ)音編碼下面先介紹其他幾種語(yǔ)音編碼原理。(1)差分PCM編碼原理。差分PCM(即DPCM)記錄的不是信號(hào)的絕對(duì)大小而是相對(duì)大小,因?yàn)樾盘?hào)的相對(duì)大小變化比信號(hào)本身要小,碼位用的也比較少。差分系統(tǒng)就是利用這種信息的冗余,不記錄信號(hào)的絕對(duì)大小,而是記錄相鄰之間差值的大小。差分編碼采用預(yù)測(cè)編碼技術(shù),從輸入中減去預(yù)測(cè)值,然后對(duì)預(yù)測(cè)誤差進(jìn)行量化,最終的編碼就是預(yù)測(cè)值與實(shí)際值之間的差值。解碼器用以前的數(shù)據(jù)對(duì)當(dāng)前樣值進(jìn)行預(yù)測(cè)。這種方法使用的比特?cái)?shù)較少,但它的性能決定于預(yù)測(cè)編碼方法以及它對(duì)信號(hào)的變化的適應(yīng)能力。(2)增量調(diào)制(DM)編碼原理。增量調(diào)制(DM)是一種特殊簡(jiǎn)化的DPCM,其只用1bit量化器,因?yàn)橹挥靡粋€(gè)量化級(jí)來(lái)代表樣值的變化,為了跟蹤信號(hào)的變化,必須使用高的采樣頻率。在DM中,存在兩類誤差,一種是斜率過(guò)載誤差,其產(chǎn)生原因是語(yǔ)音波形幅度發(fā)生急劇變化時(shí),譯碼波形不能充分跟蹤這種急劇的變化而產(chǎn)生的失真;另一種是顆粒噪聲,因?yàn)樵跓o(wú)聲狀態(tài)或信號(hào)幅值固定式,量化輸出都呈0,1交替序列而產(chǎn)生的。(3)自適應(yīng)增量調(diào)制(ADM)編碼原理。一般情況下,顆粒噪聲對(duì)音質(zhì)的影響比較大,所以要對(duì)增量調(diào)制的△的幅值取得足夠小,但是△取得足夠小斜率過(guò)載失真就會(huì)比較大,為了減少失真就需要提高采樣率,這樣就會(huì)影響信息壓縮的效果。所以為了解決上述問(wèn)題,就出現(xiàn)了自適應(yīng)增量調(diào)制(ADM),其原理為:在語(yǔ)音信號(hào)的幅值變化不太大的區(qū)間內(nèi),取小的△值來(lái)抑制顆粒噪音;在幅值變化大的地方,取大的△值來(lái)減小過(guò)載噪音。其具體實(shí)現(xiàn)方法為:在顆粒噪音不產(chǎn)生大的影響的前提下,確定最小的△幅值。在同樣的符號(hào)持續(xù)產(chǎn)生的情況下,將△幅值增加到原來(lái)的2倍。即當(dāng)+ △、+ △這樣持續(xù)增加時(shí),如果下一個(gè)殘差信號(hào)還是相同的符號(hào),那么再將△幅值增加一倍,如此下去,并且確定好某一個(gè)最大的△幅值上限,只要在這個(gè)最大的△幅值以內(nèi)同樣的符號(hào)持續(xù)產(chǎn)生,就將△幅值繼續(xù)增加下去。如果相反,殘差信號(hào)值為異號(hào)時(shí),就將前面的幅值△設(shè)為原來(lái)的1/2,重新以△/2為幅值。
2.3 基于ADPCM原理的語(yǔ)音編碼原理
自適應(yīng)差分脈沖編碼調(diào)制(簡(jiǎn)稱為:ADPCM)用預(yù)測(cè)編碼來(lái)壓縮數(shù)據(jù)量。它結(jié)合了ADM 的差分信號(hào)與PCM的二進(jìn)制碼的方法,是一種性能比較好的波形編碼。其根據(jù)語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性的非平穩(wěn)隨機(jī)過(guò)程及相鄰樣點(diǎn)間有著很強(qiáng)相關(guān)性的特點(diǎn),采用自適應(yīng)量化和自適應(yīng)預(yù)測(cè)技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行編碼。它的一個(gè)重要特點(diǎn)就是可以在較低的數(shù)據(jù)率的情況下,獲得較高質(zhì)量的重構(gòu)語(yǔ)音。
其核心思想為:(1)利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階去編碼大的差值;(2)使用過(guò)去的樣本值去估算下一個(gè)輸入樣本的預(yù)測(cè)值, 使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。編碼器和譯碼器都是根據(jù)前面出現(xiàn)的PCM 抽樣值對(duì)下一個(gè)PCM抽樣進(jìn)行預(yù)測(cè),然后在接受端再恢復(fù)成先前的PCM信號(hào)。所以,發(fā)送端只需要向接受端發(fā)送預(yù)測(cè)值與實(shí)際值的誤差。由于正常情況下,這些誤差的幅度要比原始信號(hào)的幅度小很多,所以,對(duì)此誤差進(jìn)行編碼所需代碼的位數(shù)要比對(duì)原始信號(hào)系統(tǒng)編碼所需要的位數(shù)少很多,從而達(dá)到壓縮的目的。 ADPCM編碼方法之所以是一種比較好的編碼,因?yàn)槠潆m然有著較好壓縮率,但其音質(zhì)也比較好(MOS值達(dá)到4.1,最好標(biāo)準(zhǔn)為5)。另外其算法延遲較小,實(shí)現(xiàn)簡(jiǎn)單,成本較低。
3 視頻編碼方案
視頻編碼技術(shù)是基于MPEG標(biāo)準(zhǔn),MPEG標(biāo)準(zhǔn)的視頻壓縮編碼技術(shù)主要利用了具有運(yùn)動(dòng)補(bǔ)償?shù)膸g壓縮編碼技術(shù)以減小時(shí)間冗余度,利用DCT技術(shù)以減小圖像的空間冗余度,利用熵編碼以減小信息表示方面的統(tǒng)計(jì)冗余度。這幾種技術(shù)的綜合運(yùn)用,大大增強(qiáng)了壓縮性能。
MPEG標(biāo)準(zhǔn)主要有以下五個(gè):MPEG-1, MPEG-2, MPEG-4, MPEG-7和MPEG-21等。這些編碼技術(shù)都是很成熟的技術(shù),在我們的方案中,對(duì)具體原理部分我們就不加以敘述,我們會(huì)比較下各種編碼的優(yōu)缺點(diǎn),然后選擇一種編碼方案作為我們系統(tǒng)的編碼方案。
3.1 基于MPEG-4視頻壓縮
在本系統(tǒng)中,我們選擇MPEG-4編碼技術(shù)作為我們的視頻編碼方案,因?yàn)樵谥暗腗PEG-1,MPEG-2等都是采用第一代壓縮編碼技術(shù),著眼于圖像信號(hào)的統(tǒng)計(jì)特性來(lái)設(shè)計(jì)編碼器,第一代壓縮編碼方案把視頻序列按時(shí)間先后分為一系列幀,每一幀圖像又分成宏塊以進(jìn)行運(yùn)動(dòng)補(bǔ)償和編碼,這種編碼方案存在以下缺陷:(1)將圖像固定地分成相同大小的塊,在高壓縮比情況下會(huì)出現(xiàn)嚴(yán)重塊效應(yīng),即馬賽克效應(yīng);(2)不能對(duì)圖像內(nèi)容進(jìn)行訪問(wèn),編輯和回放等操作;(3)未充分利用人類視覺(jué)系統(tǒng)特性。
MPEG-4采用了新一代視頻編碼技術(shù),它在視頻編碼發(fā)展史上第一次把編碼對(duì)象從圖像幀拓展到具有實(shí)際意義的任意形狀視頻對(duì)象,從而實(shí)現(xiàn)了從基于像素的傳統(tǒng)編碼向基于對(duì)象和內(nèi)容的現(xiàn)代編碼的轉(zhuǎn)變,其核心編碼技術(shù)是基于AV對(duì)象(AVO,Audio visual object)的編碼、存儲(chǔ)、傳輸和組合。
3.2 MPEG-4視頻壓縮關(guān)鍵技術(shù)
MPEG-4除采用第一代視頻編碼的核心技術(shù)外,還提出了一些新的有創(chuàng)建性的關(guān)鍵技術(shù),并在第一代視頻編碼技術(shù)基礎(chǔ)上進(jìn)行了卓有成效的完善和改進(jìn),其關(guān)鍵技術(shù)有:(1)視頻對(duì)象提取技術(shù):MPEG-4實(shí)現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對(duì)象或者把運(yùn)動(dòng)對(duì)象從背景中分離出來(lái),然后針對(duì)不同對(duì)象采用相應(yīng)編碼方法,以實(shí)現(xiàn)高效壓縮,因此視頻對(duì)象提取即視頻對(duì)象分割,是MPEG-4視頻編碼關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點(diǎn)和難點(diǎn)。(2)VOP視頻編碼技術(shù):VOP(視頻對(duì)象平面)是MPEG-4編碼的核心概念,其在編碼過(guò)程中,針對(duì)不同VO采用不同的編碼策略,即對(duì)前景VO的壓縮盡可能保留細(xì)節(jié)和平滑,對(duì)背景VO采用高壓縮率的策略。這種方法不但克服第一代視頻壓縮中的方塊效應(yīng),也提高了壓縮比。(3)運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償技術(shù):MPEG-4采用I-VOP,P-VOP,B-VOP三種幀格式來(lái)表征不同的運(yùn)動(dòng)補(bǔ)償類型。它采用了H.263中的半像素搜索技術(shù)和重疊運(yùn)動(dòng)補(bǔ)償技術(shù),同時(shí)又引入重復(fù)填充技術(shù)和修改塊(多邊形)匹配技術(shù)以支持任意形狀的VOP區(qū)域。
4 語(yǔ)音視頻實(shí)時(shí)遙測(cè)系統(tǒng)的實(shí)現(xiàn)
通過(guò)上面的敘述,我們知道原始語(yǔ)音信號(hào)和視頻信號(hào)的實(shí)時(shí)遙測(cè)非常占用資源,所以我們需要對(duì)其進(jìn)行編碼并壓縮。在本方案中,視頻壓縮支持三路復(fù)合視頻中的一路或者一路S-端子視頻輸入信號(hào)進(jìn)行采樣編碼成數(shù)字信號(hào),然后利用MPEG-4編碼模塊進(jìn)行視頻信號(hào)的壓縮。同時(shí)可以接受另外一路通過(guò)ADPCM編碼原理進(jìn)行壓縮的語(yǔ)音信號(hào),以實(shí)現(xiàn)語(yǔ)音視頻編碼的混合。
MPEG-4視頻信號(hào)和ADPCM語(yǔ)音信號(hào)同時(shí)進(jìn)入到MPEG-2模塊形成一個(gè)MPEG-2傳輸流,一個(gè)MPEG-2傳輸流是某些固定長(zhǎng)度(188字節(jié))的數(shù)據(jù)包。將這些數(shù)據(jù)包按照數(shù)據(jù)采集單元的底板接口通信協(xié)議分解成16位字,以參數(shù)形式插入到標(biāo)準(zhǔn)的IRIG-106 PCM數(shù)據(jù)幀中并進(jìn)行遙測(cè)。
地面接收站接收到遙測(cè)信號(hào)后,通過(guò)地面解調(diào)設(shè)備和軟件將語(yǔ)音信號(hào)和視頻信號(hào)從PCM流中實(shí)時(shí)解調(diào)還原出來(lái)供地面人員監(jiān)控。其系統(tǒng)框圖如圖1所示。
5 結(jié)語(yǔ)
通過(guò)對(duì)語(yǔ)音視頻信號(hào)進(jìn)行數(shù)字編碼,經(jīng)機(jī)載測(cè)試系統(tǒng)的遙測(cè)發(fā)射機(jī)進(jìn)行遙測(cè)發(fā)射,這樣既減小了帶寬,又能使多路視頻信號(hào)通過(guò)一條PCM流遙測(cè)下來(lái);且語(yǔ)音信號(hào)的ADPCM碼可以加入到視頻信號(hào)的MPEG-2流中,進(jìn)行混合編碼,這樣大大提高了效率,也節(jié)省了硬件資源。
按現(xiàn)有飛機(jī)的實(shí)施方案,1路語(yǔ)音加視頻信號(hào)進(jìn)過(guò)PCM編碼后的位速率1.5Mb/s左右,而現(xiàn)有的機(jī)載測(cè)試系統(tǒng)PCM遙測(cè)發(fā)射機(jī)的遙測(cè)帶寬有10Mb/s,這樣1路遙測(cè)系統(tǒng)可以遙測(cè)6路視頻加語(yǔ)音信號(hào),如果用傳統(tǒng)模擬視頻發(fā)射機(jī)就需要6路遙測(cè)系統(tǒng),且飛行員語(yǔ)音還要單獨(dú)外通過(guò)無(wú)線電臺(tái)方式與地面交流。
該方案經(jīng)過(guò)系統(tǒng)調(diào)試和飛行試驗(yàn),能夠?qū)崿F(xiàn)語(yǔ)音和視頻信號(hào)的同步。采用該方案,使用一套PCM遙測(cè)系統(tǒng)可以遙測(cè)多路語(yǔ)音視頻,大大節(jié)約了硬件資源和成本。
參考文獻(xiàn):
[1]廖廣銳,劉萍.基于ADPCM語(yǔ)音壓縮算法研究[J].計(jì)算機(jī)與數(shù)字工程,2007,第7期.
[2]林志鋒,黃華燦,李學(xué)等.ADPCM語(yǔ)音壓縮編解碼器的FPGA實(shí)現(xiàn)[J].數(shù)字信號(hào)處理,2009,第33卷第5期.
[3]戚曉晶,李治國(guó).視頻實(shí)時(shí)傳輸中MPEG-4技術(shù)的應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2012,2月(上).
科技類核心期刊推薦《中國(guó)科技博覽》辦刊宗旨:本刊堅(jiān)持國(guó)家科技創(chuàng)新、教育創(chuàng)新方針,傳播科技理念、報(bào)道科技動(dòng)態(tài)、倡導(dǎo)科技創(chuàng)新、促進(jìn)科技進(jìn)步;廣泛探討交流科技、教育工作成果;多方位、多層次介紹科教創(chuàng)新的前沿性內(nèi)容。征稿對(duì)象:全國(guó)教科研工作者、廣大教師、各級(jí)科技與教育管理部門領(lǐng)導(dǎo)、科研院所、科技教育人員、科教領(lǐng)域管理人員、各大院校的在讀博士生、碩士生及社會(huì)各界關(guān)心科教工作的人士。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見(jiàn)問(wèn)題 >
SCI常見(jiàn)問(wèn)題 >