本發(fā)明屬于漢語數(shù)字通信設(shè)備。
語言信號(hào)處理可分為識(shí)別、分析、合成和增強(qiáng)等內(nèi)容,通常的聲碼器就是語言分析和語言合成二者的結(jié)合物。目前,最實(shí)用的是斜格網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析和合成的線性預(yù)測(cè)聲碼器,已有技術(shù)已經(jīng)制成了數(shù)碼率為2400比特/秒+階線性預(yù)測(cè)聲碼器。
在數(shù)字通信中,傳輸數(shù)碼率愈低,得益愈大?,F(xiàn)有技術(shù)所研究的極低數(shù)碼率的聲碼器,比較全面地說明了一種“分段式聲碼器”的研究情況。它是適用了雙音(diphone)網(wǎng)絡(luò)、矢量量化、馬爾可夫鏈模型等技術(shù)來得到150比特/秒的數(shù)碼率的。參見文獻(xiàn):“AD報(bào)告:BBN公司窄帶通信研究,1982年11月”(ADAl22838,BoltBeranekandNewmanIncReportNo5231“ResearchonNarrowbandCommunicationNov.1982)。
但是,現(xiàn)有技術(shù)的這種聲碼器所采用的技術(shù),對(duì)于漢語並不適用。因?yàn)闈h語語言是單音節(jié)字構(gòu)成的,相鄰字之間都有空隙,不像西方語言的單詞,是多音節(jié)組成的,所以如文獻(xiàn)ADAl22838所述。西方語言可以用類似于狀態(tài)轉(zhuǎn)移的方法從某一雙音轉(zhuǎn)至另一雙音地進(jìn)行分段,而漢語則不能,因此,漢語的極低數(shù)碼率聲碼器,必須根據(jù)漢語特點(diǎn),另找有效的途徑。
本發(fā)明的目的是:為各種軍用和民用通信電臺(tái)提供碼本,可隨時(shí)更改的、高保密的、實(shí)用的數(shù)字通信信源終端。
本發(fā)明的其它用途是:(1)可作為聲控打字機(jī)(2)可作為同一語種語言之間的翻譯機(jī),(3)可作為人機(jī)對(duì)話的語音接口。
漢語有如下五個(gè)特點(diǎn):(一)漢語是由單音節(jié)字構(gòu)成的,一字一個(gè)音節(jié)、相鄰音節(jié)字之間都有空隙。(二)漢語文字雖有成千上萬,但是存在許多同音字,全部漢語的音節(jié)字只有1300個(gè)左右,同音字對(duì)于漢語語言的傳輸來講是可以不必考慮的。(三)漢語的每個(gè)字可由聲一韻一調(diào)三者組成?;蚯艺f,每個(gè)音節(jié)字可分為聲母和韻母二段,聲母的音長很短,韻母的音長則較長。韻母段的音調(diào)值的變化稱為聲調(diào)。聲母、韻母、聲調(diào)是漢語音節(jié)字的三要素。(四)漢語的聲母只有21個(gè)、漢語的韻母只有38個(gè),漢語的聲調(diào)只有四種(陰平、陽平、上、去)。如果將聲調(diào)考慮在韻母中,並稱為調(diào)母,則漢語的調(diào)母只有143個(gè)。所以,可以認(rèn)為:漢語是由22個(gè)聲母(21個(gè)聲母加上零聲母)和143個(gè)調(diào)母所組成的1300個(gè)左右的音節(jié)字構(gòu)成的。所謂零聲母是指只有韻(調(diào))母的情況,因?yàn)闈h語中允許沒有聲母,但必須有調(diào)母。(五)漢語的講話的速度,平均為5字/秒左右。
本發(fā)明根據(jù)漢語的上述特點(diǎn),設(shè)計(jì)了專用于漢語的極低數(shù)碼率聲碼器-漢語識(shí)別聲碼器,其基本思想如下:
用漢語標(biāo)準(zhǔn)北京話的全部音節(jié)字做成的語音庫,對(duì)發(fā)送端講話者的輸入語言進(jìn)行識(shí)別,將識(shí)別出庫字的地址碼通過信道傳輸給對(duì)方;用同一語音庫,接收端按接收的庫字地址碼找出庫中該字參數(shù),合成出語言輸出。從而,完成了具有良好可懂度和清晰度的通信,這種只傳送庫地址碼的方法,其傳輸數(shù)碼率在理論上是最低的。此外,為了使接收端的輸出語言具有良好的自然度,信道中還應(yīng)附送講話者的各音節(jié)字的音長和音調(diào)值。
圖1為雙工工作的甲乙二方,分別使用二臺(tái)漢語識(shí)別聲碼器(1)(2)進(jìn)行信道通信情況。
圖1的工作過程簡述如下,任一方聲碼器在發(fā)話時(shí),講話者輸入的語言信號(hào)(3),先經(jīng)過語言分析器(5),抽取其聲學(xué)參數(shù),然后送給語言識(shí)別器(6),識(shí)別器將該輸入語言聲學(xué)參數(shù)與語音庫(7)中全部漢語單音節(jié)字的聲學(xué)參數(shù)一一進(jìn)行識(shí)別判決。識(shí)別出的庫字的地址碼就作為信息發(fā)送給接收端。當(dāng)聲碼器在收話時(shí),從對(duì)方送來的庫字地址碼,就可調(diào)出該字的庫中的聲學(xué)參數(shù),送給語言合成器(8),人工地產(chǎn)生語言信號(hào)(4),使喇叭發(fā)出聲音。
現(xiàn)將圖1中所采用的技術(shù)說明如下,首先敘述其中的一般聲碼器技術(shù),即語言分析和語言合成二個(gè)技術(shù)。
(一)、語言分析技術(shù)(5),這個(gè)方框包括預(yù)處理,聲道參數(shù)分析,音調(diào)檢測(cè)和編碼四個(gè)部分:
a、預(yù)處理的功用是:將輸入語言信號(hào)進(jìn)行放大和自動(dòng)增益控制,然后進(jìn)行反混迭濾波和模數(shù)變換,最后進(jìn)行數(shù)字的高頻預(yù)加重。
由于講話者的聲音幅度變化范圍很大,所以放大和自動(dòng)增益控制是必要的,它使后面的模數(shù)變換能最大限度地發(fā)揮其精度而又不產(chǎn)生飽和失真。據(jù)取樣定理,取樣頻率必須大于二倍輸入信號(hào)的最高頻率分量,所以對(duì)于語言信號(hào),可用止帶為3.4KH2的模擬低通濾波器進(jìn)行濾波,並取用8KHZ取樣頻率的模數(shù)變換,按照數(shù)字系統(tǒng)信噪比大于60分貝的要求,模數(shù)變換的字長應(yīng)為12比特。高頻預(yù)加重的目的是人工抵消語言信號(hào)的口唇幅射效應(yīng),使后面的聲學(xué)分析簡化為只考慮聲道參數(shù)和音調(diào)檢測(cè)二項(xiàng),也就是說,在此之后的語言信號(hào)可視為準(zhǔn)周期脈沖串或白噪聲的激勵(lì)信號(hào)與聲道響應(yīng)二者的卷積、通常高頻預(yù)加重是一階的數(shù)字高通濾波運(yùn)算。
b、聲道參數(shù)分析的目的就是求出上述聲道響應(yīng)的表征參數(shù),聲道參數(shù)有頻譜、倒譜和線性預(yù)測(cè)參數(shù)等幾種,各有優(yōu)缺點(diǎn),從解決實(shí)時(shí)性和精度的矛盾來看,目前多用線性預(yù)測(cè)方法,但是隨著快速專用器件的進(jìn)展,倒譜的精度是最好的。
c、音調(diào)檢測(cè)的目的是求出激勵(lì)信號(hào)的屬性(是濁音的準(zhǔn)周期脈沖還是清音的白噪聲)及脈沖時(shí)的重復(fù)頻率。對(duì)于漢語音調(diào)是重要的,因?yàn)椴煌囊粽{(diào)同一拼音會(huì)代表不同含意的字。音調(diào)檢測(cè)的方法隨聲道參數(shù)分析方法而異。如用線性預(yù)測(cè)法,則音調(diào)檢測(cè)可用“逆濾波-簡化-平均幅差函數(shù)”法,如是倒譜分析,則可用“高時(shí)窗-自相關(guān)”法。
d、編碼技術(shù)是指將上述所分析的各種參數(shù)(聲道參數(shù)、增益和音調(diào))進(jìn)行量化,根據(jù)各種參數(shù)的統(tǒng)計(jì)規(guī)律,恰當(dāng)?shù)剡x用量化方法和量化字長,例如在線性預(yù)測(cè)的聲道參數(shù)情況,量化方法采用對(duì)數(shù)面積比的最佳編碼,十階參數(shù)的量化字長可分別用5、5、4、4、4、4、3、3、3、3比特,例如增益和音調(diào)都可用對(duì)數(shù)量化,分別皆用5比特。
分析和編碼的總目的是有效地壓縮和規(guī)整所分析的參數(shù)。
(二)語言合成技術(shù)(8):這個(gè)方框包括解碼、合成、數(shù)模變換與平滑濾波、功率放大與喇叭等四個(gè)部分。
a、介碼的功用是解開分析時(shí)的編碼,使之恢復(fù)參數(shù)的本來面目。
b、合成的功用是將介碼后的參數(shù)恢復(fù)為語言信號(hào),是分析的逆過程。所以可以用線性預(yù)測(cè)的逆濾波網(wǎng)絡(luò)或用逆倒譜網(wǎng)絡(luò)來合成語言。
c、數(shù)模變換和平滑濾波。
合成的語言是數(shù)字信號(hào),將這些數(shù)字信號(hào)恢復(fù)為人耳能聽的模擬信號(hào),就要進(jìn)行數(shù)模變換。通常數(shù)模變換的精度用8比特就足夠了。但是這種電壓樣點(diǎn)序列附有討厭的高頻干擾(因是階梯波),所以又必須用模擬低通濾波器進(jìn)行平滑。平滑濾波器的要求與反混迭濾波器相似。
d、最后是通過功率放大器,使喇叭發(fā)出聲音。
除了上面一般聲碼器的技術(shù)(分析與合成)之外,本發(fā)明還要用到如下特征技術(shù):分段技術(shù),識(shí)別技術(shù)、建立語音庫技術(shù)和多講話者技術(shù)。
分段技術(shù)應(yīng)屬于語言分析部分,它是指將人們講話所發(fā)出的語言信號(hào),經(jīng)過預(yù)處理后在聲學(xué)分析之前的一種處理技術(shù)。因?yàn)橹v話信號(hào)是語言流,計(jì)算技術(shù)不可能對(duì)無限樣點(diǎn)的數(shù)字信號(hào)進(jìn)行處理,只能分段地進(jìn)行處理。另一方面分段又必須按漢語語言,特點(diǎn)來進(jìn)行,因?yàn)闈h語的各段,其聲道參數(shù)、音調(diào)的情況是不同的,所以分段技術(shù)又包括:將連續(xù)語言分為音節(jié)字段和無語言的背景寂靜段的分段、將音節(jié)字分為聲母段和調(diào)母段的分段二個(gè)分段過程。這里所講的分段是指自動(dòng)分段技術(shù),不是指人工分段而言。我們對(duì)這二種分段采用了聯(lián)合的“平均越零率”和“平均能量”的測(cè)量,用經(jīng)過多次試驗(yàn)的門限閥值進(jìn)行判斷來實(shí)現(xiàn)的。這樣,可以達(dá)到90%以上的分段準(zhǔn)確率。其根據(jù)是:背景寂靜段的越零率較低、能量最小;音節(jié)字段的越零率和能量都比背景寂靜段高和大;聲母段的越零率最高、能量較小;調(diào)母段的越零率最低、能量最大。判決的關(guān)鍵在于對(duì)各種段采用不同的門限閥值這是由漢語統(tǒng)計(jì)特性配合人工分段核對(duì)的方法來確定的。由于閥值還與語言信號(hào)幅度有關(guān),所以采用了前述的自動(dòng)增益控制部件。
本發(fā)明的獨(dú)特之處在于識(shí)別技術(shù),可以想象:如果將講話者的語言信號(hào)經(jīng)過分段后進(jìn)行了聲道參數(shù)、幅值和音調(diào)的分析,構(gòu)成了聲學(xué)參數(shù)的矩陣,接著再將它與語音庫的全部1300個(gè)左右的字的聲學(xué)參數(shù)的矩陣一一加以識(shí)別,最后才得到識(shí)別的判決(決策)。這樣做法運(yùn)算量太大,難于做到實(shí)時(shí)識(shí)別。因此,本發(fā)明提出了一種二級(jí)識(shí)別的技術(shù)。它也是根據(jù)漢語語言特點(diǎn)而提出的。第一級(jí)識(shí)別稱為聲母調(diào)母的識(shí)別,第二級(jí)識(shí)別稱為音節(jié)字的識(shí)別。這種技術(shù)的框圖見圖2。
現(xiàn)將圖2的二級(jí)識(shí)別過程說明如下
按照分段技術(shù)和語言分析技術(shù),已經(jīng)得到圖2中的聲母段聲學(xué)參數(shù)矢量(9),過渡段聲學(xué)參數(shù)矢量(11)和調(diào)母段五幀聲學(xué)參數(shù)矩陣(10)三種信號(hào)參數(shù)。同樣,假設(shè)已經(jīng)建成二個(gè)語音庫(14),(16),第一語音庫中又含有聲母庫(14a)和調(diào)母庫(14b)二個(gè)子庫,而第二語音庫則是漢語音節(jié)字庫。這些庫中已分別存有21個(gè)聲母的聲學(xué)參數(shù)矢量、143個(gè)調(diào)母的五幀的聲學(xué)參數(shù)矩陣、1300個(gè)左右的漢字的聲學(xué)參數(shù)矩陣。
按圖2進(jìn)行二級(jí)識(shí)別的過程如下:
第一級(jí)識(shí)別是:先分別用參數(shù)(9)和(10)與聲母庫(14a)和調(diào)母庫(14b)的參數(shù),在聲母識(shí)別器(12)和調(diào)母識(shí)別器(13)中進(jìn)行識(shí)別。識(shí)別的距離可以有歐氏距離等幾種,但是對(duì)于語言識(shí)別,效果最好的是采用板倉(Itakura)距離。對(duì)于第二級(jí)識(shí)別也采用板倉距離作為識(shí)別距離,識(shí)別可能不是精確的,假設(shè)這第一級(jí)識(shí)別的結(jié)果是:對(duì)某個(gè)音節(jié)字,可能有M個(gè)聲母和N個(gè)調(diào)母是相近的(即識(shí)別的距離是較小的)。我們就稱這M個(gè)聲母為候選聲母,這N個(gè)調(diào)母為候選調(diào)母。它們一定分別地比21和143小得多。在這個(gè)后,可以設(shè)計(jì)一個(gè)邏輯組合電路(7),來產(chǎn)生聲母與調(diào)母結(jié)合的所有可能的音節(jié)字地址。再進(jìn)行第二級(jí)識(shí)別,即音節(jié)字的識(shí)別,此時(shí)將一個(gè)音節(jié)字的所有三段聲學(xué)參數(shù)(9),(10),(11)送入音節(jié)字識(shí)別器(17),與第二語音庫(16)中相應(yīng)聲學(xué)參數(shù)進(jìn)行識(shí)別。第二級(jí)識(shí)別只須與(M.N)個(gè)庫字的參數(shù)進(jìn)行識(shí)別,取最小距離的字作為識(shí)別結(jié)果(18),輸出其庫地址碼。由于M·N<<1300,所以運(yùn)算量大大減少,識(shí)別率倒可能提高了。這就是本發(fā)明的二級(jí)識(shí)別的技術(shù)。還應(yīng)指出,本發(fā)明的識(shí)別技術(shù)的另一個(gè)優(yōu)點(diǎn),由上可見,無論輸入語言信號(hào)的任何一個(gè)音節(jié)字,總是被分為聲母段,過渡段和五個(gè)調(diào)母幀,或且說,無論該音節(jié)字的輸入信號(hào)的長度有多長,總是被作為七幀來分析。所以,總是七個(gè)聲學(xué)參數(shù)矢量構(gòu)成矩陣代表一個(gè)音節(jié)字、總是一個(gè)聲學(xué)參數(shù)矢量代表一個(gè)聲母,總是一個(gè)聲學(xué)參數(shù)矢量代表一個(gè)過渡段、五個(gè)聲學(xué)參數(shù)矢量構(gòu)成矩陣代表一個(gè)調(diào)母。庫中也是這樣分布。因此,識(shí)別過程不需要很麻煩的“動(dòng)態(tài)規(guī)劃和時(shí)間扭曲匹配法”的、一面進(jìn)行匹配一面進(jìn)行距離計(jì)算的方法。
為適應(yīng)上述二級(jí)識(shí)別的技術(shù),本發(fā)明提出了漢語的獨(dú)特的建立二個(gè)語音庫的方法。當(dāng)然,庫中的所有參數(shù)都是用標(biāo)準(zhǔn)北京話的音節(jié)字的錄音來做成的。這些聲學(xué)參數(shù)的分析又都是在電子計(jì)算機(jī)上分析得到的。庫的器件都是用EPROM。不過如果采用“訓(xùn)練”的方式,臨時(shí)分析某個(gè)人,某種非標(biāo)準(zhǔn)北京話的聲學(xué)參數(shù)存放在RAM內(nèi),也是可以的。本發(fā)明建立二個(gè)語音庫的過程見圖3。
現(xiàn)將圖3建庫過程說明如下:將預(yù)處理后的標(biāo)準(zhǔn)北京話語言信號(hào)(19)送入聲學(xué)分析器(20),它基本上就是語言分析器,不同之處僅在于除了分析得到聲道參數(shù)和音調(diào)值外,還輸出分段時(shí)所得到各段的長度(音長),而且其中過渡段的長度固定地是由聲母段的后5ms和調(diào)母段的前15ms所組成的20ms長度。
由此,聲學(xué)分析后將得到:聲母段聲道參數(shù)(21),聲母段長度(22),聲母段音調(diào)(23),過渡段聲道參數(shù)(24),過渡段音調(diào)(25),調(diào)母段五幀聲道參數(shù)(26),調(diào)母段長度(27),調(diào)母段五幀音調(diào)(28)八個(gè)參數(shù)。然后將其中的(21)、(23)參數(shù)構(gòu)成聲母段聲學(xué)參數(shù)矢量送入聲母庫(29),將其中的(26),(28)參數(shù)構(gòu)成調(diào)母段聲學(xué)參數(shù)矩陣送入調(diào)母庫(30),而將其中的(21)、(23)、(26)、(28)參數(shù)構(gòu)成音節(jié)字的聲學(xué)參數(shù)矩陣送入音節(jié)字庫(31),從而完成建庫工作。此外,分析所得的聲母段長度(22),調(diào)母段長度(27),聲母段音調(diào)(23)以及調(diào)母段五幀音調(diào)(28)送給信道,以提高聲碼器的語言自然度。
本發(fā)明的最后一項(xiàng)特征技術(shù),稱為多講話者技術(shù)。這包含二個(gè)內(nèi)容:多講話者識(shí)別技術(shù)和多講話者合成技術(shù)。多講話者識(shí)別技術(shù)是解決不同的講話者,講同一個(gè)音節(jié)字時(shí)能否準(zhǔn)確地皆識(shí)別判決出該字的問題。多講話者合成技術(shù)是解決聲碼器接收講話者庫地址來合成語言時(shí)能否更大程度上接近于講話者的特征的問題。
第一種問題的解決辦法是:對(duì)于同一個(gè)音節(jié)字,對(duì)不同講話者的語言信號(hào)進(jìn)行分析,得出各講話者同一音節(jié)字的各聲學(xué)參數(shù),然后,采用叢聚技術(shù),求出它們的重心,用重心所代表的聲學(xué)參數(shù)作為語音庫的參數(shù)。這樣,就解決了適應(yīng)多講話者的識(shí)別率問題,已有若干種叢聚技術(shù)的研究成果,如:K平均遞歸法、最近鄰域法、非均勻二元叢聚法等。作為初步,先采用K平均遞歸法。
第二種問題的解決辦法是這樣的,圖3中聲學(xué)分析所得的聲學(xué)參數(shù),除用于建庫外,其中的音長和音調(diào),按段按幀地都傳送到信道中去,所以接收端合成出來的語言,具有講話者的音調(diào)特征和各字各段的音長特征了。這樣,受話者可以聽出講話者是男是女、判斷出多大年齡、講某些字的長度的習(xí)慣等。如果為了進(jìn)一步逼真講話者的聲音,信道中除了上述附加信息之外,還應(yīng)該傳送講話者的長時(shí)平均頻譜和講話者的聲道長度形狀等特征信息。但是,本發(fā)明采用了另一種有效的簡便方法,來解決這個(gè)進(jìn)一步逼真的問題。這就是擴(kuò)大語音庫容量的技術(shù)。因?yàn)?,現(xiàn)代集成電路的規(guī)模愈來愈大,增加庫的容量比較易于實(shí)現(xiàn),這樣,可以專為某個(gè)重要人物(例如戰(zhàn)場(chǎng)上的指揮官,其下級(jí)必須聽清是他發(fā)布命令,才可執(zhí)行的情況)制造他的語音庫,那么,效果將比附加長時(shí)平均頻譜和聲道長度與形狀的方法還要好,而技術(shù)上困難反而少得多,從而園滿地解決了所提出的問題。
本發(fā)明的技術(shù)效果主要指數(shù)碼率和通信話音的質(zhì)量。
數(shù)碼率問題,前已指出,全部漢語語言只有1300個(gè)左右的音節(jié)字,前又指出,若為了解決多講話者合成問題可考慮擴(kuò)大庫容量,設(shè)為三倍時(shí),則庫字至多為4096個(gè),庫地址用二進(jìn)制碼表示時(shí),字碼長為12比特。前又指出,漢語講話的平均速度為5字/秒。所以,基本的傳輸數(shù)碼率為5×12=60比特/秒。其次,為了傳送聲母段長度、聲母段首幀音調(diào)四個(gè)參數(shù),再加上一個(gè)幅值因子,合計(jì)每字附送五個(gè)參數(shù),設(shè)每個(gè)參數(shù)平均用5比特量化,那么,每秒附加的數(shù)碼應(yīng)為5字×5參數(shù)×5比特=75比特。總計(jì)數(shù)碼率為60+75=135比特/秒,超過外國的150比特/秒的效果和水平,附帶說明的是:由于調(diào)母已含有聲調(diào)信息,所以附加傳送時(shí),只須附送調(diào)母段首幀的音調(diào)值即已足夠了;另外,當(dāng)信道有誤碼時(shí),只要求信道機(jī)在糾錯(cuò)中只重重點(diǎn)保護(hù)基本碼(庫地址)就可以了這便于信道機(jī)的設(shè)計(jì)。
話音質(zhì)量問題,由于本發(fā)明的語音庫的聲學(xué)參數(shù)和矩陣都是用北京話建立起來的,而且是在靜噪環(huán)境下錄制的廣播員的發(fā)音,所以本發(fā)明所合成出來的語言,其可懂度和清晰度比任何種類的聲碼器都要優(yōu)越。當(dāng)然,這要有一個(gè)前提,識(shí)別率要足夠高,否則雖然清晰,卻不可懂也不自然,信息丟失或出錯(cuò)。不過,這個(gè)問題不是很大的,除了本發(fā)明中已采用了二級(jí)識(shí)別技術(shù)以提高識(shí)別率之外,可以指出:由于在語言通信中受話者也是人,而人是具有思維邏輯判斷能力的,所以,識(shí)別率有80%左右就可以實(shí)現(xiàn)滿意的通信了。國外對(duì)于連續(xù)語言的識(shí)別的研究也證實(shí)了這個(gè)結(jié)論。本發(fā)明又采取了附加發(fā)送音調(diào)音長等參數(shù)碼和擴(kuò)大語音庫容量的措施,使多講話者通信的要求得到一定程度的滿足,由上所述,本發(fā)明的聲碼器的話音質(zhì)量是好的。
圖1為本發(fā)明的技術(shù)總框圖
圖2為本發(fā)明的識(shí)別技術(shù)框圖
圖3為本發(fā)明建立二個(gè)語音庫過程的示意圖
圖4為本發(fā)明的實(shí)施結(jié)構(gòu)框圖
本發(fā)明的硬件實(shí)施方案的框圖見圖4
現(xiàn)按聲碼器的發(fā)話和受話二種情況,說明其工作過程和關(guān)鍵器件如下:
(一)發(fā)話狀態(tài)。講話者輸入信號(hào)(32),送入可控衰減的放大器(36),放大量保證模數(shù)變換的精度和不產(chǎn)生飽和,然后送入反混迭濾波器(37),該濾波器可用九階橢園低通濾波器來完成。其技術(shù)指標(biāo)為:通帶波動(dòng)小于1db,通帶為0-3.4KHz,止帶始點(diǎn)為3.9KHz,止帶衰減為70db,這個(gè)濾波器可用運(yùn)算放大器構(gòu)成的有源模擬低通濾波器的方法實(shí)現(xiàn)。然后送給模數(shù)變換器(38),其取樣率為8KHz,位數(shù)為12比特。取樣后的信號(hào),一方面送入母線B1,另一方面送給數(shù)字自動(dòng)增益控制(39),該控制器工作于,“AD飽和則快速衰減”和“AD不飽和則慢速提升”方式,這可用z-80微處理器來實(shí)現(xiàn),它用2%左右的樣點(diǎn)的時(shí)間計(jì)算幅值或能量,經(jīng)過數(shù)字衰減器轉(zhuǎn)換為模擬電壓控制放大器(36)的增益,快衰減時(shí)為3db/步,慢衰減時(shí)為1.5db/步,慢提升時(shí)也是1.5db/步,模數(shù)變換器用AD574集成電路來完成。
送入母線B1的上述數(shù)字信號(hào),先放在數(shù)據(jù)存儲(chǔ)器(42)中以供運(yùn)算使用。由程序控制器(40)調(diào)用程序存儲(chǔ)器(44)中的預(yù)加重、聲學(xué)分析、識(shí)別、編碼以及p/s程序,通過運(yùn)算器(41)的運(yùn)算,得出各段聲學(xué)參數(shù)矢量或矩陣,以及得出各段音調(diào)、音長等參數(shù)。前者與語音庫(45)進(jìn)行二級(jí)識(shí)別運(yùn)算,得出識(shí)別字的庫地址碼。最后,對(duì)此庫地址碼以及前面得到的各段音調(diào)、音長等參數(shù)進(jìn)行編碼運(yùn)算,並將結(jié)果通過p/s變換器(46)將并行的拜特變換為串行的比特流(33),送給信道。
當(dāng)然,上述調(diào)用程序進(jìn)行預(yù)加重、分析、識(shí)別、編碼等運(yùn)算時(shí)要用到一些系數(shù)和表格,例如預(yù)加重的濾波系數(shù),分析與識(shí)別的窗口函數(shù)以及一些必要的數(shù)學(xué)函數(shù)、編碼表等,這些系數(shù)和表格都已預(yù)先存放在系數(shù)表格存儲(chǔ)器(43)中。
程序控制器(40)是用邏輯器件如D觸發(fā)器等搭成的,運(yùn)算器(41)是本設(shè)備的關(guān)鍵部件根據(jù)實(shí)時(shí)和精度等方面的要求,采用TMS32010數(shù)字處理器(這種集成電路含有32比特的CPU和(16×16)乘法器,200ns時(shí)鐘)和μPD7764D識(shí)別距離專用集成電路來組成。數(shù)據(jù)存儲(chǔ)器(42)用AM9167組成。系數(shù)表格存儲(chǔ)器(43)、程序存儲(chǔ)器(44)以及語音庫(45)都用AM27128EPROM組成。p/s變換則是用軟件來實(shí)現(xiàn)的。
(二)受話狀態(tài)。從信道送來的對(duì)方庫地址碼和對(duì)方講話的音調(diào)音長數(shù)的輸入串行比特流(34),先經(jīng)過s/p變換(47)轉(zhuǎn)變?yōu)椴⑿邪萏財(cái)?shù)據(jù)送入數(shù)據(jù)存儲(chǔ)器(42)中待用,由程序控制器(40)調(diào)用程序存儲(chǔ)器(44)中的解碼和合成程序,從語音庫(45)中取出參數(shù),通過運(yùn)算器(41)的運(yùn)算,得出恢復(fù)對(duì)方語言的數(shù)字信號(hào)。當(dāng)然,在這過程中,也要用到系數(shù)表格存儲(chǔ)器(43)中的數(shù)據(jù)。最后,將所恢復(fù)的數(shù)字語言信號(hào)通過數(shù)模變換器(48),平滑濾波器(49),功放(50)使喇叭發(fā)出對(duì)方講話的語言(35)。數(shù)模變換器(48)和模數(shù)變換(38)的工作時(shí)鐘當(dāng)然要受運(yùn)算器定時(shí)的同步控制。數(shù)模變換器(48)可用AD558集成電路來完成,其速度為8KHz,位數(shù)為8比特。平滑濾波器(49)也是模擬低通濾波器,其技術(shù)指標(biāo)與實(shí)現(xiàn)方法皆與反混迭濾波器(37)相同,僅其中止帶衰減指標(biāo)可降為60db.s/p變換也是用軟件來實(shí)現(xiàn)的。