藏文古經(jīng)書是藏族文化寶庫中的明珠。但對(duì)藏文古經(jīng)書的保護(hù)情況卻不容樂觀,古藏文經(jīng)書所采用的藏紙容易腐蝕、變黃。為更好地揭示退化古書所記載的內(nèi)容,提出一種背景估計(jì)與提高對(duì)比度結(jié)合的圖像分割方法。該方法先利用Sauvola算法對(duì)圖像進(jìn)行背景估計(jì),然后用所估計(jì)的背景對(duì)古經(jīng)書進(jìn)行對(duì)比度補(bǔ)償,最后通過二值化算法對(duì)圖像進(jìn)行文本背景的分割。
《貴州大學(xué)學(xué)報(bào)》(藝術(shù)版)遵守編輯工作條例和國家出版工作法規(guī),注重政治性與藝術(shù)性標(biāo)準(zhǔn),以學(xué)術(shù)性為追求目標(biāo),要求論文具有話語的專業(yè)性和學(xué)理性,力求問題探討的深度性和前沿性,思想的高度性和視野的寬廣性。2004年獲全國期刊封面設(shè)計(jì)銀獎(jiǎng)。
藏文古經(jīng)書是藏族文化傳承的重要載體,藏文古經(jīng)書圖像由于其材質(zhì)以及年代久遠(yuǎn)的原因,相對(duì)于普通圖像要復(fù)雜。將一副圖像轉(zhuǎn)變?yōu)楹诎讏D像,即灰度圖,其像素點(diǎn)灰度值分布在0到255之間,也可以說分為從1到256的不同等級(jí)亮度,對(duì)古書進(jìn)行分割處理,就是將古書圖像點(diǎn)的灰度值變?yōu)?或者255,呈現(xiàn)出兩極效果。通過選取合適的閾值,有效地分割圖像的文本與背景,提高古經(jīng)書的可讀性。
近年來,針對(duì)古書分割的研究,學(xué)者們從背景估計(jì)、邊緣檢測、模塊提取、拉普拉斯能量和非線性預(yù)處理等方面展開廣泛研究,同時(shí)也提出了許多二值化算法,這些算法對(duì)于分割藏文古經(jīng)書的研究有很好的借鑒意義。但古藏文經(jīng)書的損壞情況比較嚴(yán)重,以及由于其年代較長,所以有效地分割古經(jīng)書的文本背景,還需要繼續(xù)探索。
1現(xiàn)狀分析
在目前的技術(shù)中,很好地將古藏文經(jīng)書分割還是有一定的難度,因?yàn)樵谠S多圖像處理技術(shù)中,大多都是針對(duì)普通的圖像,如果將這些技術(shù)運(yùn)用在古經(jīng)書的分割處理上,并不會(huì)得到好的效果。古經(jīng)書由于其長時(shí)間的存放以及人們反復(fù)地利用,使得其字符信息含有大量的噪聲。通常古書載體一般為藏紙,藏紙 變黃會(huì)加深背景顏色,變?yōu)楦哳l分量和文字信息混在一起,難以辨別。在圖像分割時(shí)會(huì)同要分割的字符信息一起分離出來,給真正地背景文字分割加大難度。
圖像的二值化算法一般可以分為全局閾值法和局部閾值法。全局閾值法也稱方差最大法;首先選取一個(gè)合適的閾值T,該閾值接近圖像的平均灰度值;然后將圖像分割為兩部分,一部分是灰度值大于T的,另一部分小于或等于T;計(jì)算出兩部分的平均灰度值,將這兩個(gè)新值的平均值重新賦給T。然后重復(fù)前兩步,直到每次計(jì)算的T值接近在自己的誤差范圍內(nèi)。
但該方法會(huì)因?yàn)閳D像光照不均、噪聲干擾較大等原因使的二值化效果變差。將圖像分為大小相同多個(gè)區(qū)域,稱為窗口,根據(jù)每個(gè)窗口的像素點(diǎn)灰度值分布,從而選取不同的閾值,窗口內(nèi)的所有點(diǎn)再根據(jù)選取的閾值進(jìn)行二值化,如對(duì)Niblack算法改進(jìn)后的Sauvola算法,它克服了Niblack算法的不足,其基本思想是將圖像假設(shè)為字符信息灰度值為0,背景點(diǎn)灰度值為255。盡管在字符與背景對(duì)比度比較低的情況下,二值化效果仍然不理想,但可以通過Sauvola算法進(jìn)行背景估計(jì)。
2文本的算法
針對(duì)以上情況,本文提出了基于背景估計(jì)和提高對(duì)比度的二值化算法。主要包含四步:先利用邊緣檢測中最優(yōu)算法Canny算法對(duì)古書圖像字符進(jìn)行檢測,根據(jù)得出的邊緣圖像做筆畫寬度的估計(jì),假設(shè)得出的筆畫寬度為d;然后運(yùn)用Sauvola算法對(duì)古經(jīng)書圖像做粗二值化后為Ba(x,y),根據(jù)字符筆畫寬度d最終得到背景Ib(x,y);從而提高圖像的對(duì)比度,得到I?b(x,y);最后對(duì)圖像做分割處理為B(x,y)。
2.1邊緣檢測
(1)首先將藏文古書圖像轉(zhuǎn)換為灰度圖像I(x,y),利用Canny算子的具體步驟如下,第一步,使用高斯濾波器平滑降噪;第二步,運(yùn)用一對(duì)分別作用于x和y方向的卷積陣列,用下面的公式計(jì)算梯度值和方向;
第三步,對(duì)梯度進(jìn)行非極大值抑制,排除非邊緣因素,確定邊緣;第四步,Canny使用滯后閾值,滯后閾值包括高閾值和低閾值兩部分,來確定被保留下來的邊緣信息。
(2)從圖像左側(cè)開始對(duì)藏文字符進(jìn)行掃描,記初始的d=0,這里做掃描藏文字符一筆的假設(shè),當(dāng)遇到字符邊緣點(diǎn)時(shí)記做m1和其對(duì)應(yīng)的灰度值n,接著向右推進(jìn),如果下一個(gè)灰度值小于n值,但此時(shí)的點(diǎn)并不是邊緣點(diǎn),說明該點(diǎn)在筆畫內(nèi)部,d加1;直到當(dāng)前掃描的位置的點(diǎn)的灰度值大于n或者遇到邊緣點(diǎn),記下位置m2,計(jì)算d=m2-m1。重復(fù)上面的方法,計(jì)算所有藏文字符的筆畫寬度,最終取其中間值作為平均筆畫寬度d。
2.2背景估計(jì)
3 初步實(shí)驗(yàn)結(jié)果
運(yùn)用以上算法,對(duì)一張?jiān)脊沤?jīng)書圖像進(jìn)行測試,以下是前后兩張圖片的對(duì)比,相對(duì)于原圖像有明顯的改善,在閱讀時(shí)可以更好地進(jìn)行記錄或翻譯。
4結(jié)束語
本文針對(duì)藏文古書腐蝕、變黃等情況提出了基于背景估計(jì)和提高對(duì)比度的二值化算法。該算法先利用Canny算子進(jìn)行邊緣檢測,進(jìn)而估計(jì)筆畫寬度;利用估計(jì)的筆畫寬度對(duì)圖像做背景估計(jì),然后提高圖像的對(duì)比度,更好地進(jìn)行古經(jīng)書分割。
另一方面,對(duì)于已經(jīng)被擦除或丟失的文字,不能對(duì)其進(jìn)行修復(fù),從而在分割后圖像上仍然顯示為空;實(shí)驗(yàn)初步成果顯示,部分灰度值特別接近背景的文字將會(huì)同背景一起分割,從而使得這部分文字不會(huì)在這一張圖上顯示,需要重新進(jìn)行閾值的選擇來將這部分分割,這兩點(diǎn)是本文算法的局限性;為此,在以后的改進(jìn)算法中會(huì)克服不足,以達(dá)到理想的效果。
參考文獻(xiàn):
[1] 馮炎.基于對(duì)比度補(bǔ)償?shù)墓偶畧D像二值化研究[J].微電子學(xué)與計(jì)算機(jī),2016,33(4):51-53.
[2] 許海洋,馬龍龍,吳健.基于背景估計(jì)和邊緣檢測的文檔圖像二值化[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(8):197-198.
[3] 唐路路,張啟燦,胡松.一種自適應(yīng)閾值的Canny邊緣檢測算法[J].光電工程,2011,38(5):127-129.
[4] 劉衛(wèi)國.MATLAB程序設(shè)計(jì)與應(yīng)用[M].第二版.北京:高等教育出版社,2006:7-48.
[5] 張雅蘭. 圖像的二值化處理[J]. 廣西科技大學(xué)學(xué)報(bào), 2002, 13(1):32-33.
[6] 王勇智. 數(shù)字圖象的二值化處理技術(shù)探究[J]. 湖南理工學(xué)院學(xué)報(bào)(自科版), 2005, 18(1):31-33.
[7] 江明,劉輝,黃歡.圖像二值化技術(shù)的研究[J].軟件導(dǎo)刊,2009(4):175-177.
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >