基於地麵成像高光譜的石碑文字信息提取研究
0 引言
石碑作為古時代的文化產物,它是人類征服自然、改(gai)造(zao)自(zi)然(ran)的(de)物(wu)質(zhi)文(wen)化(hua)結(jie)晶(jing),也(ye)是(shi)古(gu)代(dai)精(jing)神(shen)文(wen)明(ming)的(de)外(wai)在(zai)表(biao)現(xian)。它(ta)作(zuo)為(wei)時(shi)代(dai)界(jie)標(biao)矗(chu)立(li)於(yu)世(shi),見(jian)證(zheng)了(le)中(zhong)國(guo)古(gu)代(dai)社(she)會(hui)曆(li)史(shi)的(de)變(bian)遷(qian),維(wei)係(xi)了(le)時(shi)代(dai)精(jing)神(shen)。然(ran)而(er)現(xian)存(cun)的(de)一(yi)些(xie)石(shi)碑(bei)已(yi)經(jing)破(po)損(sun),表(biao)麵(mian)的(de)文(wen)字(zi)和(he)圖(tu)案(an)信(xin)息(xi)模(mo)糊(hu)不(bu)清(qing),這(zhe)些(xie)石(shi)碑(bei)文(wen)物(wu)不(bu)僅(jin)是(shi)藝(yi)術(shu)作(zuo)品(pin)也(ye)具(ju)有(you)重(zhong)要(yao)的(de)研(yan)究(jiu)價(jia)值(zhi),因(yin)此(ci)保(bao)護(hu)石(shi)碑(bei)就(jiu)是(shi)保(bao)護(hu)珍(zhen)稀(xi)的(de)曆(li)史(shi)文(wen)物(wu),搶(qiang)救(jiu)石(shi)碑(bei)就(jiu)是(shi)搶(qiang)救(jiu)不(bu)可(ke)再(zai)生(sheng)的(de)傳(chuan)統(tong)文(wen)化(hua)。
隨著科學技術的發展,高光譜技術在文物保護中的應用越來越多。高光譜遙感是20世紀80年代興起的新型對地觀測技術,是當前遙感的前沿技術。高gao光guang譜pu數shu據ju具ju有you波bo段duan數shu目mu多duo,波bo段duan寬kuan度du窄zhai,波bo段duan分fen布bu連lian續xu,光guang譜pu分fen辨bian率lv高gao,圖tu譜pu合he一yi等deng特te點dian,基ji於yu高gao光guang譜pu數shu據ju完wan整zheng而er豐feng富fu的de特te點dian,利li用yong高gao光guang譜pu技ji術shu,對dui石shi碑bei上shang存cun在zai的de信xin息xi進jin行xing提ti取qu分fen析xi,以yi期qi提ti取qu和he重zhong現xian石shi碑bei上shang的de原yuan有you信xin息xi。譚克龍等以秦始皇陵區為研究區,較係統地闡述了高光譜遙感在考古中的創新應用研究,以及所取得的考古成果;侯妙樂等基於高光譜數據設計了半自動提取壁畫底稿信息的“三步法”,實現基於特征波段合成影像的壁畫底稿信息提取;Scholten等通過對高光譜影像分析,參考不同墨水的波譜特性,提取了部分底稿的曆史文本信息;郭丹彤對沙巴卡石碑及其學術價值進行了研究,沙巴卡石碑的學術價值體現在語言、政治、宗教等方麵,但它最重要的學術價值則體現在哲學上;田子馥等以7塊(kuai)石(shi)碑(bei)為(wei)實(shi)證(zheng),說(shuo)明(ming)東(dong)北(bei)文(wen)化(hua)從(cong)上(shang)古(gu)時(shi)期(qi)就(jiu)是(shi)以(yi)漢(han)族(zu)漢(han)字(zi)文(wen)化(hua)為(wei)主(zhu)體(ti),多(duo)民(min)族(zu)的(de)文(wen)化(hua)形(xing)成(cheng)多(duo)元(yuan)一(yi)體(ti)的(de)文(wen)化(hua)形(xing)態(tai),並(bing)且(qie)闡(chan)述(shu)了(le)東(dong)北(bei)文(wen)化(hua)主(zhu)體(ti)性(xing)、重疊性、相對性的本質特征。但這些研究的對象都是比較完好的石碑,對於破損和表麵信息模糊缺失的石碑沒有進行應用研究。
本文基於閾值的最小噪聲分離變換(Minimum Noise Fraction Rotation,MNF Rotation)算(suan)法(fa)並(bing)應(ying)用(yong)到(dao)提(ti)取(qu)石(shi)碑(bei)特(te)征(zheng)信(xin)息(xi)中(zhong),分(fen)離(li)了(le)高(gao)光(guang)譜(pu)數(shu)據(ju)中(zhong)的(de)有(you)效(xiao)信(xin)息(xi)和(he)噪(zao)聲(sheng),降(jiang)低(di)了(le)數(shu)據(ju)維(wei)數(shu),並(bing)將(jiang)原(yuan)始(shi)數(shu)據(ju)轉(zhuan)換(huan)到(dao)新(xin)的(de)數(shu)據(ju)空(kong)間(jian)中(zhong),然(ran)後(hou)從(cong)中(zhong)選(xuan)取(qu)體(ti)現(xian)石(shi)碑(bei)特(te)征(zheng)信(xin)息(xi)效(xiao)果(guo)最(zui)好(hao)的(de)特(te)征(zheng)波(bo)段(duan),為(wei)進(jin)一(yi)步(bu)利(li)用(yong)挖(wa)掘(jue)對(dui)石(shi)碑(bei)上(shang)的(de)特(te)征(zheng)信(xin)息(xi)提(ti)供(gong)技(ji)術(shu)基(ji)礎(chu)。
1、 材料與分析
試驗中的石碑分別由北京大學考古文博學院、shanxibowuyuantigong,shibeichutushishibeishangyoubufenbeitufugai,duishibeibiaomianfugaidetucengjinxingjiandandebolichuli,keyikandaoshibeishangyoumohudewenzicunzai。
石碑的高光譜圖像采集是運用四川雙利合譜科技有限公司自主研發的便攜式高光譜成像儀係統GaiaFiled。該係統由多維運動控製器(二維運動控製平台,掃描維度和調焦維度控製平台),成像鏡頭、光譜相機(麵陣探測器)和成像光譜儀組成,支持自動曝光、自動掃描速度匹配、自動調焦等功能。圖1為GaiaField便攜式高光譜成像儀的實體圖,表1為高光譜相機的參數。

圖1 GaiaField便攜式高光譜成像儀實體圖
表1 GaiaFiled高光譜分選儀係統參數
|
序號 |
相關參數 |
V10 |
|
1 |
光譜範圍 |
400-1000 nm |
|
2 |
光譜分辨率 |
4.0±0.3 nm |
|
3 |
像麵尺寸 |
6.45×8.8mm |
|
4 |
倒線色散 |
93.9nm/mm |
|
5 |
相對孔徑 |
F/2.8 |
|
6 |
雜散光 |
<0.5% |
|
7 |
波段數 |
520 |
|
8 |
成像鏡頭 |
23 mm |
圖像采集軟件采用四川雙利合譜科技有限公司提供的高光譜成像係統采集軟件SpecView完成。圖像處理采用 ENVI5.3 軟件進行處理。在進行圖像處理之前,先要對采集的光譜圖像進行圖像校正,圖像校正公式如下:

(1)
式中,Rref 是校正過的圖像,DNraw 是原始圖像,DNwhite為白板校正圖像,DNdark是黑板校正圖像。
試驗得到的光譜含有由儀器和試驗條件等引起的噪聲,對這些噪聲的處理有助於減少噪聲對光譜分析的影響,突出光譜的有效信息。Savitzky-Golay (SG)平滑算法可以有效消減光譜數據中的隨機噪聲,消噪效果受平滑點數的影響,本文中選擇SG二次多項式5點平滑對光譜數據進行處理。
由(you)於(yu)高(gao)光(guang)譜(pu)遙(yao)感(gan)數(shu)據(ju)波(bo)段(duan)多(duo),波(bo)段(duan)間(jian)存(cun)在(zai)很(hen)大(da)相(xiang)關(guan)性(xing),為(wei)了(le)克(ke)服(fu)維(wei)數(shu)災(zai)難(nan),利(li)用(yong)最(zui)小(xiao)噪(zao)聲(sheng)分(fen)離(li)變(bian)換(huan)進(jin)行(xing)波(bo)段(duan)選(xuan)擇(ze),達(da)到(dao)優(you)化(hua)數(shu)據(ju),去(qu)除(chu)噪(zao)聲(sheng)和(he)數(shu)據(ju)降(jiang)維(wei)的(de)目(mu)的(de)。
最小噪聲分離變換( MNF)是對主成分變換( PCA) 的一種改進方法。PCA 是shi一yi種zhong線xian性xing變bian換huan,變bian換huan後hou各ge主zhu成cheng分fen分fen量liang彼bi此ci之zhi間jian互hu不bu相xiang關guan,隨sui著zhe主zhu成cheng分fen的de增zeng加jia該gai分fen量liang包bao含han的de信xin息xi量liang減jian小xiao,第di一yi主zhu成cheng分fen包bao含han的de信xin息xi量liang最zui大da,第di二er主zhu成cheng分fen與yu第di一yi主zhu成cheng分fen無wu關guan且qie在zai剩sheng餘yu成cheng分fen中zhong包bao含han的de信xin息xi量liang最zui大da,依yi此ci類lei推tui。但danPCA對dui噪zao聲sheng比bi較jiao敏min感gan,在zai變bian換huan後hou的de主zhu成cheng分fen分fen量liang中zhong,信xin息xi量liang大da的de信xin噪zao比bi不bu一yi定ding高gao,當dang某mou個ge信xin息xi量liang大da的de主zhu成cheng分fen中zhong包bao含han的de噪zao聲sheng的de方fang差cha大da於yu信xin號hao的de方fang差cha時shi,該gai主zhu成cheng分fen分fen量liang形xing成cheng的de圖tu像xiang質zhi量liang就jiu差cha。針zhen對dui PCA 變換的不足,Green 和 Berman 提出最小噪聲分離變換( MNF),它不但能判定圖像數據內在的維數( 波段數) ,分離數據中的噪聲,而且能減少隨後處理中的計算需求量。MNF 變換是基於圖像質量的線性變換,變換結果的成分按照信噪比從大到小排列。經過MNF變換大部分噪聲集中在特征小的分量中。而不像 PCA變換按照方差由大到小排列,從而克服了噪聲對影像質量的影響。
本文分析的對象由北大考古文博學院、山西博物院提供,如圖 2 所示為使用高光譜成像相機拍攝的數據合成的真彩色圖像。從圖2可知,石碑裏的文字有些已經風化變的模糊不清,難以用肉眼識別出來。


圖2 北大考古文博學院與山西博物院石碑RGB真彩色合成圖(從左到右)
對原始高光譜數據進行 MNF 變換(如圖3) ,分fen別bie得de到dao以yi有you效xiao信xin息xi為wei主zhu的de波bo段duan和he以yi噪zao聲sheng為wei主zhu的de波bo段duan,並bing且qie按an照zhao信xin噪zao比bi從cong大da到dao小xiao的de順shun序xu排pai列lie。原yuan始shi數shu據ju的de主zhu要yao信xin息xi都dou集ji中zhong在zai前qian麵mian特te征zheng值zhi大da的de波bo段duan,後hou麵mian特te征zheng值zhi小xiao的de波bo段duan主zhu要yao以yi噪zao聲sheng為wei主zhu。特te征zheng值zhi接jie近jin於yu1的多數是噪聲,最好選擇特征值高的波段。根據MNF變換特征值曲線確定閾值為 8,選擇變換後的維數為 8。

.jpg)
圖 3 MNF 變換後的特征值曲線(從左到右:考古文博學院、山西博物院)
2.3 特征信息提取分析
在進行 MNF 變換後的波段中,選擇特征值大,圖像信息顯示效果突出的波段。在原始高光譜圖像中右下角可以模糊地看到有圖案存在,分別加載MNF 變換後第 1- 8波段影像,發現北京大學考古文博學院提供的石碑在MNF變換的第 4波段顯示的文字部分較為清晰(圖4a),山西博物院提供的石碑在MNF變換的第1波段顯示的文字較為清晰,如圖4b所示。在MNF變換中,通過信號與噪聲分離,使信息更加集中在有限的特征集中,一些微弱信息則在去噪轉化中被增強。同時在MNF轉化過程中,使光譜特征向類特征向量彙集,增強分類信息。在MNF變換後的特征域中不同的波段具有不同的光譜信息。比如北京大學考古文博學院提供的石碑在變換後的MNF波段1代表整個波段的亮度背景,即光譜背景,在影像上都較其他的MNF波段亮,第8波段以後出現隨機噪聲。

.jpg)
圖4a 北京大學考古文博學院石碑文字信息提取結果對比圖


圖4b 山西博物院石碑文字信息提取結果對比圖
對比原始高光譜數據,由表 2 可知,MNF 變換後的數據量也有效地降低,提高了數據的處理速度。
表 2 數據對比
|
數據 |
北大考古文博院 |
山西博物院 |
|
原始數據 |
598,560 KB |
549,144 KB |
|
MNF變換後數據 |
468,776 KB |
418,631 KB |
針(zhen)對(dui)高(gao)光(guang)譜(pu)數(shu)據(ju)信(xin)息(xi)量(liang)豐(feng)富(fu),但(dan)數(shu)據(ju)冗(rong)餘(yu)且(qie)包(bao)含(han)噪(zao)聲(sheng)的(de)特(te)點(dian),本(ben)文(wen)基(ji)於(yu)最(zui)小(xiao)噪(zao)聲(sheng)分(fen)離(li)變(bian)換(huan)算(suan)法(fa)有(you)效(xiao)地(di)對(dui)石(shi)碑(bei)高(gao)光(guang)譜(pu)圖(tu)像(xiang)進(jin)行(xing)降(jiang)維(wei)和(he)去(qu)噪(zao)處(chu)理(li),分(fen)離(li)了(le)圖(tu)像(xiang)中(zhong)的(de)有(you)效(xiao)信(xin)息(xi)和(he)噪(zao)聲(sheng),減(jian)小(xiao)了(le)後(hou)期(qi)處(chu)理(li)的(de)數(shu)據(ju)量(liang),提(ti)高(gao)了(le)數(shu)據(ju)處(chu)理(li)效(xiao)率(lv)。通(tong)過(guo)對(dui)石(shi)碑(bei)高(gao)光(guang)譜(pu)數(shu)據(ju)進(jin)行(xing)最(zui)小(xiao)噪(zao)聲(sheng)分(fen)離(li)變(bian)換(huan),提(ti)取(qu)了(le)原(yuan)始(shi)影(ying)像(xiang)中(zhong)模(mo)糊(hu)不(bu)清(qing)的(de)文(wen)字(zi),實(shi)驗(yan)結(jie)果(guo)對(dui)於(yu)後(hou)期(qi)石(shi)碑(bei)的(de)文(wen)字(zi)修(xiu)複(fu)和(he)研(yan)究(jiu)提(ti)供(gong)了(le)參(can)考(kao)和(he)借(jie)鑒(jian)。
地址:北京市海澱區中關村大街19號新中關B座北翼1701-1706室
電話:
傳真:
郵箱: