基於地麵成像高光譜的石碑文字信息提取研究
0 引言
石碑作為古時代的文化產物,它是人類征服自然、改gai造zao自zi然ran的de物wu質zhi文wen化hua結jie晶jing,也ye是shi古gu代dai精jing神shen文wen明ming的de外wai在zai表biao現xian。它ta作zuo為wei時shi代dai界jie標biao矗chu立li於yu世shi,見jian證zheng了le中zhong國guo古gu代dai社she會hui曆li史shi的de變bian遷qian,維wei係xi了le時shi代dai精jing神shen。然ran而er現xian存cun的de一yi些xie石shi碑bei已yi經jing破po損sun,表biao麵mian的de文wen字zi和he圖tu案an信xin息xi模mo糊hu不bu清qing,這zhe些xie石shi碑bei文wen物wu不bu僅jin是shi藝yi術shu作zuo品pin也ye具ju有you重zhong要yao的de研yan究jiu價jia值zhi,因yin此ci保bao護hu石shi碑bei就jiu是shi保bao護hu珍zhen稀xi的de曆li史shi文wen物wu,搶qiang救jiu石shi碑bei就jiu是shi搶qiang救jiu不bu可ke再zai生sheng的de傳chuan統tong文wen化hua。
隨著科學技術的發展,高光譜技術在文物保護中的應用越來越多。高光譜遙感是20世紀80年代興起的新型對地觀測技術,是當前遙感的前沿技術。gaoguangpushujujuyouboduanshumuduo,boduankuanduzhai,boduanfenbulianxu,guangpufenbianlvgao,tupuheyidengtedian,jiyugaoguangpushujuwanzhengerfengfudetedian,liyonggaoguangpujishu,duishibeishangcunzaidexinxijinxingtiqufenxi,yiqitiquhezhongxianshibeishangdeyuanyouxinxi。譚克龍等以秦始皇陵區為研究區,較係統地闡述了高光譜遙感在考古中的創新應用研究,以及所取得的考古成果;侯妙樂等基於高光譜數據設計了半自動提取壁畫底稿信息的“三步法”,實現基於特征波段合成影像的壁畫底稿信息提取;Scholten等通過對高光譜影像分析,參考不同墨水的波譜特性,提取了部分底稿的曆史文本信息;郭丹彤對沙巴卡石碑及其學術價值進行了研究,沙巴卡石碑的學術價值體現在語言、政治、宗教等方麵,但它最重要的學術價值則體現在哲學上;田子馥等以7塊(kuai)石(shi)碑(bei)為(wei)實(shi)證(zheng),說(shuo)明(ming)東(dong)北(bei)文(wen)化(hua)從(cong)上(shang)古(gu)時(shi)期(qi)就(jiu)是(shi)以(yi)漢(han)族(zu)漢(han)字(zi)文(wen)化(hua)為(wei)主(zhu)體(ti),多(duo)民(min)族(zu)的(de)文(wen)化(hua)形(xing)成(cheng)多(duo)元(yuan)一(yi)體(ti)的(de)文(wen)化(hua)形(xing)態(tai),並(bing)且(qie)闡(chan)述(shu)了(le)東(dong)北(bei)文(wen)化(hua)主(zhu)體(ti)性(xing)、重疊性、相對性的本質特征。但這些研究的對象都是比較完好的石碑,對於破損和表麵信息模糊缺失的石碑沒有進行應用研究。
本文基於閾值的最小噪聲分離變換(Minimum Noise Fraction Rotation,MNF Rotation)算(suan)法(fa)並(bing)應(ying)用(yong)到(dao)提(ti)取(qu)石(shi)碑(bei)特(te)征(zheng)信(xin)息(xi)中(zhong),分(fen)離(li)了(le)高(gao)光(guang)譜(pu)數(shu)據(ju)中(zhong)的(de)有(you)效(xiao)信(xin)息(xi)和(he)噪(zao)聲(sheng),降(jiang)低(di)了(le)數(shu)據(ju)維(wei)數(shu),並(bing)將(jiang)原(yuan)始(shi)數(shu)據(ju)轉(zhuan)換(huan)到(dao)新(xin)的(de)數(shu)據(ju)空(kong)間(jian)中(zhong),然(ran)後(hou)從(cong)中(zhong)選(xuan)取(qu)體(ti)現(xian)石(shi)碑(bei)特(te)征(zheng)信(xin)息(xi)效(xiao)果(guo)最(zui)好(hao)的(de)特(te)征(zheng)波(bo)段(duan),為(wei)進(jin)一(yi)步(bu)利(li)用(yong)挖(wa)掘(jue)對(dui)石(shi)碑(bei)上(shang)的(de)特(te)征(zheng)信(xin)息(xi)提(ti)供(gong)技(ji)術(shu)基(ji)礎(chu)。
1、 材料與分析
試驗中的石碑分別由北京大學考古文博學院、山shan西xi博bo物wu院yuan提ti供gong,石shi碑bei出chu土tu時shi石shi碑bei上shang有you部bu分fen被bei土tu覆fu蓋gai,對dui石shi碑bei表biao麵mian覆fu蓋gai的de土tu層ceng進jin行xing簡jian單dan的de剝bo離li處chu理li,可ke以yi看kan到dao石shi碑bei上shang有you模mo糊hu的de文wen字zi存cun在zai。
石碑的高光譜圖像采集是運用江蘇雙利合譜科技有限公司自主研發的便攜式高光譜成像儀係統GaiaFiled。該係統由多維運動控製器(二維運動控製平台,掃描維度和調焦維度控製平台),成像鏡頭、光譜相機(麵陣探測器)和成像光譜儀組成,支持自動曝光、自動掃描速度匹配、自動調焦等功能。圖1為GaiaField便攜式高光譜成像儀的實體圖,表1為高光譜相機的參數。

圖1 GaiaField便攜式高光譜成像儀實體圖
表1 GaiaFiled高光譜分選儀係統參數
|
序號 |
相關參數 |
V10 |
|
1 |
光譜範圍 |
400-1000 nm |
|
2 |
光譜分辨率 |
4.0±0.3 nm |
|
3 |
像麵尺寸 |
6.45×8.8mm |
|
4 |
倒線色散 |
93.9nm/mm |
|
5 |
相對孔徑 |
F/2.8 |
|
6 |
雜散光 |
<0.5% |
|
7 |
波段數 |
520 |
|
8 |
成像鏡頭 |
23 mm |
圖像采集軟件采用江蘇雙利合譜科技有限公司提供的高光譜成像係統采集軟件SpecView完成。圖像處理采用 ENVI5.3 軟件進行處理。在進行圖像處理之前,先要對采集的光譜圖像進行圖像校正,圖像校正公式如下:
(1)
式中,Rref 是校正過的圖像,DNraw 是原始圖像,DNwhite為白板校正圖像,DNdark是黑板校正圖像。
試驗得到的光譜含有由儀器和試驗條件等引起的噪聲,對這些噪聲的處理有助於減少噪聲對光譜分析的影響,突出光譜的有效信息。Savitzky-Golay (SG)平滑算法可以有效消減光譜數據中的隨機噪聲,消噪效果受平滑點數的影響,本文中選擇SG二次多項式5點平滑對光譜數據進行處理。
由(you)於(yu)高(gao)光(guang)譜(pu)遙(yao)感(gan)數(shu)據(ju)波(bo)段(duan)多(duo),波(bo)段(duan)間(jian)存(cun)在(zai)很(hen)大(da)相(xiang)關(guan)性(xing),為(wei)了(le)克(ke)服(fu)維(wei)數(shu)災(zai)難(nan),利(li)用(yong)最(zui)小(xiao)噪(zao)聲(sheng)分(fen)離(li)變(bian)換(huan)進(jin)行(xing)波(bo)段(duan)選(xuan)擇(ze),達(da)到(dao)優(you)化(hua)數(shu)據(ju),去(qu)除(chu)噪(zao)聲(sheng)和(he)數(shu)據(ju)降(jiang)維(wei)的(de)目(mu)的(de)。
最小噪聲分離變換( MNF)是對主成分變換( PCA) 的一種改進方法。PCA shiyizhongxianxingbianhuan,bianhuanhougezhuchengfenfenliangbicizhijianhubuxiangguan,suizhezhuchengfendezengjiagaifenliangbaohandexinxiliangjianxiao,diyizhuchengfenbaohandexinxiliangzuida,dierzhuchengfenyudiyizhuchengfenwuguanqiezaishengyuchengfenzhongbaohandexinxiliangzuida,yicileitui。danPCA對dui噪zao聲sheng比bi較jiao敏min感gan,在zai變bian換huan後hou的de主zhu成cheng分fen分fen量liang中zhong,信xin息xi量liang大da的de信xin噪zao比bi不bu一yi定ding高gao,當dang某mou個ge信xin息xi量liang大da的de主zhu成cheng分fen中zhong包bao含han的de噪zao聲sheng的de方fang差cha大da於yu信xin號hao的de方fang差cha時shi,該gai主zhu成cheng分fen分fen量liang形xing成cheng的de圖tu像xiang質zhi量liang就jiu差cha。針zhen對dui PCA 變換的不足,Green 和 Berman 提出最小噪聲分離變換( MNF),它不但能判定圖像數據內在的維數( 波段數) ,分離數據中的噪聲,而且能減少隨後處理中的計算需求量。MNF 變換是基於圖像質量的線性變換,變換結果的成分按照信噪比從大到小排列。經過MNF變換大部分噪聲集中在特征小的分量中。而不像 PCA變換按照方差由大到小排列,從而克服了噪聲對影像質量的影響。
本文分析的對象由北大考古文博學院、山西博物院提供,如圖 2 所示為使用高光譜成像相機拍攝的數據合成的真彩色圖像。從圖2可知,石碑裏的文字有些已經風化變的模糊不清,難以用肉眼識別出來。

圖2 北大考古文博學院與山西博物院石碑RGB真彩色合成圖(從左到右)
對原始高光譜數據進行 MNF 變換(如圖3) ,fenbiededaoyiyouxiaoxinxiweizhudeboduanheyizaoshengweizhudeboduan,bingqieanzhaoxinzaobicongdadaoxiaodeshunxupailie。yuanshishujudezhuyaoxinxidoujizhongzaiqianmiantezhengzhidadeboduan,houmiantezhengzhixiaodeboduanzhuyaoyizaoshengweizhu。tezhengzhijiejinyu1的多數是噪聲,最好選擇特征值高的波段。根據MNF變換特征值曲線確定閾值為 8,選擇變換後的維數為 8。
.jpg)
圖 3 MNF 變換後的特征值曲線(從左到右:考古文博學院、山西博物院)
2.3 特征信息提取分析
在進行 MNF 變換後的波段中,選擇特征值大,圖像信息顯示效果突出的波段。在原始高光譜圖像中右下角可以模糊地看到有圖案存在,分別加載MNF 變換後第 1- 8波段影像,發現北京大學考古文博學院提供的石碑在MNF變換的第 4波段顯示的文字部分較為清晰(圖4a),山西博物院提供的石碑在MNF變換的第1波段顯示的文字較為清晰,如圖4b所示。在MNF變換中,通過信號與噪聲分離,使信息更加集中在有限的特征集中,一些微弱信息則在去噪轉化中被增強。同時在MNF轉化過程中,使光譜特征向類特征向量彙集,增強分類信息。在MNF變換後的特征域中不同的波段具有不同的光譜信息。比如北京大學考古文博學院提供的石碑在變換後的MNF波段1代表整個波段的亮度背景,即光譜背景,在影像上都較其他的MNF波段亮,第8波段以後出現隨機噪聲。
.jpg)
圖4a 北京大學考古文博學院石碑文字信息提取結果對比圖

圖4b 山西博物院石碑文字信息提取結果對比圖
對比原始高光譜數據,由表 2 可知,MNF 變換後的數據量也有效地降低,提高了數據的處理速度。
表 2 數據對比
|
數據 |
北大考古文博院 |
山西博物院 |
|
原始數據 |
598,560 KB |
549,144 KB |
|
MNF變換後數據 |
468,776 KB |
418,631 KB |
zhenduigaoguangpushujuxinxiliangfengfu,danshujurongyuqiebaohanzaoshengdetedian,benwenjiyuzuixiaozaoshengfenlibianhuansuanfayouxiaodiduishibeigaoguangputuxiangjinxingjiangweihequzaochuli,fenliletuxiangzhongdeyouxiaoxinxihezaosheng,jianxiaolehouqichulideshujuliang,tigaoleshujuchulixiaolv。tongguoduishibeigaoguangpushujujinxingzuixiaozaoshengfenlibianhuan,tiquleyuanshiyingxiangzhongmohubuqingdewenzi,shiyanjieguoduiyuhouqishibeidewenzixiufuheyanjiutigonglecankaohejiejian。
地址:無錫市梁溪區南湖大道飛宏路58-1-108
電話:
郵箱:
地址:北京市海澱區中關村大街19號
電話:
郵箱:
地址:陝西省西安市高新區科技一路40號盛方科技園B座三層東區
電話:
郵箱:
地址:成都市青羊區順城大街206號四川國際大廈七樓G座
電話:
郵箱:
地址:深圳市龍華區民治梅龍路
電話:
郵箱: