返回當(dāng)前位置:主頁>新聞資訊>高光譜相機(jī)問題
來源:賽斯拜克 發(fā)表時(shí)間:2023-10-11 瀏覽量:467 作者:awei
高光譜相機(jī)波段選擇是高光譜遙感技術(shù)應(yīng)用中的重要問題,它直接影響到圖像采集的質(zhì)量和精度。本文將介紹高光譜相機(jī)波段選擇的基本原則和考慮因素,以及常用的波段范圍和對(duì)應(yīng)的實(shí)際應(yīng)用場(chǎng)景。
高光譜相機(jī)波段選擇是高光譜遙感技術(shù)應(yīng)用中的重要問題,它直接影響到圖像采集的質(zhì)量和精度。本文將介紹高光譜
相機(jī)波段選擇的基本原則和考慮因素,以及常用的波段范圍和對(duì)應(yīng)的實(shí)際應(yīng)用場(chǎng)景。
高光譜相機(jī)波段選擇應(yīng)遵循以下幾個(gè)原則:
1. 針對(duì)性原則:針對(duì)不同的應(yīng)用領(lǐng)域和目標(biāo),需要選擇不同的波段范圍。例如,在地質(zhì)遙感領(lǐng)域,需要關(guān)注可見光-近
紅外波段;在環(huán)境監(jiān)測(cè)領(lǐng)域,需要關(guān)注中紅外-長(zhǎng)波紅外波段。
2. 寬波段原則:為了獲得更多的光譜信息,應(yīng)盡可能選擇較寬的波段范圍。一般來說,波段范圍越寬,獲取的光譜信息
越豐富。
3. 分辨率原則:在滿足寬波段原則的前提下,應(yīng)盡量選擇具有較高空間分辨率的波段。高空間分辨率可以更好地揭示地
物細(xì)節(jié)和空間結(jié)構(gòu)信息。
4. 穩(wěn)定性原則:選擇的波段應(yīng)具有較好的穩(wěn)定性和抗干擾能力。例如,應(yīng)避免選擇容易受到大氣吸收和散射干擾的波段。
5. 經(jīng)濟(jì)性原則:在滿足前四個(gè)原則的前提下,應(yīng)盡量選擇成本較低的波段范圍。
1. 可見光-近紅外波段(400-1000nm):該波段范圍是地物反射率最高的波段,適合于地物分類、植被覆蓋度監(jiān)測(cè)、土
地利用/土地覆蓋圖斑提取等應(yīng)用場(chǎng)景。常用的商業(yè)高光譜相機(jī)如美國(guó)宇航局(NASA)的AIS2和AIS3,以及以色列Visi
onMap公司的VisH煙火探測(cè)相機(jī)等均包含該波段范圍。
2. 短波紅外波段(1000-2500nm):該波段范圍是地物透射率最高的波段,適合于透過植被探測(cè)地下目標(biāo)、水體污染監(jiān)
測(cè)、大氣氣體成分遙測(cè)等應(yīng)用場(chǎng)景。常用的商業(yè)高光譜相機(jī)如美國(guó)宇航局的AIS5/AIS6、以色列VisionMap公司的VisSWIR
等均包含該波段范圍。
3. 中紅外-長(zhǎng)波紅外波段(2500-10000nm):該波段范圍是地物發(fā)射率最高的波段,適合于地物熱輻射特性遙感、地物
識(shí)別與分類、水體和大氣溫度監(jiān)測(cè)等應(yīng)用場(chǎng)景。常用的商業(yè)高光譜相機(jī)如美國(guó)宇航局的FLIR、德國(guó)制冷公司的HRR等均包
含該波段范圍。
4. 超寬帶波段(<10nm):該波段范圍是具有超寬帶特性的高光譜成像系統(tǒng)的工作范圍,適合于超寬帶通信、雷達(dá)成像、
高精度導(dǎo)航等應(yīng)用場(chǎng)景。常用的商業(yè)高光譜相機(jī)如美國(guó)宇航局的HCONS、芬蘭Spectral Imaging公司的i-SPEED等均包含
該波段范圍。
高光譜相機(jī)波段選擇應(yīng)根據(jù)實(shí)際需求和應(yīng)用領(lǐng)域進(jìn)行綜合考慮,選擇合適的波段范圍,以獲得更好的應(yīng)用效果。
高光譜遙感圖像波段選擇采用的策略主要包括:
(1)以評(píng)價(jià)準(zhǔn)則為依據(jù)的波段選擇
(2)以特征選擇方式為依據(jù)的波段選擇
(3)以訓(xùn)練樣本為依據(jù)的波段選擇
(4)以與應(yīng)用模型的關(guān)系為依據(jù)的波段選擇
一、以評(píng)價(jià)準(zhǔn)則為依據(jù)的波段選擇
從波段選擇采用的評(píng)價(jià)準(zhǔn)則來看,高光譜遙感圖像的波段選擇方案包括:
(1)以信息量作為波段選擇的標(biāo)準(zhǔn),選擇信息總量最大的波段子集,通常采用信息熵、互信息、交叉熵、聯(lián)合信息熵、信息散度、方差、協(xié)方差矩陣特征值等來構(gòu)建信息量的評(píng)價(jià)指標(biāo)。需要注意的是,噪聲對(duì)基于信息論的這些指標(biāo)的影響較大,噪聲大的波段會(huì)導(dǎo)致較大的方差,同時(shí)也會(huì)降低與其他波段的相關(guān)性而被誤選,但這些受到噪聲或者異常影響的波段往往具有較低的魯棒性和可靠性。
(2)以類別可分性作為波段選擇標(biāo)準(zhǔn),期望選取的波段子集有利于研究地物的分類識(shí)別。衡量類間可分性大小常以距離來度量,典型的度量指標(biāo)有離散度、B距離(Bhattacharyya distance)、JM距離(Jeffreys Matusita distance)等。
以波段間的相關(guān)度作為波段選擇的標(biāo)準(zhǔn),選擇相關(guān)性最弱的波段子集,以減小信息冗余,常用光譜相關(guān)系數(shù)、光譜角、光譜信息散度和正交投影散度等作為度量指標(biāo)。
二、以特征選擇方式為依據(jù)的波段選擇
本研究所用遙感數(shù)據(jù)以谷歌地球引擎(GEE)為分析平臺(tái)。這是由谷歌、卡內(nèi)基梅隆大學(xué)和美國(guó)地質(zhì)調(diào)查局聯(lián)合開發(fā)的基于云計(jì)算的地理信息處理系統(tǒng)。此平臺(tái)提供了大量影像數(shù)據(jù),通過依靠Google的高性能集群服務(wù)器對(duì)影像進(jìn)行在線可視化處理,信息提取十分快捷。本研究所用的衛(wèi)星數(shù)據(jù)源為陸地衛(wèi)星地表反射率數(shù)據(jù)(LSR)系列數(shù)據(jù)和哨兵二號(hào)多光譜2a級(jí)數(shù)據(jù)集。
LSR系列數(shù)據(jù)包含陸地衛(wèi)星專題制圖儀(TM)、陸地衛(wèi)星增強(qiáng)型專題制圖儀(ETM+)、陸地衛(wèi)星陸地成像儀(OLI)影像,時(shí)間分辨率為16d,空間分辨率為30m,均包含3個(gè)可見光波段及一個(gè)近紅外波段。LSR數(shù)據(jù)產(chǎn)品是通過陸地衛(wèi)星生態(tài)系統(tǒng)擾動(dòng)自適應(yīng)處理系統(tǒng)(LEDAPS)處理,利用大氣表觀反射率(TOA)和亮溫(BT)數(shù)據(jù),對(duì)太陽光譜輻射傳輸模型(6S)中的衛(wèi)星信號(hào)進(jìn)行二次模擬,生成地表反射率(SR)數(shù)據(jù)。SR數(shù)據(jù)已經(jīng)過輻射定標(biāo)、大氣校正等處理,最大限度地消除了大氣散射、吸收、反射引起的誤差。Sentinel-2MSIlevel-2a數(shù)據(jù)集為經(jīng)過處理后的大氣底層反射影像,時(shí)間分辨率5d,共7個(gè)波段,其中4個(gè)可見光及1個(gè)近紅外波段的空間分辨率為10m,短波紅外和1個(gè)紅邊波段的空間分辨率為20m
三、以訓(xùn)練樣本為依據(jù)的波段選擇
根據(jù)是否依靠樣本先驗(yàn)信息,將高光譜圖像波段選擇分為監(jiān)督波段選擇和非監(jiān)督波段選擇。監(jiān)督波段選擇利用標(biāo)記的訓(xùn)練樣本參與波段選擇過程,使得選出的波段子集具有較好的實(shí)際應(yīng)用性能。但因訓(xùn)練樣本需要進(jìn)行實(shí)地調(diào)查,其獲得的成本高,耗時(shí)費(fèi)力,有時(shí)甚至無法獲得,使得監(jiān)督波段選擇的使用受限。非監(jiān)督波段選擇不需要除影像本身之外的其他先驗(yàn)性的訓(xùn)練樣本信息,只根據(jù)影像本身的特點(diǎn)進(jìn)行選擇,在樣本難以獲得的情況下更具實(shí)用性。由于沒有標(biāo)記樣本而無法獲得高光譜圖像的準(zhǔn)確信息,非監(jiān)督波段選擇一般以波段信息量和波段間的相關(guān)性為準(zhǔn)則來進(jìn)行選擇。同時(shí),這些波段容易受到噪聲或者異常的影響,往往具有較低的魯棒性和可靠性。此外,非監(jiān)督波段選擇技術(shù)一般并不針對(duì)特定的應(yīng)用,因此選擇的波段子集的實(shí)際應(yīng)用效果較有監(jiān)督選擇的波段子集差。
四、以與應(yīng)用模型的關(guān)系為依據(jù)的波段選擇
依據(jù)波段選擇與應(yīng)用模型學(xué)習(xí)算法的關(guān)系,高光譜遙感圖像的波段選擇分為:
(1)過濾式波段選擇,該方法先按評(píng)價(jià)指標(biāo)對(duì)高光譜數(shù)據(jù)進(jìn)行波段搜索,然后再訓(xùn)練模型學(xué)習(xí)器,波段選擇過程與應(yīng)用模型的學(xué)習(xí)算法無關(guān),二者之間相互獨(dú)立。這種方法相當(dāng)于先用波段選擇過程對(duì)數(shù)據(jù)進(jìn)行“過濾”,再用過濾后的特征來訓(xùn)練模型,特點(diǎn)是計(jì)算量小,速度快,但波段選擇結(jié)果與應(yīng)用模型所需性能偏差較大。
(2)封裝式波段選擇,該方法將應(yīng)用模型的建立與波段搜索的過程結(jié)合起來,利用模型學(xué)習(xí)算法的訓(xùn)練準(zhǔn)確率作為波段子集的評(píng)價(jià)準(zhǔn)則,因而應(yīng)用模型性能精度較高,波段選擇結(jié)果偏差小,但每次波段子集評(píng)價(jià)都需要重新訓(xùn)練學(xué)習(xí)器,運(yùn)算復(fù)雜度高,計(jì)算開銷大,不適用于大規(guī)模數(shù)據(jù)集。
(3)嵌入式波段選擇,該方法在應(yīng)用模型學(xué)習(xí)器的訓(xùn)練過程中通過優(yōu)化目標(biāo)函數(shù)自動(dòng)完成波段選擇。其性能介于過濾式和封裝式法之間,相對(duì)于封裝式法,嵌入式法避免了評(píng)估每一個(gè)波段子集對(duì)學(xué)習(xí)器進(jìn)行的重復(fù)訓(xùn)練;相對(duì)于過濾式法,嵌入式法的波段選擇結(jié)果與應(yīng)用模型適應(yīng)性更好。但嵌入式法性能的優(yōu)劣依賴于參數(shù)調(diào)整,且目標(biāo)函數(shù)構(gòu)造較困難。
為什么需要波段選擇?波段選擇與特征提取(波段提取)的區(qū)別?
高光譜波段之間具有很高的相關(guān)性,無論在定量遙感應(yīng)用,還是屬于地物分類的應(yīng)用中,都會(huì)考慮利用其中的有代表性的波段作為"特征波段",一是較少運(yùn)算量,二是剔除對(duì)研究沒有啥用的波段,其中涉及到的技術(shù)手段主要有波段提取和波段選擇,波段提取是利用線性或非線性的方式對(duì)原始高維波段進(jìn)行變換,達(dá)到降維的目的,其“特征波段”中的信息是原始所有數(shù)據(jù)信息的綜合,而特征選擇,是在原始的高維波段中,通過某些準(zhǔn)則或方式在原始波段中選擇出若干個(gè)波段,強(qiáng)調(diào)的是在原始波段中通過什么方式進(jìn)行選擇。相對(duì)與波段提取技術(shù),波段選擇具有以下優(yōu)勢(shì)(提取和選擇各有優(yōu)勢(shì),在此描述的是波段選擇,所以將其優(yōu)點(diǎn)描述一下,具體目的具體討論)
1. 從原始數(shù)據(jù)選擇出的波段,沒有進(jìn)行相關(guān)的其他處理,依舊保持波段代表的物理意義,在一些定量遙感應(yīng)用中(如植被參數(shù)反演和水質(zhì)參數(shù)反演等),保留波段的物理意義極為重要;
2. 多光譜傳感器波段設(shè)置。多光譜遙感只對(duì)一些特定的波段進(jìn)行成像,與高光譜數(shù)據(jù)相比,具有數(shù)據(jù)量低、空間分辨率高等特點(diǎn)。很多多光譜傳感器只針對(duì)某種特殊應(yīng)用,這種情況下,一些特定波段就可以解決問題,而波段的設(shè)置是十分關(guān)鍵的問題。通過對(duì)高光譜圖像波段選擇,可以模擬得到這些關(guān)鍵的波段。不僅如此,這些波段組合在應(yīng)用中的效果還可以得到可靠的評(píng)估。反觀特征提取,由于得到的特征失去了物理意義,對(duì)波段設(shè)置難以提供有價(jià)值的參考;
3. 物性的理解。一般而言,不同的物質(zhì)在光譜上會(huì)有不同的表現(xiàn),但也可能由于光譜分辨率及光譜范圍的限制表現(xiàn)為異物同譜。在數(shù)百個(gè)波段中,往往只有少數(shù)波段在地物彼此區(qū)分中起到了關(guān)鍵作用。通過波段選擇,可以找到這些特定波段,從而提高對(duì)物體性質(zhì)的認(rèn)識(shí)。
明確問題之后,進(jìn)一步地需要了解什么是波段選擇,怎么選擇?涉及到哪些具體問題?
波段選擇的問題就是在原始波段中選擇哪些波段作為“特征波段”,其中必然涉及兩個(gè)問題,一是為什么選擇這些波段,二是怎么選擇這些波段,對(duì)應(yīng)的分別是波段選擇的評(píng)價(jià)以及波段選擇的方式。
1. 波段選擇評(píng)價(jià)方式是指針對(duì)一個(gè)選擇出的波段子集,給出一個(gè)定量的指標(biāo)用來評(píng)價(jià)該子集的性能優(yōu)劣,指標(biāo)常稱代價(jià)函數(shù),目標(biāo)函數(shù)或準(zhǔn)則函數(shù)等,常用的評(píng)價(jià)指標(biāo)有信息量(方差)、信息散度、相似性和獨(dú)立性等。還有一些方法使用應(yīng)用效果對(duì)波段子集進(jìn)行評(píng)價(jià),這類方法一般為監(jiān)督方式,需要一定的訓(xùn)練樣本。使用這種方法時(shí),對(duì)于一個(gè)特定波段子集,首先將它們帶入應(yīng)用場(chǎng)景,并將得到的應(yīng)用效果作為性能優(yōu)劣的評(píng)價(jià)。例如,一些方法直接使用分類精度作為波段子集評(píng)價(jià)指標(biāo)。一個(gè)好的波段子集評(píng)價(jià)指標(biāo)應(yīng)具有應(yīng)用效果好、魯棒性強(qiáng)及易于計(jì)算等特點(diǎn);
2.波段子集搜索策略是一個(gè)組合優(yōu)化問題,即利用評(píng)價(jià)方式對(duì)波段組合(波段子集)進(jìn)行評(píng)價(jià)后,利用搜索策略從中搜索出滿足條件的波段組合(波段子集)。有的方法利用評(píng)價(jià)方式后,對(duì)波段進(jìn)行排序,根據(jù)排序結(jié)果選擇波段子集,而不用搜索策略,具體問題具體對(duì)待,一般是用評(píng)價(jià)方法+搜索策略的方法來完成波段選擇的目的。
在具體的研究領(lǐng)域和應(yīng)用場(chǎng)景中,進(jìn)一步的可以將波段選擇問題分為監(jiān)督波段選擇和非監(jiān)督波段選擇兩類,
非監(jiān)督波段選擇技術(shù):指不需要除影像本身之外的其他先驗(yàn)性的訓(xùn)練樣本信息,只根據(jù)影像本身的特點(diǎn)進(jìn)行,目前主要有兩種方法:
1. 基于波段排序的波段選擇(往往沒有考慮相關(guān)性):一般定義某種單波段指標(biāo)如信息熵(InformationEntropy)、信噪比(Signal-to-Noise-Ratio,SNR)及信息散度(Information Divergence,ID)等。如最大方差主成分分析(MaximumVariance Principal Component Analysis,MVPCA)以主成分變換的基向量和對(duì)應(yīng)方向的信息量加權(quán)和的方式計(jì)算各個(gè)波段的信息量,然后按照該信息量排序,波段的優(yōu)先次序決定了重要程度;
2. 考慮了相關(guān)性的波段選擇方法:這些方法的一個(gè)共同特點(diǎn)是使用針對(duì)多波段的指標(biāo)。如最佳指數(shù)(Optimal Index Factor,OIF)法采用三個(gè)波段的方差和與它們的相關(guān)系數(shù)和之比來衡量波段的重要程度。然而當(dāng)選擇的波段較多時(shí),該方法需要反復(fù)計(jì)算多個(gè)波段之間的OIF,這樣的計(jì)算對(duì)于高光譜圖像來說幾乎是難以完成的。
監(jiān)督波段選擇:非監(jiān)督波段選擇技術(shù)一般并不針對(duì)特定的應(yīng)用,因此往往難以獲得較好的應(yīng)用效果。監(jiān)督波段選擇技術(shù)除了高光譜圖像本身,還需要提供一定的訓(xùn)練樣本或者目標(biāo)等先驗(yàn)信息作為波段選擇的輔助信息。與非監(jiān)督的主要區(qū)別在于,其評(píng)價(jià)方式應(yīng)用到具體的研究目的中了,如分類中使用分類精度作為評(píng)價(jià)指標(biāo)來進(jìn)行波段選擇,而這類評(píng)價(jià)指標(biāo)的計(jì)算過程是需要先驗(yàn)知識(shí)作為輔助信息。
目前,對(duì)高光譜數(shù)據(jù)進(jìn)行波段選擇的目的應(yīng)用在分類相關(guān)的領(lǐng)域比較多,在反演領(lǐng)域較少。其常用的的評(píng)價(jià)方式/指標(biāo)有:
方差
在某種程度上,方差可以表示所有數(shù)據(jù)相對(duì)于平均值的離散程度,在圖像中它表示 某個(gè)像元的灰度與平均值的差異水平。方差越大,其偏離均值越大,圖像所攜帶的信息 量越多,其灰度層次也就越豐富,圖像的質(zhì)量越好;
熵與聯(lián)合熵
香農(nóng)(Shannon)于1948年第一次提出了用熵來表征信息量,并指出熵和信號(hào)值出現(xiàn)的概率有一定的聯(lián)系。信息熵的大小直接影響圖像的質(zhì)量,圖像的質(zhì)量隨熵值的增大而變優(yōu),信息量也隨之增加。由于熵可以用來表示圖像所含信息量的多少,因此可以用多個(gè)波段的聯(lián)合熵衡 量其所攜帶信息量的豐富程度。首先,找出全部可能的波段組合,并求出聯(lián)合熵,然后 對(duì)其排序,使其滿足從大到小的規(guī)律,從而選出聯(lián)合熵最大的排名靠前的幾個(gè)的波段組合作為最佳組合。若選擇三個(gè)波段的組合作為最優(yōu)波段,則其聯(lián)合熵的表達(dá)公式 如下:
其中, 表示圖像 X1 中像素灰度為 、圖像 X2 中同名像素灰度為 、圖像 X3 中 同名像素為 的聯(lián)合概率。聯(lián)合熵越大則波段組合攜帶的信息量越豐富,因而最佳波段 的選擇問題得以解決。
OIF(最佳指數(shù)法)
對(duì)于高光譜圖像的數(shù)據(jù)而言,波段的信息冗余度與相關(guān)系數(shù)有關(guān),而信息量與標(biāo)準(zhǔn)差有關(guān),且均為正相關(guān)關(guān)系。Chavez 等人在 1982 年提出最佳指數(shù)因子這一概念,作為 一種組合波段的選優(yōu)算法,其選擇的波段數(shù)目 n 通常取 3,即將全部可能的三個(gè)波段進(jìn)行組合。如果組合波段有 n 個(gè),則它們的最佳指數(shù)因子可以用 如下公式表示
其中, 表示第 i 個(gè)波段的標(biāo)準(zhǔn)差, 表示 i j , 兩波段的相關(guān)系數(shù)且要取絕對(duì)值, 通常取 n= 3。對(duì)含有 L 個(gè)波段的圖像數(shù)據(jù),先計(jì)算其相關(guān)系數(shù)矩陣,再找出全部可能的 三組合波段,并分別計(jì)算其相應(yīng)的最佳指數(shù)因子,然后將其按照從大到小依次排序,則 可以選出最優(yōu)的組合方案。
基于類間可分性的波段選擇方法
對(duì)高光譜圖像進(jìn)行分類時(shí),需要進(jìn)行高光譜各波段與地物間的可分離性進(jìn)行研究,一般地,地物的類間可分性可以針對(duì)單波段也可以針對(duì)多波段組合來計(jì)算,主要計(jì)算地物類別在單波段或波段組合中的統(tǒng)計(jì)距離,包括均值間標(biāo)準(zhǔn)差、離散度、B距離和J-M距離等,通常均值間標(biāo)準(zhǔn)差表示地物類別在單波段中的可分性,其他距離指標(biāo)用于波段組合中的可分性研究。
1. 均值間標(biāo)準(zhǔn)差
其中, 分別為兩類樣本對(duì)應(yīng)區(qū)域的光譜均值, 分別為兩類樣本對(duì)應(yīng)的區(qū)域內(nèi)的方差,d反映的是兩類樣本在每一個(gè)波段內(nèi)的可分性大小,d越大,表明地物在此波段的可分性越好。
2.離散度
離散度是基于類條件概率之差的概念,表征了兩類地物之間的可分性,其表達(dá)式為:
其中, 分別為i,j兩類樣本對(duì)應(yīng)區(qū)域的光譜均值矢量, 分別為i,j兩類樣本對(duì)應(yīng)區(qū)域的協(xié)方差矩陣,tr[A]為矩陣A對(duì)角線元素之和。
3.B距離
也可以化簡(jiǎn):
其符號(hào)意義,與離散度一樣。
4. J-M距離
其中, 為B距離。 范圍在[0-2],分類精度達(dá)到一定程度后不再增加,說明當(dāng)J-M距離足夠大時(shí),致使分類精度已很高時(shí),繼續(xù)增大J-M距離對(duì)于分類精度的沒有過多意義。
波段選擇主要涉及兩方面內(nèi)容,一是評(píng)價(jià)準(zhǔn)則(不論是非監(jiān)督還是監(jiān)督場(chǎng)景),二是搜索方法,此節(jié)詳細(xì)描述搜索方法;
先明確一個(gè)問題,波段子集搜索(波段組合)屬于優(yōu)化問題,是個(gè)NP問題,沒有絕對(duì)的最優(yōu)子集,即最優(yōu)波段組合(選擇),因此,獲取的解都是在一定程度上以犧牲解的精度換取搜索效率的結(jié)果,在數(shù)據(jù)量大的時(shí)候,難以用暴力搜索方式解決問題,常用的有序貫前向/后向搜索(和逐步回歸的思想相似),遺傳算法和粒子群算法等。
Whitney于1971年提出的,其本質(zhì)上是一種“貪婪算法”,適用于多種特征子集搜索問題。SFS是一種“自下而上”的搜索算法,以波段子集搜索為例,它開始于一個(gè)波段,即首先選擇使得波段選擇準(zhǔn)則函數(shù)最優(yōu)的一個(gè)波段。初始化第一個(gè)波段時(shí),需要對(duì)每一個(gè)波段各計(jì)算一次準(zhǔn)則函數(shù)(共L次),并選擇具有最優(yōu)準(zhǔn)則函數(shù)的波段。然后,在剩余的波段集合中,再次選擇一個(gè)波段作為第二個(gè)波段。第二個(gè)波段選擇的原則是,與第一個(gè)波段組成的“波段子集”能夠獲得最優(yōu)的準(zhǔn)則函數(shù),因此選擇第二個(gè)波段需要計(jì)算L-1次準(zhǔn)則函數(shù)。以此類推,每次增加一個(gè)波段,保證能使當(dāng)前的波段子集獲得最優(yōu)準(zhǔn)則函數(shù)。由于使用SFS搜索,特征數(shù)逐漸增加,且每次增加一個(gè)特征,因此稱為序貫前向搜索。
使用SFS從L個(gè)波段中選擇n個(gè)波段子集,需要搜索的總次數(shù)為:
近似nL。
Marill于1963年提出的,其本質(zhì)上也是一種“貪婪算法”,同樣適用于多種特征子集搜索問題。與SFS相反,SBS是一種“自上而下”的搜索算法,以波段子集搜索為例,它開始于全部波段集合,即將全部波段集合作為初始波段集合,然后從中逐個(gè)刪除波段。刪除第一個(gè)波段時(shí),需要先將每一個(gè)波段去除一次,并對(duì)剩余波段各計(jì)算一次準(zhǔn)則函數(shù)(共L次),保留具有最優(yōu)準(zhǔn)則函數(shù)的波段子集,這就相當(dāng)于去除了一個(gè)波段。然后,使用同樣的方法在剩余的波段子集中,再次去除一個(gè)波段,這也需要將波段子集中的每個(gè)波段再去除一次,因此,刪除第二個(gè)波段需要計(jì)算L-1次準(zhǔn)則函數(shù)。以此類推,每次循環(huán)都保留能獲得最優(yōu)準(zhǔn)則函數(shù)的波段子集。由于使用SBS搜索時(shí),特征數(shù)逐漸減少,且每次減少一個(gè)特征,因此稱為序貫后向搜索。
使用SBS從L個(gè)波段中選擇n個(gè)波段子集,需要搜索的總次數(shù)為:
近似 。
值得注意的是,Pudil對(duì)序貫前向(后向)做了改進(jìn),提取了浮動(dòng)的序貫前向(后向)算法,每次增加或刪除的波段數(shù)不止一個(gè),可為多個(gè),并且對(duì)納入子集的波段再次進(jìn)行重新評(píng)估。
[1] Pudil P., Ferri F., Novovicova J., et al. Floating search methods forfeature selection with nonmonotonic criterion functions[C]. PatternRecognition,Vol. 2-Conference B, IEEE Conference on Computer Vision &Image Processing, Proceedings of the 12th IAPR International. 1994: 279-283.
[2] Pudil P., Novovi?ová J., Kittler J. Floating search methods in featureselection[J]. Pattern recognition letters, 1994, 15(11):1119-1125.
關(guān)于波段子集搜索方法還有智能算法,如遺傳算法,模擬退火,粒子群等,正在整理中,后續(xù)附上,有時(shí)間的話,以代碼的形式整理其思路,很多東西論文或其他資料中都涉及到,但大多缺乏邏輯性,缺少為什么以及細(xì)節(jié)。