TEKNILLINEN KORKEAKOULU
Maanmittausosasto
KASVILLISUUDEN SEKÄ MAAPERÄN LUOKITTELU JA
ANALYSOINTI HYPERSPEKTRIKUVILTA
Teknillisen korkeakoulun Maanmittausosastolla tehty diplomityö
Espoo, huhtikuu 2004
tekniikan ylioppilas Juho Lumme
Työn valvoja
prof. Henrik Haggrén
Työn ohjaaja
tekn. lis. Markus Törmä
i
TEKNILLINEN KORKEAKOULU DIPLOMITYÖN TIIVISTELMÄ
Tekijä: Juho Lumme Työn nimi: Kasvillisuuden sekä maaperän luokittelu ja analysointi hyperspektrikuvilta Päivämäärä: 28.5.2004 Sivumäärä: 87
Osasto: Professuuri: Maanmittausosasto Fotogrammetria ja kaukokartoitus Pääaine: Kaukokartoitus
Työn valvoja: prof. Henrik Haggrén, Teknillinen korkeakoulu Työn ohjaaja: tekn. lis. Markus Törmä, Teknillinen korkeakoulu
Hyperspektrikuvan luokittelu perinteisillä tilastollisen hahmontunnistuksen menetelmillä on hidasta. Lisäksi hyperspektrikuvan korreloivien kanavien takia luokittelualgoritmien toiminta saattaa keskeytyä kokonaan. Hyperspektrikuvien analysointiin on kehitetty uusia algoritmeja, joiden soveltuvuutta maaperän sekä kasvillisuuden analysointiin tutkittiin tässä diplomityössä. Algoritmien suorituskykyä vertailtiin keskenään sekä perinteisten luokittelualgoritmien kanssa. Lisäksi tutkittiin, miten luokkien opetusalueet sekä referenssispektrit vaikuttavat luokittelutulokseen. Työssä tutkittiin AISA-spektrometrillä kuvattuja Lammin sekä Paraisten testialueita. Aineisto käsitti 17 kanavaa näkyvän valon sekä lähi-infrapunasäteilyn alueella. Aineisto luokiteltiin seuraavilla algoritmeilla: Spectral Angle Mapper, Spectral Correlation Mapper, Spectral Unmixing, Perceptron neuraaliverkko, Bayesin päätösteoria sekä minimietäisyyden menetelmä. Luokittelijoiden opetusalueina käytettiin maastossa varmistettuja alueita. Opetusalueista laskettiin hyperspektrikuville kehitetyille luokittelijoille referenssispektrit erilaisia keskiarvomittoja käyttäen. Luokittelun lisäksi tutkittiin tarkemmin eri kasvillisuusluokkien heijastusspektrejä sekä erilaisten olosuhteiden vaikutusta näihin spektreihin. Luokittelu Bayesin päätösteorian avulla antoi hyvät tulokset, mutta luokittelu oli hidasta eikä se toiminut alueilla, joissa oli valoisuuseroja. Spectral Angle Mapper sekä Spectral Correlation Mapper luokittelivat aineiston hyvin myös olosuhteissa, joissa valoisuus vaihteli. Spectral Unmixing -algoritmin ongelmana oli kunnollisten referenssispektrien löytäminen. Perceptron neuraaliverkkolla saatiin parhaimmat tulokset, mutta verkon opettaminen vei paljon aikaa. Minimietäisyyden algoritmi oli nopea, mutta tulokset eivät olleet kovinkaan hyviä. Verrattaessa kasvillisuuden heijastusspektrejä havaittiin, että lehtipuiden sekä sokerijuurikkaan heijastusspektrit sekoittuivat keskenään. Eri maalajien vaikutus kasvillisuuden heijastusspektriin oli vähäinen ja se sekoittui kasvillisuudesta heijastuneen säteilyn normaaliin vaihteluun.
Avainsanat: luokittelu, kuvaava spektrometri, hyperspektri, heijastusspektri Kieli: suomi
ii
HELSINKI UNIVERSITY OF TECHNOLOGY ABSTRACT OF THE MASTER’S THESIS
Author: Juho Lumme Name of the thesis: Vegetation and soil classification and analysis from imaging spectrometer data Date: 28 May 2004 Number of pages: 87
Department: Professorship: Surveying Department Photogrammetry and Remote Sensing Major: Remote Sensing
Supervisor: Henrik Haggrén, Prof., Helsinki University of Technology Instructor: Markus Törmä, Lic.Sc.(Tech), Helsinki University of Technology
Classification of hyperspectral data using statistical pattern recognition methods requires a lot of processing time. Image channels of the data are strongly correlated with each other and it may prevent the execution of the classification. Therefore new algorithms are developed for the hyperspectral data classification. The suitability of these algorithms for ground and vegetation classification has been investigated in this work. The efficiency of the algorithms is compared to each other. Besides, the effect of different training areas of the classification is investigated. The test area located in Southern Finland was imaged by an AISA airborne imaging spectrometer using 17 visual and near infrared bands. The area included lakes, rural areas, cultivated fields and forests. Spectral Angle Mapper (SAM), Spectral Correlation Mapper (SCM), Spectral Unmixing and Perceptron neural network algorithms were used in the classification. Besides, the data were classified using conventional algorithms as Minimum Distance and Bayes' theorem classifiers that have often been used for multispectral data classification. The effects of various classification algorithms and different training areas were investigated. The reflectance spectra of different plants were examined and compared under varying illumination. Maximum Likelihood classifier led to fair results, but it required more computation time and the results deteriorated under varying illumination. SAM and SCM were faster and they led to better classification results in poor illumination. The problem with the Spectral Unmixing classification was finding suitable reference spectra from mixed pixels. Neural network led to good results as well, but the training of the network was difficult. Minimum Distance classifier was fast but the results were inferior. The reflectance spectra of deciduous trees and sugar beet was seen to mix when analysing the reflectance spectra of different plants. The effects of soil types of vegetation to reflectance were slight and they mixed with natural variation of the reflectance of the plants.
Keywords: classification, imaging spectrometry, reflectance spectrum Language: Finnish
iii
Alkusanat
Tämä diplomityö on tehty Teknillisen korkeakoulun Maanmittausosaston Fotogrammetrian ja
kaukokartoituksen laboratorion Digitaalinen kuvankäsittely kaukokartoituksessa -
tutkimushankkeen yhteydessä. Hanketta on rahoittanut Maa- ja metsätalousministeriö, mistä esitän
kiitokseni kaikille veronmaksajille. Erityisesti haluan kiittää työn ohjaajaa tekn. lis. Markus
Törmää sekä työn valvojaa TKK:n Fotogrammetrian ja kaukokartoituksen laboratorion johtajaa
prof. Henrik Haggrénia.
Tahdon kiittää myös työtovereitani sekä kaikkia niitä henkilöitä, jotka ovat myötävaikuttaneet
tämän työn syntyyn. Lopuksi esitän kiitokseni Aleksi pojalleni, joka on motivoinut opiskelujani
sekä tarjonnut aamuisin tehokasta herätyspalvelua.
Juho Lumme
Espoo, huhtikuu 2004
iv
Sisällysluettelo
1. JOHDANTO.................................................................................................................... 1
2. SPEKTROSKOPIA........................................................................................................ 4
2.1. SPEKTROMETRIT ......................................................................................................... 4 2.2. KUVAAVAT SPEKTROMETRIT ...................................................................................... 5 2.3. AISA-SPEKTROMETRI ................................................................................................. 7
2.3.1. AISA:n rakenne................................................................................................... 8 2.3.2. AISA:n toiminta .................................................................................................. 8
2.4. HEIJASTUSSPEKTRI.................................................................................................... 10 2.5. MATERIAALIEN HEIJASTUSOMINAISUUDET ............................................................... 11 2.6. HYPERSPEKTRIKUVA................................................................................................. 13 2.7. SPEKTRIKIRJASTO ..................................................................................................... 14
3. KUVAAVAN SPEKTROMETRIN TUOTTAMAN DATAN KORJAUKSET ..... 16
3.1. GEOMETRINEN KORJAUS ........................................................................................... 16 3.2. RADIOMETRINEN KORJAUS........................................................................................ 17 3.3. ILMAKEHÄKORJAUS .................................................................................................. 18
3.3.1. Ilmakehän sironta ............................................................................................. 19 3.3.2. Ilmakehän absorptio ......................................................................................... 20
3.4. HEIJASTUSSPEKTRIN NORMALISOINTI ....................................................................... 21
4. PIIRTEIDEN VALINTA JA IRROITUS .................................................................. 23
4.1. FYSIKAALISIA PIIRTEIDEN IRROITUSMENETELMIÄ..................................................... 24 4.2. PIIRTEIDEN VALINTA................................................................................................. 25
4.2.1. Branch and bound............................................................................................. 25 4.2.2. Parhaat piirteet................................................................................................. 27 4.2.3. Sequential Forward Selection (SFS) ................................................................ 27 4.2.4. Sequential Backward Selection (SBS) .............................................................. 28 4.2.5. Lisää-l ota pois-r .............................................................................................. 29
4.3. PIIRTEIDEN IRROITUS ................................................................................................ 29 4.3.1. Pääkomponenttimuunnos.................................................................................. 30 4.3.2. n-ulotteiset todennäköisyystiheysfunktiot piirteiden irroituksessa ................... 32
5. LUOKITTELUALGORITMIT................................................................................... 35
5.1. HYPERSPEKTRIDATAN LUOKITTELUALGORITMIT ...................................................... 35 5.1.1. Spectral Angle Mapper (SAM).......................................................................... 35 5.1.2. Spectral Correlation Mapper (SCM)................................................................ 37 5.1.3. Spectral Unmixing ............................................................................................ 38 5.1.4. Spectral Feature Fitting (SFF) ......................................................................... 40 5.1.5. Perceptron-neuroverkko ................................................................................... 41
5.2. PERINTEISIÄ LUOKITTELIJOITA.................................................................................. 43 5.2.1. Bayesin päätösteoria ........................................................................................ 44 5.2.2. Minimietäisyyden luokittelija............................................................................ 45
6. TYÖSSÄ KÄYTETTY AISA-DATA SEKÄ MAASTOTYÖT................................ 46
v
6.1. AISA-DATA .............................................................................................................. 46 6.2. AISA-DATAN ESIKÄSITTELY..................................................................................... 48 6.3. MAASTOTYÖT ........................................................................................................... 48
7. LUOKITTELU ............................................................................................................. 50
7.1. OPETUSALUEIDEN VALINTA ...................................................................................... 50 7.2. HEIJASTUSSPEKTRIEN ANALYSOINTI ......................................................................... 51
7.2.1. Kasvillisuusluokkien erottumisen analysointia luokkien välisten spektrikulmien avulla .......................................................................................................................... 51 7.2.2. Kuusen heijastusspektrin analysointia ............................................................. 57
7.3. REFERENSSISPEKTRIT................................................................................................ 59 7.4. ERI TAVOIN MUODOSTETTUJEN REFERENSSISPEKTRIEN VERTAILU............................ 60 7.5. LUOKITTELUALGORITMIEN SUORITTAMINEN ............................................................ 63
7.5.1. Spectral Angle Mapper sekä Spectral Correlation Mapper ............................. 64 7.5.2. Spectral Unmixing ............................................................................................ 66 7.5.3. Perceptron-neuroverkko ................................................................................... 68 7.5.4. Minimietäisyyden sekä suurimman uskottavuuden menetelmät ....................... 68
7.6. LUOKITTELUTULOKSET JA -KUVAT ........................................................................... 70 7.6.1. Spectral Angle Mapper sekä Spectral Correlation Mapper ............................. 72 7.6.2. Perceptron-neuroverkko sekä minimietäisyyden menetelmä............................ 74 7.6.3. Suurimman uskottavuuden menetelmä ............................................................. 75 7.6.4. Valoisuuserojen vaikutus luokitteluun .............................................................. 77 7.6.5. Luokittelu Paraisten alueen referenssispektreillä ............................................ 79
8. YHTEENVETO ............................................................................................................ 81
LÄHDELUETTELO ........................................................................................................ 83
1
1. Johdanto
Hyperspektrikuvaus on yksi eniten kasvavimmista kaukokartoituksen sovelluksista tällä hetkellä.
Hyperspektrisovellusten historia ulottuu 80-luvun lopun tienoille. Tämän lyhyen historian ajan
hyperspektrikuvaus on kehittynyt varsin nopeasti. Vain muutamia vuosia sitten ei käytössä ollut
helppokäyttöisiä kaupallisia ohjelmia hyperspektrikuvien analysointiin. Silloin hyperspektrikuvien
analysointi vaati paljon työtä sekä erikoisalan ammattitaitoa. Monikanavakuville kehitettyjä
algoritmeja käytettiin myös paljon hyperspektrikuvien käsittelyssä sekä hyvällä että huonolla
menestyksellä. Nykyään kaukokartoitusohjelmat sisältävät erilaisia hyperspektridatan
analysointialgoritmeja, joita kehitellään lisää jatkuvasti.
Kuvaavien hyperspektri-instrumenttien kanavamäärää on onnistuttu kasvattamaan useisiin satoihin
hyvin kapeisiin kaistoihin huonontamatta liikaa laitteen spatiaalista erotuskykyä. Kuvaavien
spektrometrien myötä käytännön kaukokartoitus on löytänyt läheisen tieteenalan laboratoriossa
suoritettavista spektroskooppimittauksista [Tsai & Philpot 1998]. Materiaaleille laboratorio-oloissa
tehtyjä tarkkoja mittauksia voidaan nykyään käyttää hyväksi kaukokartoituksessa [Kokaly et al.
2002]. Tällä hetkellä useimmat hyperspektrikuvauksen käytännön sovellukset koskevat
lentokonekäyttöisiä spektrometrejä. Satelliitteihin on asennettu hyperspektrisensoreita, joilla on
saavutettu kymmenien metrien spatiaalinen erotuskyky kanavien lukumäärän ollessa joitakin
kymmeniä. Tulevaisuudessa myös kaukokartoitussatelliitteihin asennettujen kuvaavien
spektrometrien asema käytännön sovelluksissa tulee todennäköisesti kasvamaan. Tietokoneiden
laskentatehon, tiedonsiirtonopeuden sekä -tallennuskapasiteetin parantuminen ovat myös osaltaan
auttaneet suurten hyperspektrikuvien analysoinnissa.
Hyperspektrikuvien luokittelu perinteisillä tilastollisen hahmontunnistuksen menetelmillä voi olla
ongelmallista. Näiden algoritmien suoritusajat kasvavat usein eksponentiaalisesti verrattuna
kanavien lukumäärään. Algoritmit voivat muuttua kompleksisiksi tai niiden toiminta saattaa jopa
keskeytyä kokonaan kanavien suuren määrän sekä lineaarisesti riippuvien piirteiden takia. Vaikka
uudet menetelmät hallitsevat paremmin moniulotteisen datan käsittelyn, on piirteiden irroitus
edelleenkin tärkeä vaihe luokittelussa. Hyperspektridatan piirreavaruuden pienentäminen
matalaulotteisemmaksi säilyttäen piirteiden luonteet onkin yksi hyperspektridatan analysoinnin
ajankohtaisimmista ongelmista.
2
Hyperspektrikuvien luokittelualgoritmien toiminta perustuu usein kohteen koko ominaisspektrin
käyttöön eikä piirteiden irroitusta tarvitse yleensä tehdä. Näin heijastusspektrissä olevat
materiaalin ominaiset piirteet voidaan havaita tarkemmin. Tämä voi parantaa erilaisten
mineraalien, kasvilajien sekä ihmisen tekemien kohteiden identifiointia. Uudet algoritmit
soveltuvat paremmin hyperspektrikuvien luokitteluun. Ne ovat nopeampia ja lisäksi ne tuovat
uusia menetelmiä ja mahdollisuuksia luokittelun ongelmiin. Esimerkiksi Spectral Angle Mapper
luokittelee kohteet välittämättä kuvan tai kuvamosaiikin eri osien välisistä kirkkauseroista, joita
esiintyy usein kaukokartoituksessa esimerkiksi pilvien ja varjojen takia. Toisaalta Spectral
Unmixing -algoritmi pystyy erottamaan yksittäiseen pikseliin sekoittuneet useamman luokan
spektrit toisistaan.
Suomessa hyperspektrikuvausta on käytetty eri tahojen toimesta monipuolisissa tutkimuksissa.
Geologian tutkimuskeskuksessa on tutkittu hyperspektrikuvausta kaivosalueiden ympäristön ja
maaperän tulkinnassa [Arkimaa et al. 2002]. Metsäntutkimuslaitoksen tutkijat ovat olleet mukana
kehittämässä AISA-spektrometriä. Heillä on kokemusta AISA:n kalibroinnista sekä radiometrisistä
ja geometrisistä korjauksista. Lisäksi instrumenttia on käytetty suomen metsien inventoinnissa
sekä erilaisten kasvitautien havainnoinnissa [Mäkisara & Tomppo 1996]. Suomen
ympäristökeskuksessa on hyperspektrikuvilta tutkittu esimerkiksi vesistöjen laatua [Kallio et al.
2001] sekä ilmakehäkorjausta. Teknillisen korkeakoulun avaruustekniikan laboratoriossa AISA-
spektrometrin havaintoja on käytetty esimerkiksi lumipeitteen sekä Suomenlahden öljypäästöjen
tutkimiseen. Yhdysvalloissa tehdyissä hyperspektritutkimuksissa on useimmiten käytetty NASA:n
kehittämän AVIRIS-spektrometrin havaintoja.
Tässä diplomityössä on tutkittu AISA (Airborne Imaging Spectrometer for Applications) -
spektrometrin tuottamaa dataa, joka on tallennettu 17 kanavalle näkyvän valon ja lähi-
infrapunasäteilyn aallonpituuksille. Analysoinnissa on käytetty seuraavia PCI:n Geomatica-
ohjelmiston algoritmeja: Spectral Angle Mapper, Spectral Unmixing, Perceptron-neuroverkko,
minimietäisyyden menetelmä ja suurimman uskottavuuden luokittelija. Lisäksi erilaisten kohteiden
heijastusspektrejä on analysoitu sekä laskennallisesti että visuaalisesti tulostamalla
heijastusspektrejä xy-koordinaatistoon.
Työn tavoitteena oli tutkia AISA-kuvan soveltuvuutta maaperän ja kasvillisuuden luokitteluun.
Lisäksi haluttiin tutkia materiaalien identifiointia heijastusspektrien avulla sekä heijastusspektrien
3
vertailua. Uusia hyperspektrikuville soveltuvia algoritmeja haluttiin testata ja vertailla niitä
tavallisten luokittelualgoritmien kanssa. Lisäksi tavoitteena oli etsiä parempia metodeita
referenssispektrien keräämiseen ja editointiin, sillä niiden vaikutus oli luonnollisesti suuri kuvien
luokittelussa.
Diplomityön toisessa kappaleessa esitellään spektrometrit ja niiden tuottamat hyperspektrikuvat
sekä heijastusspektrit ja spektrikirjastot. Lisäksi tarkastellaan lähemmin AISA-instrumentin
rakennetta ja toimintaa. Kolmas kappale käsittelee erilaisia korjauksia, joita voidaan käyttää
kuvaavan spektrometrin tuottaman datan laadun parantamiseksi. Neljännessä kappaleessa
pohditaan hyperspektridatalle tehtävää piirteiden valintaa ja irroitusta. Viides kappale esittelee
työssä käytetyt luokittelualgoritmit ja kuudennessa kappaleessa esitellään tässä työssä käytetty
AISA-datan sekä kerrotaan miten Lammin alueen maastotyöt tehtiin. Seitsemännessä kappaleessa
analysoidaan kasvillisuusluokkien heijastusspektrejä ja tutkitaan eri luokkien välisiä
erottuvuusmittoja. Lisäksi pohditaan opetusalueiden ja referenssispektrien vaikutusta luokitteluun,
luokitellaan data eri algoritmeilla ja vertaillaan luokittelutuloksia.
4
2. Spektroskopia
Erilaisia spektrometrejä on käytetty paljon esimerkiksi avaruuden kaukokartoituksessa. Verraten
yksinkertaisen rakenteen omaavilla spektrometreillä on kerätty tietoa esimerkiksi auringon
rakenteesta tai avaruuden kaasuista [Bosche 1979]. Tutkittavat kohteet ovat olleet pistemäisiä tai
homogeenisia valonlähteitä, joten niiden spatiaalista vaihtelua ei ole tarvinnut ottaa huomioon.
Maanpinnan kaukokartoituksessa kuvausalueesta halutaan erottaa kohteet toisistaan, joten
spatiaalisen erotuskyvyn on oltava riittävän hyvä. Tekniikan kehittyminen on mahdollistanut
kuvaavien spektrometrien valmistamisen, joissa yhdistyy spektrometrin sekä perinteisen kuvaavan
keilaimen hyvät puolet. Kuvaavilla spektrometreillä voidaan saavuttaa tarkempia analyysejä sekä
ne mahdollistavat kokonaan uusien menetelmien käytön kaukokartoituksessa.
2.1. Spektrometrit
Spektrometrien historia ulottuu aina Isaac Newtonin (1642-1727) aikaan, jolloin hän käytti lasista
tehtyä prismaa erottamaan näkyvästä valosta spektrin värit. Myöhemmin spektristä, joka saatiin
ohjaamalla valo kapean raon läpi, havaittiin tummia viivoja. Joseph Fraunhofer (1787-1826)
kehitti diffraktiohilan ja tutki auringon sekä muiden tähtien spektreistä erottuvia tunnusomaisia
viivoja. Myöhemmin havaittiin, että tummat viivat eli absorptiospektrit syntyvät valon kulkiessa
matalalämpöisten kaasujen läpi. Vaaleat viivat eli emissiospektrit syntyvät vastaavasti kuumien
kaasujen emittoidessa säteilyä. Esimerkiksi auringosta saapuneesta säteilystä voidaan havaita
absorptiospektrejä sekä emissiospektrejä. Absorptiospektrit ovat syntyneet säteilyn vaikuttaessa
maan ilmakehän ja emissiospektrit auringon kaasukehän kanssa. Niels Bohr (1885-1962) keksi,
että eri kaasujen aiheuttamat spektrien tunnusomaiset viivat johtuivat kaasujen atomirakenteesta.
Tätä tietoa käytetään edelleen hyväksi mm. tähtien rakenteiden ja muiden avaruuden materiaalien
kaukokartoituksessa sekä laboratorioissa erilaisten materiaalien identifioinnissa [Campbell 1996].
Spektrometri eli spektroskooppi on laite, joka hajottaa instrumenttiin tulevan säteilyn spektriksi.
Spektrometrin toiminta perustuu prismaan, hilaan tai niiden yhdistelmään. Säteilyn kohdatessa
prisman, joka on optisesti ilmaa tiheämpää ainetta, säteilyn kulkusuunta muuttuu kuvan 2.1
esittämällä tavalla. Lyhimmät aallonpituudet taittuvat eniten, kun taas pidemmät aallonpituudet
taittuvat vähemmän. Hilan toiminta perustuu valon interferenssiin. Hyvin kapeiden aukkojen läpi
5
kulkenut säteily taittuu. Hilassa säteily taittuu siten, että pisimmät aallonpituudet taittuvat eniten ja
lyhimmät vähiten [Ohanian 1989].
Kuva 2.1: Prisma taittaa näkyvän valon spektriksi.
Prisman tai hilan tuottama jatkuva spektri ohjataan detektoreille tai perinteisissä instrumenteissa
filmille. Useat sadat detektorit havaitsevat kohdalleen osuneen kapean spektrinosan ja määrittävät
sen kirkkausarvon. Kohteen heijastusspektri saadaan peräkkäisten detektorien havaitsemista
kirkkausarvoista. Spektrometri vaatii tavallista kameraa pidemmän integrointiajan, sillä yksi
detektori havaitsee vain pienen osan tulevan säteilyn intensiteetistä. Lyhyellä integrointiajalla
detektoreille ei saada tarpeeksi säteilyä, joka pystyttäisiin rekisteröimään.
2.2. Kuvaavat spektrometrit
Kuvaavat spektrometrit tai hyperspektri-ilmaisimet ovat yleensä passiivisia ja havaitsevat
kohteesta heijastunutta tai emittoitunutta säteilyä näkyvän valon sekä infrapunasäteilyn
aallonpituuksilla. Nämä instrumentit kuvaavat kohdetta usein sadoilla eri kanavilla muodostaen
kohteesta kolmiulotteisen tietojoukon. Tavallisen kaksiulotteisen kuvan lisäksi hyperspektri-
instrumentti tuottaa kuvalle kolmannen ulottuvuuden, jossa säteilyn spektri on tallennettuna eri
kanaville. Näin instrumentin kuvaaman alueen jokainen pikseli sisältää jatkuvan heijastusspektrin.
Pelkästään suuri kanavien lukumäärä ei automaattisesti tarkoita että instrumentti olisi kuvaava
spektrometri. Hyperspektrisensoreissa kanavat ovat lisäksi hyvin kapeita, usein alle 10 nm leveitä,
ja sijaitsevat tasaisesti jakautuneena instrumentin havaitsemalla aallonpituusalueella [Lillesand &
Kiefer 2000].
Kaikille kuvaaville spektrometreille on yhteistä erittäin hyvä spektraalinen erotuskyky. Toisaalta
myös spatiaalisen erotuskyvyn halutaan nykyisin olevan kohtuullisen hyvä. Kuten edellä todettiin,
säteilyn jakaminen satoihin eri aallonpituusosiin prismassa tai hilassa heikentää vastaavasti yhdelle
6
detektorille saapuvaa säteilyn intensiteettiä. Siksi tarvitaan pitkähkö integrointiaika. Jos
spatiaalinenkin erotuskyky halutaan hyväksi, niin yhdelle detektorille tuleva säteilyn intensiteetti
pienenee edelleen, joten integrointiaikaa joudutaan taas kasvattamaan. Lentokoneiden sekä
kaukokartoitussatelliittien on kuitenkin liikuttava tiettyä nopeutta maahan nähden, jolloin
integrointiaikaa ei enää pystytä pidentämään lentämällä hitaammin. Pushbroom-tyyppisten
rivikeilaimien tulo markkinoille sekä CCD-kennojen nopea kehitys ovat kuitenkin mahdollistaneet
sen, mitä ennen pidettiin mahdottomana; hyvä spektraalinen sekä spatiaalinen erotuskyky samassa
kaukokartoitusinstrumentissa.
Kuvaavia spektrometrejä on asennettu lentokoneisiin sekä nykyään myös satelliitteihin.
Käytännössä instrumenttien toimintaperiaate sekä rakenne on samanlainen, mutta satelliitti-
instrumenteissa ei päästä yhtä hyvään spatiaaliseen ja spektraaliseen erotuskykyyn.
Satelliittikäyttöisten hyperspektri-instrumenttien spatiaalinen erotuskyky on parhaimmillaan
joitain kymmeniä metrejä ja kanavien lukumäärä on yleensä joitain kymmeniä. Lentokoneeseen
kiinnitetyllä spektrometrillä voidaan havaita useita satoja eri kanavia spatiaalisen erotuskyvyn
ollessa alle metrin luokkaa. Kuvaavien spektrometrien kehitys on ollut nopeaa ja varsinkin
satelliitti-instrumenttien spatiaalinen sekä spektraalinen erotuskyky tulevat vielä parantumaan
[Meer & Jong 2001].
Sekä satelliitilla, että lentokoneella on omat hyvät ja huonot puolensa hyperspektri-instrumentin
kuvausalustana. Kaukokartoitusprojektin luonne määrää kannattaako käyttää lentokonetta vai
satelliittia. Kaukokartoitussatelliitit sijaitsevat yli 100 kilometrin korkeudella ja niistä
havainnoidaan maastoa pienellä avaruuskulmalla. Niiden näkökenttä on pienempi kuin
lentokoneinstrumenteilla. Lentokonekäyttöisen instrumentin näkökenttä on erilainen kuvan eri
osissa, mikä johtuu siitä, että instrumentti havaitsee maastoa suurella avaruuskulmalla. Satelliitin
rata on hyvin sileä ja se eroaa suuresti lentokoneesta, jonka korkeus- sekä kallistusvaihtelut
aiheuttavat suuria geometrisia vääristymiä kuvalle. Näiden vääristymien korjaamiseksi
lentokoneen liikettä rekisteröidään GPS/INS-instrumentin sijainti- sekä inertiahavainnoilla.
Lentokonekäyttöisissä instrumenteissa signaali digitoidaan ja kirjoitetaan muistiin. Satelliitista
havaittu signaali joudutaan vielä siirtämään maahan. Tiedonsiirtojärjestelmä käsittää yleensä
geostationäärisellä radalla olevan tietoliikennesatelliitin, joka välittää signaalin satelliitista
maahan. Satelliittien suurempi näkökenttä ei aina johda yksinkertaiseen ja nopeaan projektiin.
Eräässä tutkimuksessa havaittiin, että Lontoon kartoittaminen Ikonos-kuvilla vaatisi noin 300
kuvaa. Ottaen huomioon Ikonos-satelliitin radan sekä Lontoon keskimääräisen pilvettömien
7
päivien määrän vuodessa tämä kartoitusprosessi veisi aikaa kokonaisen vuoden. Vastaavasti
lentokoneesta nämä kuvat voitaisiin ottaa yhdessä päivässä [Meer & Jong 2001].
Vaikka laitevalmistajat ilmoittavat hyperspektri-instrumenttiensa kykenevän tallentamaan satoja
spektrikanavia, niin käytännön mittauksissa kanavien lukumäärä jää huomattavasti pienemmäksi.
Instrumenttien monipuolisuus johtuu niiden ohjelmoitavuudesta. Kanavien spektraaliset
ominaisuudet, kuten havaittava aallonpituus ja aallonpituusalueen leveys voidaan ohjelmoida
jokaiselle kanavalle erikseen. Ohjelmoitavuus merkitsee myös sitä, että tallennettavat kanavat
voidaan valita eri kaukokartoitusprojekteille yksilöllisesti siten, että ainoastaan parhaimman
tuloksen antamat kanavat tallennetaan. Toisaalta kanavien leveyden, sijainnin ja lukumäärän
valinta on vaikeaa. Etukäteen ei aina tiedetä, mitä kaikkea datasta halutaan analysoida ja millä
aallonpituusalueilla piirteet eroavat toisistaan parhaiten. Lisäksi näin valittujen yksilöllisten
kuvien vertailu eri projektien välillä voi olla yhtä vaikeaa, kuin vertailu kokonaan eri
instrumenttien tuottamilla kuvilla.
2.3. AISA-spektrometri
AISA on kaupalliseen käyttöön suunniteltu lentokoneeseen asennettava pushbroom-tyyppinen
kuvaava spektrometri. AISA:n suunnitteluprojekti aloitettiin virallisesti vuonna 1992, vaikka
alustavia töitä oli tehty jo vuotta aikaisemmin. Laitteisto suunniteltiin VTT Automaatiolla.
Optiikka sekä elektroniikka suunniteltiin ja rakennettiin sen sijaan VTT Optoelektronisella
laboratoriolla. Ensimmäinen koelento tehtiin helmikuussa 1993 ja ensimmäinen kaupallinen versio
saatiin valmiiksi 1995. Aluksi instrumenttia markkinoitiin Karelsilva Oy:n toimesta. Nykyisin
instrumentin kehityksestä ja markkinoinnista vastaa Oululainen Spectral Imaging Ltd. Taulukon
2.1 mukaan AISA:sta on saatavilla kolme eri versiota: AISA+, AISA Eagle ja AISA Hawk.
AISA+ ja AISA Eagle toimivat näkyvän valon sekä lähi-infrapunasäteilyn aallonpituuksilla. Sen
sijaan AISA Hawk kerää kohteesta tietoa hieman pidemmillä aallonpituuksilla. Tässä työssä
käytetty AISA-data on kuvattu alkuperäisellä AISA-instrumentilla ja sen ominaisuudet poikkeavat
nykyisistä instrumenteista.
8
2.3.1. AISA:n rakenne
AISA:n rakenne voidaan jakaa hyperspektri-ilmaisimeen, GPS/INS-laitteesen sekä PC-yksikköön,
joka ohjaa hyperspektri-ilmaisinta ja tallentaa sen havaintoja. Lisäksi järjestelmään kuuluu
CaliGeo-ohjelma sekä FODIS (fiberoptic downwelling irradiance sensor) -ilmaisin. CaliGeo:n
avulla havaittu data voidaan jälkikäteen korjata. Sen avulla voidaan AISA-kuvista muodostaa
myös kuvamosaiikkeja. FODIS mittaa auringon irradianssia ilmakehässä ja sen tietoja käytetään
hyväksi AISA:n radiometrisessä korjauksessa. Hyperspektri-ilmaisin sisältää optiikan,
spektrografin sekä CCD-tai MCT-ilmaisimen. Laitteesta ja objektiivista riippuen AISA:lla
saavutetaan noin 1 metrin spatiaalinen erotuskyky kun lennetään tuhannen metrin korkeudesta.
Spatiaalisen erotuskyvyn lentosuuntaiseen komponenttiin vaikuttaa lentokoneen nopeus sekä
ilmaisimen integrointiaika. Integrointiaikaa voidaan säätää, jolloin erotuskyvyn lentosuuntainen
komponentti saadaan vastaamaan optiikan sekä ilmaisinrivin määräämää lentosuuntaa vastaan
olevaa erotuskyvyn komponenttia.
Taulukko 2.1: AISA-instrumenttien parametrit. Ensimmäinen sarake kuvaa instrumenttia, jonka
dataa on käytetty tässä työssä.
AISA AISA+ AISA Eagle AISA Hawk Kanavien lukumäärä 286 244 244 240 Havaittava aallonpituusalue 450-900 nm 400-970 nm 400-970 nm 1000-2400 nm Kuvalinjan pikselien lkm 384 512 1000 320 Kanavien kaistanleveys 1.6 nm 2.9 nm 2.9 nm 8 nm Objektiivi 24 mm 17/23 mm 17/23 mm 30 mm FOV 21° 39.7°/29.9° 39.7/29.9° 17.8° IFOV 0.055° 0.078°/0.058° 0.039°/0.029° 0.054° Output 12 bit 12 bit 12 bit 14 bit Instrumentin paino 4 kg 7 kg 6.5 kg 15.5 kg
2.3.2. AISA:n toiminta
AISA-instrumentissa säteily ohjataan optiikan jälkeen 30 µm leveän raon läpi, joka tuottaa
säteilystä kapean keilan. Seuraavaksi keila kulkeutuu spektrografiin, joka muodostuu kahdesta
prismasta sekä niiden välissä olevasta hilasta. Spektrografissa säteily taittuu aallonpituutensa
mukaan ja samalla kapea keila leviää spektriksi, joka ohjataan CCD-ilmaisimeen. CCD-ilmaisin
muodostuu matriisista, jonka lukuisat elementit rekisteröivät niille saapuneen säteilyn. Oletetaan,
9
että ilmaisimen sarakkeet ovat yhdensuuntaisia lentosuunnan kanssa ja rivit kohtisuorassa
lentosuunnasta. Tällöin ilmaisimen sarakkeet edustavat kukin vastaavaa pistettä ilmaisimen
havaitsemasta keilasta. Näin yksi sarake sisältää tietoa samasta maaston kohteesta eri
aallonpituuksilla mitattuna. Käytännössä ilmaisimen sarakkeet vastaavat siis heijastusspektrejä.
Ilmaisimen sarakkeilla sijaitsevien säteilyä rekisteröivien elementtien lukumäärä määrää siten
instrumentin kanavien lukumäärän. Kanavien lukumäärän lisäksi spektraaliseen erotuskykyyn
vaikuttaa myös kanavien leveydet. Ilmaisimen rivit edustavat sen sijaan spektrografissa hajotetun
säteilyn aallonpituutta. Kullakin rivillä aallonpituus on vakio, mutta sijainti ilmaisimen
havaitsemassa keilassa muuttuu. Riveillä sijaitsevien elementtien lukumäärä määrää siten
instrumentin havaitseman kuvan pikselien lukumäärän keilauslinjan leveyssuunnassa, eli
spatiaalisten pikselien lukumäärän. [Mäkisara et al. 1993]
Ilmaisimen tuottama 12 (AISA+ ja Eagle) tai 14 (Hawk) bittinen digitaalinen data tallennetaan
AISA:n PC-yksikköön, jonka kovalevyt voidaan vaihtaa uusiin kesken kuvausprojektin. GPS/INS-
ilmaisimen rekisteröimät lentokoneen kallistus- ja sijaintihavainnot tallennetaan myös PC-
yksikköön. Näiden havaintojen avulla AISA-datasta voidaan poistaa geometriset vääristymät, jotka
johtuvat lentokoneen satunnaisista liikkeistä.
Kuva 2.2: AISA-instrumentti sekä GPS/INS-yksikkö [Specim 2003].
AISA on ohjelmoitava, joten käyttäjä voi määrätä kuinka paljon kanavia halutaan käyttää ja mitä
aallonpituusaluetta kukin kanava edustaa. Näin AISA:lla havaittujen kanavien lukumäärää voidaan
vähentää kun tiedetään, mitkä aallonpituusalueet ovat mittausprojektin kannalta merkityksettömiä.
Vähentämällä kanavien lukumäärää voidaan instrumentin kuvaaman keilauslinjan integraatioaikaa
10
pienentää, mikä on tärkeää kun kuvataan nopeasti ja matalalla lentävästä koneesta. AISA+ toimii
kahdella eri käyttömoodilla. Moodi A:ssa valitaan 244-61 kappaletta jatkuvia ja kapeita
spektrikanavia. Moodi B:ssä valitaan enintään 61 kappaletta kanavaa, tietyiltä aallonpituusalueilta.
Nämä kanavat voivat olla leveämpiä eivätkä ne sijaitse peräkkäin jatkuvana sarjana vaan niiden
välissä voi olla aallonpituusalueita, joita ei tallenneta. [Specim 2003]
2.4. Heijastusspektri
Eri materiaalit heijastavat ja absorboivat eri tavalla sähkömagneettisen säteilyn aallonpituuksia.
Heijastuksen sekä absorption suuruudet vaihtelevat eri aallonpituuksilla. Materiaalin
heijastusspektri saadaan piirtämällä materiaalin heijastaman säteilyn voimakkuus aallonpituuden
funktiona. Kun hyperspektri-instrumentilla kuvataan materiaalia sadoilla kapeilla kanavalla,
saadaan kohteen heijastusspektri kuvattua jatkuvana käyränä, joka myötäilee tarkasti kohteen
ominaisia heijastuksen sekä absorption suhteita eri aallonpituuksilla, kuten kuvissa 2.3a ja 2.3b
nähdään. Väliaine, eli yleensä ilmakehä, vaikuttaa kuitenkin sirottamalla ja absorboimalla säteilyä,
joten kohteen ominaisspektri ei ole sama kuin instrumentin havaitsema spektri. Tämä voidaan
kuitenkin huomioida ilmakehämallin avulla.
Kuvat 2.3a ja 2.3b: Kuva 2.3a esittää ruohon heijastusspektriä 0-14 µm alueella. Kuvassa 2.3b on
esitetty tarkemmin saman materiaalin heijastusspektri näkyvän valon sekä lähi-infrapunasäteilyn
alueella. Heijastusarvot on saatu ASTER-spektrikirjastosta.
11
Kuva 2.4: Sähkömagneettisen spektrin näkyvän valon sekä infrapunasäteilyn alueet. Jaottelu
infrapunasäteilyn alueiden väleillä on joustava ja vaihtelee jonkin verran eri piireissä.
Instrumenttien mittaama kohteesta heijastunut säteily on peräisin auringosta. Auringon spektri on
jatkuva eli siinä on kaikkia aallonpituuksia. Maan ilmakehä absorboi voimakkaasti auringon
ultraviolettisäteilyä sekä lyhyempiä aallonpituuksia. Käytännössä kuvaavien spektrometrien
havaitsevat lyhimmät aallonpituudet ovat siten noin 0.3 µm. Auringon säteilyn maksimi sijaitsee
0.5-0.55 µm kohdalla ja sen jälkeen säteilyn intensiteetti alkaa laskea aallonpituuden kasvaessa.
Tietyn materiaalin heijastusspektri on usein yksilöllinen, joten kyseinen materiaali voidaankin
tunnistaa ja erottaa muista materiaaleista heijastusspektrinsä avulla. Luokittelualgoritmit Spectral
Angle Mapper, Spectral Correlation Mapper ja Spectral Feature Fitting perustuvat suoraan
heijastusspektrien vertailuun. Luonnossa eri materiaalit ovat usein sekoittuneet keskenään, jolloin
myös niiden heijastusspektri sisältää sekalaisen yhdistelmän eri materiaalien ominaisista
heijastuksista sekä absorptioista. Jos sekoittuneiden materiaalien heijastusspektrit tunnetaan, niin
materiaalien suhteelliset määrät voidaan laskea sekoittuneesta heijastusspektristä. Spectral
Unmixing -algoritmi on kehitetty etsimään eri materiaalit ja niiden määrät sekoittuneesta
heijastusspektristä.
2.5. Materiaalien heijastusominaisuudet
Säteilyn osuessa materiaaliin fotonit, joilla on sopiva aallonpituus, voivat virittää materiaalin
atomeja. Tällöin atomi absorboi fotonin ja samalla atomin energiatila muuttuu korkeammaksi.
Atomin energiatila palautuu useimmiten takaisin ja samalla atomi luovuttaa fotonin (emissio)
uudella aallonpituudella. Erilaiset atomit virittyvät kukin tietyllä aallonpituudella ja vapauttavat
tietyn aallonpituista ominaista säteilyä, jota havaitsemalla kyseiset atomit voidaan tunnistaa.
12
Käytännössä atomit ovat sekoittuneet havaittavassa materiaalissa ja niiden muodostamasta
spektristä ei voida erottaa yksittäisiä komponentteja.
Mineraalien heijastusominaisuudet johtuvat niiden kemiallisesta koostumuksesta sekä
kiderakenteesta. Näkyvän valon sekä lähi-infrapunasäteilyn alueella mineraalien
heijastusominaisuuksiin vaikuttavat eniten mineraalissa olevat vapaat metalli-ionit. Lähi-
infrapunasäteilyn pidemmillä aallonpituuksilla mineraalien vesi-, hydroksidi-, karbonaatti- sekä
sulfaattipitoisuudet aiheuttavat mineraaleille niiden ominaiset absorptiopiirteet. [Meer & Jong
2001]
Kasvillisuuden heijastusominaisuutta tutkittaessa on pääosin keskitytty kasvin vihreiden lehtien
ominaisuuksiin. Näkyvän valon alueella kasvin fotosynteettiset pigmentit aiheuttavat
absorptiopiirteitä. Fotosynteettisistä pigmenteistä tärkeimpiä ovat klorofylli a ja b. Ne absorpoivat
auringon säteilyä 0.66 ja 0.68 µm alueilla. Red edge on heijastusspektrissä noin 0.7 µm kohdalla
oleva absorptioreuna, jonka jälkeen kasvillisuuden heijastus kasvaa voimakkaasti, kuten kuvassa
2.5 näkyy selvästi. Klorofyllipitoisuuksien muutokset näkyvät spektrissä red edgen siirtymisenä.
Jos klorofyllin määrä vähenee, niin red edge siirtyy vasemmalle, lyhyempien aallonpituuksien
suuntaan. Klorofyllin lisääminen siirtää red edgeä kohti spektrin infrapunasäteilyn osaa. Lähi-
infrapunasäteilyn alueella kasvillisuuden spektriin vaikuttaa eniten kasvien sisältämä vesi sekä
orgaaniset yhdisteet kuten selluloosa, ligniini, tärkkelys sekä valkuaisaine. [Meer & Jong 2001]
Kuva 2.5: Erilaisten materiaalien heijastusspektrit näkyvän valon sekä lähi-infrapunasäteilyn
alueella. Eri materiaalien heijastusarvot on saatu ASTER-spektrikirjastosta.
13
Maaperän heijastukseen vaikuttaa sen fysikaaliset sekä kemialliset ominaisuudet. Maaperä koostuu
pääosin vedestä, maan seassa olevasta ilmasta sekä epäorgaanisista ja orgaanisista aineista.
Maaperän rauta vaikuttaa voimakkaasti heijastusspektriin näkyvän valon sekä lähi-
infrapunasäteilyn aallonpituuksilla aina 1.0 µm asti. Hydroksidipitoiset mineraalit aiheuttavat
huomattavan jäljen spektriin 2.74 µm kohdalle. Karbonaatit sekä kerrostuneet silikaatit, kuten savi,
aiheuttavat spektrissä näkyviä absorptiopiirteitä lähi-infrapunasäteilyn alueella. Maaperään
sekoittunut orgaaninen aine pienentää heijastusta koko näkyvän valon sekä lähi-infrapunasäteilyn
alueella. Heijastuksen pienentyessä absorptiopiirteiden vaikutus vähenee spektrissä, joten
orgaaninen aines voi vaikeuttaa maaperän muiden aineiden havainnointia. Jos maaperässä on vettä,
niin se aiheuttaa huomattavan absorptiovaimennuksen 1.4 ja 1.9 µm kohtiin. Näkyvän valon sekä
infrapunasäteilyn alueella kosteus vähentää maaperän kokonaisheijastusta. Maaperän suuret
hiukkaset aiheuttavat pienemmän ja pienet hiukkaset suuremman kokonaisheijastuksen. [Meer &
Jong 2001]
2.6. Hyperspektrikuva
Hyperspektrikuva on kuvaavan spektrometrin maastosta tuottama 3-ulotteinen tietokanta.
Tavallisella harmaasävykuvalla jokaiselle pikselille on annettu numeroarvo, joka kuvaa pikselin
kirkkautta. 8-bittisellä kuvalla jokainen pikseli voi saada 256 erilaista harmaasävyarvoa. RGB-
värikuvan pikselit saavat kolme eri arvoa, jotka edustavat pikselin punaisen, vihreän ja sinisen
värin kirkkautta. Näiden päävärien sekoituksina voidaan näytölle muodostaa vaikutelmat eri
väreistä.
Hyperspektrikuva muodostuu useista päällekkäisistä kuvista, joista jokainen esittää samaa aluetta
eri aallonpituusalueilla kuvattuna. Nämä eri aallonpituusalueiden kuvat eli hyperspektrikuvan
kanavat määrittävät kukin hyvin kapean aallonpituusalueen. Kanavat sijaitsevat lisäksi perätysten
kuvaten tarkasti laajemman aallonpituusalueen. Hyperspektrikuva eroaa multispektrikuvasta siten,
että multispektrikuvan kanavat ovat huomattavasti leveämpiä, eivätkä ne sijaitse jatkuvana sarjana
koko aallonpituusalueen yli vaan kanavien väliin jää usein tyhjiä alueita. Hyperspektrikuvan
pikseli saa yhtä monta numeroarvoa kuin instrumentissa on kanavia. Pikselin voidaan ajatella
olevan vektori, jonka alkioita ovat instrumentin havaitsemat heijastusarvot eri kanavilla. Näin
jokainen pikseli käsittää yksityiskohtaisen spektrin, joka sisältää usein tarpeeksi informaatiota
pikselillä sijaitsevan materiaalin identifioimiseksi.
14
Kuva 2.6: Hyperspektrikuva muodostuu useista samaa aluetta eri aallonpituuksilla kuvaavista
harmaasävykuvista.
Tietokone käyttää RGB-menetelmää kuvien esittämiseen. Samoin ihmisen näköjärjestelmä on vain
kolmikanavainen. Hyperspektrikuvan sadoista kanavista joudutaan siten valitsemaan 3 kanavaa,
jotka halutaan esittää. Tämä merkitsee, että hyperspektrikuvalla on enemmän tietoa verrattuna sen
3-kanavaiseen visualisointiin, jonka ihminen pystyy havaitsemaan.
Hyperspektrikuva sisältää huomattavasti enemmän tietoa verrattuna tavalliseen kuvaan. Jo
tavallisen 3-kanavaisen RGB-värikuvan havaitaan helposti sisältävän enemmän informaatiota
verrattuna harmaasävykuvaan. Hyperspektrikuva voi teoriassa sisältää jopa sata kertaa enemmän
tietoa verrattuna harmaasävykuvaan. Sama pätee myös hyperspektrikuvan kokoon, joka on tällöin
100-kertainen. Käytännössä hyperspektrikuvan kanavat korreloivat hyvin paljon, joten
hyperspektrikuvan kanavat voidaan tiivistää muutamaan tärkeimpään kanavaan
pääkomponenttimuunnoksella. Usein onkin mahdollista ja järkevääkin pudottaa korreloivia
kanavia pois tai laskea uusia korreloimattomia kanavia. Hyperspektridatan tiivistäminen ei
kuitenkaan ole aina järkevää. Siinä voidaan hävittää eri kohteiden väliset pienet piirteiden erot,
jotka saattavat olla merkittäviä kohteiden erottamisessa tai analysoinnissa.
2.7. Spektrikirjasto
Spektrikirjasto on laboratorio- tai maastomittauksilla koottu tietokanta eri materiaalien spektreistä.
Spektrien mittaamisessa voidaan käyttää tarkkoja hilaspektrometrejä, joilla mitataan halutun
materiaalin heijastusta sadoilla tai jopa tuhansilla erittäin kapeilla aallonpituusalueilla. Kuvaavan
spektrometrin mittaamia havaintospektrejä voidaan verrata spektrikirjaston tunnettuihin
15
spektreihin. Vertailussa käytetään erilaisia spektreiltä laskettuja tunnuslukuja. Jos spektrit
täsmäävät riittävällä tarkkuudella, niin havaintospektrin sekä spektrikirjaston spektrin voidaan
olettaa edustavan samaa materiaalia. Vertailussa on syytä ottaa huomioon spektrikirjaston ja
havaittujen spektrien väliset erot mitattujen heijastusten tarkkuuksissa sekä varsinkin kanavien
leveyksissä. Lisäksi täytyy ottaa huomioon ilmakehä, joka vaikuttaa havaittuun spektriin.
ASTER Spectral Library on tunnetuin kansainvälinen spektrikirjasto. Se sisältää tietoa kolmesta
eri spektrikirjastosta: Johns Hopkins University Spectral Library, Jet Propulsion Laboratory
Spectral Library sekä U. S. Geological Survey Spectral Library. ASTER Spectral Library
määrittää melkein 2000 erilaisen materiaalin spektrin, joista suurin osa on erilaisia mineraaleja tai
ihmisen tekemiä materiaaleja, mutta sekaan mahtuu myös kasvillisuuden, maaperän sekä jään,
lumen ja veden spektrejä. Materiaalien spektrit on mitattu näkyvän valon sekä lähi-
infrapunasäteilyn alueella. Osalle mineraaleista mittauksia on jatkettu vielä pidemmälle keski-
infrapunasäteilyn alueelle - aina 25 mikrometriin asti.
Koska ASTER Spectral Libraryn spektrit on kerätty kolmesta erillisestä spektrikirjastosta, joissa
on käytetty erilaisia spektrometrejä niin eri spektrien tarkkuudet vaihtelevat hieman. Lisäksi saman
spektrin näkyvän valon ja lähi-infrapunasäteilyn aallonpituudet ovat usein mitattu eri
instrumentilla kuin pidemmät infrapunasäteilyn aallonpituudet. Esimerkiksi Johns Hopkins
University Spectral Libraryn kanavien leveydet ovat yleensä alle 8 nanometriä 0.4 - 2.5
mikrometrin alueella ja materiaalien absoluuttinen heijastus on mitattu ± kolmen prosentin
tarkkuudella. Mittauksissa on käytetty tarkkoja hilaspektrometrejä laboratorio-olosuhteissa, joten
spektrikirjastojen spektrit ovat paljon tarkempia kuin kuvaavien spektrometrien spektrit. [ASTER
Spectral Library 2004]
Tässä diplomityössä on havaintospektrejä vertailtu enimmäkseen keskenään, jolloin
heijastusspektrin kanavien lukumäärä, sijainti ja tarkkuus on eri spektreillä sama. Vertailussa on
myös käytetty Geomatican omaa spektrikirjastoa, joka on saatu U. S. Geological Survey:n
mittauksista.
16
3. Kuvaavan spektrometrin tuottaman datan korjaukset
Kuvaavan spektrimetrin tuottama data sisältää erilaisia virheitä, joita syntyy esimerkiksi
ilmakehän, kuvausgeometrian sekä kuvausalustan liikkeiden takia. Nämä virheet voidaan jakaa
radiometrisiin ja geometrisiin virheisiin ja niiden vaikutukset pyritään minimoimaan datan
esikäsittelyssä erilaisilla korjauksilla. Geometrisellä korjauksella pyritään korjaamaan kuvauksen
geometriset vääristymät, kun taas radiometrisellä korjauksella pyritään muuttamaan instrumentin
havaitsema säteily vastaamaan maastosta heijastunutta ja emittoitunutta säteilyä. Nykyään
kuvauksessa korjataan osa näistä virheistä automaattisesti. Tämä perustuu instrumentin
kalibrointitietoihin, lentokoneessa olevan GPS/INS laitteen sijainti- sekä kallistushavaintoihin sekä
lentokoneen katolla olevaan detektoriin, jolla havaitaan auringon irradianssi. Kuitenkin suurin osa
korjauksista jää tehtäväksi myöhemmin datan esikäsittelyvaiheeseen.
3.1. Geometrinen korjaus
Kuvaavat spektrometrit ovat pushbroom-tyyppisiä keilaimia. Ne kuvaavat kohdetta rivin
kerrallaan ja lentokoneen tai satelliitin kulkiessa eteenpäin ne kuvaavat seuraavan rivin ja
muodostavat näin kohteesta kuvan. Eri häiriöt, jotka vaikuttavat kuvausalustaan tai instrumenttiin,
sekä kuvausgeometria ja maanpinnan ominaisuudet aiheuttavat geometristä vääristymistä
hyperspektridatalle. Lentokoneen tai satelliitin poikkeavat liikkeet vakionopeudesta, korkeudesta
ja suunnasta sekä kuvausalustan kallistelut aiheuttavat vääristymiä kuvausgeometriaan. Erityisen
paljon virheitä syntyy, kun kuvausalustana käytetään epävakaata yksimoottorista pienlentokonetta.
Sen sijaan kaukokartoitussatelliittien radat ovat hyvin stabiileja, eikä silloin synny yhtä paljon
virheitä. Lentokoneen kallistukset sekä nopeuden ja korkeuden muutoksia voidaan rekisteröidä
GPS/INS-laitteella ja virheet voidaan korjata datasta.
Maapallon pyöriminen aiheuttaa virheitä kaukokartoitussatelliittien tuottamaan dataan. Maapallo
ehtii pyörähtämään hieman keilaimen kuvaamien rivien välillä, joten kuvauslinja kaartuu hiukan
maan liikkeen suuntaan. Myös maanpinnan kaarevuus aiheuttaa virhettä satelliitti-instrumenteissa,
joissa on suuri keilainleveys. Nämä virheet ovat vakioita ja ne voidaan korjata helposti, kun
tiedetään maan pyörimisnopeus sekä kaarevuus. Maaston topografia aiheuttaa virheitä ja eteenkin
vuoristoisella alueella maaston korkeusvaihtelut aiheuttavat suuria virheitä, jotka voidaan
17
kuitenkin korjata käyttäen apuna digitaalista korkeusmallia. Instrumentin optiikassa linssien
epätasaisuudet sekä niiden sijaintien epätarkkuudet aiheuttavat virheitä, joiden suuruudet voidaan
määrittää jo laitteen kalibroinnissa.
Geometriset virheet voidaan korjata kahdella eri tekniikalla. Virheen ominaisuudet ja suuruus
voidaan mallintaa sekä poistaa niiden vaikutus. Tällöin eri syistä syntyneille vääristymille
muodostetaan kullekin erikseen omat mallit. Virheiden mallintaminen onnistuu, kun niiden
syntymekanismi sekä laatu tunnetaan hyvin. Toinen tapa korjata geometriset vääristymät on
verrata kuvalla näkyvien kohteiden sijaintia sekä niitä vastaavia maaston koordinaatteja. Kun koko
kuvan alueelta havaitaan runsaasti pisteitä, joiden maastokoordinaatit tunnetaan, voidaan kaikki
kuvan geometriset vääristymät korjata samalla kertaa, vaikka yksittäisten virheiden
syntymekanismia ei tunnettaisikaan. Tämä menetelmä on suositumpi sekä helpompi käyttää, jos
pisteiden maastokoordinaatit ovat tunnettuja. [Richards & Xiuping 1999]
3.2. Radiometrinen korjaus
Ilma- sekä satelliittikuvauksessa syntyy usein huomattavia radiometrisiä virheitä. Nämä virheet
haittaavat kuvien visuaalista tulkintaa sekä huonontavat luokittelutuloksia. Virheet voivat olla
satunnaisia, esimerkiksi heterogeenisen ilmakehän aiheuttamia, tai ne voivat riippua esimerkiksi
kuvausgeometriasta ja maaston topografiasta. Lentokäyttöinen kuvaava spektrometri keilaa aluetta
usein linjoittain. Eri linjoja kuvatessa valaistus voi muuttua hyvinkin paljon vaihtelevan sään takia.
Tällöin kuvalle tulee valoisuuseroja, jotka huonontavat kuvan tulkittavuutta. Radiometrinen
korjaus on erityisen tärkeää, kun vertaillaan keskenään eri alueista tai eri ajankohtina otettuja
kuvia. Lisäksi eri instrumenttien tuottamien kuvien vertailu keskenään sekä havaitun spektrin ja
spektrikirjaston spektrin vertailu edellyttää radiometristen virheiden korjausta.
Hyperspektrikuvaus perustuu yleensä auringosta saapuneen ja kohteesta heijastuneen valon
havainnointiin. Useimmissa luonnonkohteissa tapahtuu diffuusi heijastus eli säteily kimpoaa niistä
kaikkiin suuntiin kuvan 3.1a esittämällä tavalla. Heijastuneen säteilyn intensiteetti riippuu säteilyn
heijastus- sekä tulokulmasta ja se on suurimmillaan kun säteilyn heijastuskulma on sama kuin
tulokulma. Luonnon eri materiaalit heijastavat säteilyä lisäksi kukin omalla tavallaan suhteessa
säteilyn heijastus- sekä tulokulmiin. Lisäksi kohteista saataviin heijastusarvoihin vaikuttaa
heijastavan kohteen pinnan orientaatio sekä instrumentin sijainti kohteen ja auringon suhteen.
18
Tämä johtaa siihen, että luonnossa samanlaisen heijastuksen aiheuttavat kohteet saavat kuvan eri
osissa erilaisen heijastusarvon. Tätä virhettä on vaikea korjata, sillä siihen vaikuttaa paljon erilaisia
tekijöitä, joita on vaikea ottaa huomioon.
Kuvat 3.1a ja 3.1b: (a) diffuusi heijastus ja (b) peiliheijastus.
Auringon sekä instrumentin sijainnin ja maaston topografian yhteistä vaikutusta radiometrisiin
virheisiin voidaan korjata käyttämällä apuna digitaalista korkeusmallia sekä tietoja auringon ja
instrumentin sijainnista. Suomessa tätä BRDF (bidirectional reflectance distribution function) -
mallinnusta on tutkittu Geodeettisessa laitoksessa [Peltoniemi 1997]. Virheiden korjaaminen on
kuitenkin vaikeaa, joten käytännössä kuvaukset tulisi suunnitella siten, että mahdollisimman vähän
virheitä syntyy. Lentokoneesta suoritettavat kuvaukset kannattaa suunnitella suoritettavaksi
sellaiseen ajankohtaan, että aurinko on suhteellisen korkealla ja eri päivinä suoritetut kuvaukset
kannattaa suorittaa samaan vuorokauden aikaan, jolloin radiometriset virheet eivät vaikuta niin
paljoa. Radiometristen virheiden määrä kasvaa, kun kuvataan maastoa, joka sisältää suuria
korkeusvaihteluita ja käytetään viistokuvausta.
3.3. Ilmakehäkorjaus
Sähkömagneettisen säteilyn kulkeutuessa ilmakehässä ja vuorovaikuttaessa ilmakehän hiukkasten
kanssa sen ominaisuudet muuttuvat. Säteilyn nopeus, taajuus, intensiteetti ja suunta muuttuvat,
mikä aiheuttaa kaukokartoituksessa radiometristä virhettä. Virheiden suuruudet riippuvat säteilyn
aallonpituudesta sekä ilmakehän ominaisuuksista. Ilmakehän molekyylit absorboivat säteilyä,
kukin ominaisella aallonpituudella. Aerosolit sirottavat säteilyä. Ilmakehän kaasut ja aerosolit ovat
sekoittuneet heterogeenisesti ja varsinkin aerosolien suhteet ja määrät saattavat muuttua hyvinkin
nopeasti, esimerkiksi ilmavirtausten ansiosta. Aerosolit ovat ilmakehässä leijuvia molekyylejä
suurempia hiukkasia. Osa aerosoleista on syntynyt ihmisen toimien seurauksena, mutta niitä
syntyy ja joutuu ilmaan myös luonnon omien prosessien seurauksena. Esimerkiksi palamisessa
19
syntyvät savuhiukkaset sekä tuulen nostattama pöly ovat aerosoleja. Säteilyn lyhyet aallonpituudet
reagoivat voimakkaimmin ilmakehän hiukkasten kanssa. Näkyvä valo, varsinkin sen sininen
osuus, siroaa voimakkaasti ilmakehässä. Sinistä valoa lyhyempää säteilyä ei voi enää käyttää
kaukokartoituksessa hyväksi lukuun ottamatta joitakin erikoissovellutuksia.
Kuvaavat spektrometrit havaitsevat useimmiten näkyvän valon sekä lähi- ja keski-
infrapunasäteilyn alueita. Säteily muuttuu kulkeutuessaan ilmakehän läpi, joten instrumenttien
havaitsema säteily ei vastaa täysin kohteesta heijastunutta säteilyä. Ilmakehäkorjauksella pyritään
poistamaan ilmakehän säteilylle aiheuttama vaikutus kohteen ja instrumentin väliltä. Instrumentin
havaitsema säteily korjataan kohteen heijastamaksi säteilyksi. Ilmakehä myös emittoi säteilyä
pidemmillä aallonpituuksilla. Tämä täytyy ottaa huomioon käytettäessä instrumentteja, jotka
pystyvät havaitsemaan pidempiä infrapunasäteilyn taajuuksia. Tällaisella alueella toimivia
hyperspektri-instrumentteja käytetään esimerkiksi geologisissa kaukokartoitusprojekteissa, joissa
etsitään erilaisia mineraaleja.
3.3.1. Ilmakehän sironta
Suurin osa silmiimme saapuneesta säteilystä on sironnutta säteilyä. Esimerkiksi taivaalta tai
pilvistä saapunut säteily [Paltridge & Platt 1976]. Sironnassa auringosta lähtenyt tai maasta
heijastunut säteily vuorovaikuttaa ilmakehän suurten molekyylien sekä aerosolien kanssa. Eniten
sirontaa tapahtuu ilmakehän alaosassa, jossa on paljon aerosoleja ja ilmakehä on tiheämpää.
Sironnassa fotonin energia ei muutu esimerkiksi lämmöksi. Sen sijaan säteen kulkusuunta voi
muuttua. Sironnan laatu ja merkitys riippuvat sirottavan hiukkasen suuruudesta verrattuna
sironneen säteen aallonpituuteen [Schott & Henderson-Sellers 1984].
Pääosin molekyylit, mutta myös hyvin pienet ilmakehän hiukkaset, joiden koko on noin 1/10 tai
vähemmän näkyvän valon aallonpituudesta, aiheuttavat Rayleigh-sirontaa. Säteilyn aallonpituus
vaikuttaa sironnan määrään siten, että valon lyhyimmät aallonpituudet siroavat eniten. Tästä johtuu
mm. taivaan sininen väri, sillä sininen valo siroaa ilmakehässä noin neljä kertaa punaista valoa
enemmän. Kuvan 3.2a mukaan säteily kimpoaa melko tasaisesti kaikkiin suuntiin osuessaan
ilmakehän hiukkasiin tai molekyyleihin. Tämän takia taivas näyttää kauttaaltaan tasaisen siniseltä.
20
Säteilyn siroamista suurista hiukkasista, joiden koko on samaa luokkaa säteilyn aallonpituuden
kanssa, kutsutaan Mie-sironnaksi. Ilmakehän pöly- ja savuhiukkaset ovat vastuussa Mie-
sironnasta. Mie-sironnassa säteily siroaa kyllä kaikkiin suuntiin, mutta eniten säteilystä siroaa
eteenpäin kuvan 3.2b mukaan, eli yksittäisen säteen suunta muuttuu vain hiukan. Havainnoitsija
näkee ilmakehän Mie-sironnan esimerkiksi vaaleana kiekkona tai utuna auringon ympärillä, koska
suurin osa Mie-säteilystä siroaa eteenpäin.
Kuvat 3.2a ja 3.2b: (a) Rayleigh- sekä (b) Mie-sironta.
Valikoimatonta sirontaa tapahtuu silloin kuin hiukkaset ovat moninkertaisesti niihin osuneen
säteilyn aallonpituutta suurempia. Yleensä tällaiset raskaat hiukkaset sijaitsevat ilmakehän
alaosissa ja esimerkiksi sumu johtuu niiden sirottamasta säteilystä. Pilviin tiivistynyt vesihöyry
aiheuttaa myös valikoimatonta sirontaa. Valikoimaton sironta on nimensäkin mukaan
aallonpituudesta riippumatonta, joten se sisältää kaikkia auringon säteilyn aallonpituuksia yhtä
paljon. Tämän takia pilvet ja sumu näkyvät valkoisina tai harmaina.
3.3.2. Ilmakehän absorptio
Absorptiossa fotoni törmää ilmakehän molekyyliin ja fotonin energia siirtyy molekyylille.
Molekyyli voi emittoida tämän jälkeen uuden fotonin eri aallonpituudella. Ilmakehän kaasut
absorboivat säteilyä tietyillä aallonpituuksilla kuvan 3.3 esittämällä tavalla. Kaasuista happi, typpi,
hiilidioksidi, otsoni ja vesihöyry ovat pääosin vastuussa ilmakehän aiheuttamasta absorptiosta
[Cracknell & Hayes 1991]. Korkealla ilmakehässä absorptiokaasujen tiheys on hyvin pieni, joten
hyvin pieni määrä säteilystä absorboituu siellä. Toisaalta maan pinnan lähellä kaasujen tiheys on
suurimmillaan, mutta silloin ilmakehän läpi kulkeutuneen säteilyn absorptiokaistoista on suurin
osa jo suodattunut pois, joten alailmakehänkin absorptio on hyvin vähäistä.
21
Kuva 3.3: Ilmakehän absorptio säteilyn aallonpituuden funktiona [EUMETSAT 2004].
Säteilyn käyttäytymistä ilmakehässä voidaan mallintaa eri tavoilla. Säteilyn käyttäytyminen
riippuu lukuisista eri tekijöistä, mikä tekee sen ennustamisesta hyvin vaikeaa. Neljä yleisimmin
käytettyä menetelmää ilmakehän virheiden korjaamiseen ovat: säteilyn kulun mallintaminen,
tumman pikselin vähentäminen, radianssi/heijastussuhde-muunnos sekä regressioon perustuva
tekniikka. Säteilyn kulun mallintamisessa ilmakehän ominaisuuksista kerätään kuvaushetkellä
havaintoja. Näiden havaintojen avulla ilmakehästä muodostetaan teoreettinen malli, jonka avulla
voidaan arvioida säteilyn käyttäytymistä ilmakehässä. Tumman pikselin vähentämisessä etsitään
kuvalta kaikkein tummin pikseli. Esimerkiksi infrapunakanavan arvo syvässä, kirkkaassa vedessä.
Tällaisen pikselin heijastus oletetaan nollaksi ja instrumenttiin saapuvan säteilyn arvo, joka on
suurempi kuin nolla, oletetaan johtuvan ilmakehän vaikutuksesta. Vähentämällä tämä tumman
pikselin arvo kaikkien muiden kanavien pikseleistä saadaan ilmakehän vaikutusta korjattua.
Radianssi/heijastussuhde-muunnoksessa verrataan vähintään kahden kohteen tunnettuja
heijastusarvoja instrumentin havaitsemiin radiansseihin. Kun tunnetun heijastusarvon sekä
instrumentin havaitsemien arvojen välille löydetään yhteys, voidaan oikeat arvot interpoloida koko
kuvalle. Regressioon perustuvassa tekniikassa määritetään parhaiten istuvat suorat eri materiaalien
heijastusspektrikäyrille. Näiden suorien leikkauspisteen oletetaan edustavan kohtaa, jonka
heijastusarvo on peräisin ainoastaan ilmakehän vaikutuksesta. [Crippen 1987]
3.4. Heijastusspektrin normalisointi
Eri instrumenteilla ja ajankohtina havaitut absorptiopiirteet eivät ole usein vertailukelpoisia. Siksi
piirteet täytyy normalisoida kannan suhteen (baseline normalization) esimerkiksi ennen Spectral
Feature Fitting -analyysin käyttämistä. Tällaista normalisointia on käytetty paljon laboratorioissa
infrapunaspektrometrien havaitsemalla datalla. Valoisuuseroja voidaan korjata myös käyttämällä
kromaattista suhdetta. Siinä määritetään kuinka monta prosenttia kunkin kanavan harmaasävy on
kaikkien harmaasävyjen summasta:
22
∑=
= d
jj
nn
DN
DNCR
1
, (3.1)
jossa nDN on kanavan n harmaasävyarvo ja kanavien lukumäärä on d [Törmä et al. 2001].
Normalisointi kannan suhteen suoritetaan ns. continuum removing -operaatiolla, jossa ensin
määritetään spektrin maksimikohtien kautta kulkeva kupera continuum-käyrä, katso kuva 3.4.
Käyrä estimoi mittauksen kannalta epäoleellisten kohteiden kokonaisheijastuksen vaikutusta
[Kokaly et al. 2002]. Continuum-käyrä kulkee kutakuinkin spektrikäyrää pitkin lukuun ottamatta
spektrin oleelliset absorptiokuopat, joissa se kulkee suoraan ylittäen kuopat. Käyrän vaikutus
poistetaan jakamalla alkuperäinen spektri continuum-käyrällä. Tuloksena saadaan continuum
removed -spektri, jossa korostuvat analysoitavan materiaalin oleellisimmat absorptio-
ominaisuudet. Lisäksi maaston kaltevuuden vaikutukset eliminoituvat, joten spektrien vertailu on
helpompaa [Kokaly et al. 2002].
Kuva 3.4: Heijastusspektri, continuum-käyrä, ja continuum removed spektri [ENVI Tutorial 2003].
23
4. Piirteiden valinta ja irroitus
Hyperspektrikuvalla eri materiaalit saavat erilaisia kirkkausarvoja. Materiaalit erottuvat toisistaan
paremmin tietyillä aallonpituusalueilla eli hyperspektrikuvan kanavilla. Kanavista voidaan laskea
myös erilaisia suhde- tai erotuskuvia sekä pääkomponentteja. Jos ennen kuvausta tiedetään, mitkä
kanavat eli piirteet erottavat luokat toisistaan parhaiten, niin kuvaus voidaan suorittaa käyttäen
ainoastaan tätä etukäteen tunnettua piirrejoukkoa. Silloin kuvauksessa tallennetaan vain osa
kanavista, eikä luokittelun kannalta ylimääräistä dataa tarvitse huomioida.
Etukäteen ei yleensä tiedetä mitkä piirteet, ovat tehtävän kannalta tärkeitä.
Hyperspektrikuvauksessa kustannukset eivät yleensä riipu kuvattavien kanavien lukumäärästä.
Siksi on käytännöllistä mitata kohdetta kapeilla kanavilla, jotka kattavat tasaisesti laajan
aallonpituusalueen. Kuvaavat spektrometrit toimivat yleensä koko näkyvän valon sekä lähi-
infrapunasäteilyn aallonpituuksilla ja niiden yksittäiset kanavat ovat vain muutaman nanometrin
levyisiä. Näin varmistetaan, että mittausprosessi säilyttää mahdollisimman suuren osan
alkuperäisestä informaatiosta, ja kaikki mittauksen kannalta relevantit piirteet sijaitsevat mitatulla
aallonpituusalueella. Lisäksi materiaalien spektreissä olevat pienet erot, jotka näkyvät ainoastaan
tietyillä kanavilla, saadaan näin huomioitua.
Teoriassa piirteiden lukumäärän kasvattaminen parantaa aina mahdollisuuksia löytää hyvä
erottuvuus luokkien välille. Tilastollisen päätösteorian mukaan luokitteluvirheen todennäköisyys
pienenee kasvatettaessa eri lailla tehtyjen mittausten lukumäärää eli piirrevektorin dimensiota.
Tämä päteekin käsiteltäessä äärettömän suuria otoksia. Käytännön mittauksia häiritsee kohina ja
erilaiset vääristymät, mikä huonontaa piirteiden laatua. Lisäksi usein saadaan myös luokittelun
kannalta merkityksetöntä informaatiota. Mittauksen opetusjoukko on äärellinen ja parametrien
estimaatit ovat harhaisia. Järjestelmä mukautuu hyvin otosjoukkoon, jos käytettävissä on suuri
määrä piirteitä. Samalla kuitenkin estimoidut parametrit muuttuvat harhaisemmiksi. Tämän
järjestelmän suorituskyky voi heiketä huomattavasti, jos sitä käytetään jonkun toisen alueen
luokittelussa. Syynä on se, että järjestelmän parametrien lukumäärä ja parametrien estimaattien
harha kasvaa nopeasti piirteiden lukumäärän kasvaessa. Käytännössä järjestelmältä puuttuu tällöin
kyky yleistää. Piirteiden valinnalla sekä irroituksella voidaan tällöin parantaa järjestelmän
yleistyskykyä. [Heikkilä & Törmä 1996]
24
Moni hyperspektrikuvalle tarkoitettu luokittelumenetelmä toimii hyvin vaikka piirteiden irroitusta
tai valintaa ei tehtäisi. Itse asiassa nämä algoritmit käyttävät yleensä referenssispektreinä jostain
spektrikirjastosta valittuja spektrejä. Tällöin on tärkeää, että havaittu spektri on mitattu kapeilla ja
tasaisesti koko aallonpituusalueen yli kulkevilla kanavilla. Mitään suhde- , erotus-, tai
pääkomponenttikuvia ei ole myöskään järkevää laskea, jotta vertailu referenssispektrin kanssa
onnistuisi. Toisaalta joissain tapauksissa hyperspektrikuvien piirrejoukkoa voidaan ja kannattaakin
pienentää piirteiden irroituksella ja valinnalla. Lisäksi hyperspektrikuvan kanavia voidaan
summata yhteen, jolloin saadaan leveämpiä kanavia. Näin muokatun hyperspektrikuvan
piirrevektori muistuttaa multispektrikuvan piirrevektoria ja käytössä ovat kaikki perinteiset
multispektrikuvauksen luokittelumenetelmät. Hyperspektrikuvauksessa onkin tärkeää tietää
milloin tarvitaan piirteiden valintaa ja irroitusta ja milloin se on turhaa tai jopa haitallista.
Piirteiden irroitus ja valinta täytyy suunnitella aina luokittelualgoritmin yhteydessä. Yhtä ainoaa
parasta piirrejoukkoa ei aina ole olemassa vaan eri luokittelualgoritmeille sopivat erilaiset
piirrejoukot, mutta yleisesti hyvä piirteiden osajoukko sisältää mahdollisimman vähän korreloivia
piirteitä.
4.1. Fysikaalisia piirteiden irroitusmenetelmiä
Hyperspektrikuvan kanavilla voidaan suorittaa erilaisia matemaattisia laskutoimituksia. Kanavia
voidaan esimerkiksi laskea yhteen, vähentää, kertoa ja jakaa keskenään. Näin kanavien joukosta
voidaan laskea uusia kanavia, joiden informaatio poikkeaa alkuperäisistä kanavista. Eri
menetelmillä voidaan korostaa tiettyjä kuvilla esiintyviä piirteitä. Laskemalla kanavien suhdekuvia
voidaan esimerkiksi vahvistaa tekijöitä, jotka vaikuttavat erilailla kanavien harmaasävyihin.
Samalla kertautuvat tekijät, kuten topografian ja auringon korkeuskulman vaikutukset, pienenevät.
Eri aikoina otettujen kuvien erotuskuvalta voidaan tunnistaa liike tai muutos. Kuvien kertominen
keskenään sen sijaan voimistaa maanpinnan muotoja. Hiukan monimutkaisemmilla laskuilla
voidaan laskea tiettyä ilmiötä kuvaavia indeksikuvia. Esimerkiksi lehtivihreän määrää kuvaa
NDVI (Normalized Difference Vegetation Index) kasvillisuusindeksi:
( )( )PUNNIR
PUNNIRNDVI+−
= , (4.1)
jossa NIR on lähi-infrapuna-alueen kanava ja PUN on punaisen alueen kanava. [Lillesand &
Kiefer 2000]
25
4.2. Piirteiden valinta
Piirteiden valinta-algoritmit valitsevat piirreavaruuden D piirteen joukosta d piirteen osajoukon
( )Dd < . Osajoukon kokoa d pyritään minimoimaan ja samalla pyritään maksimoimaan eri
luokkien erottuvuutta. Tietyllä osajoukolla suoritetun oikean luokittelun todennäköisyyttä eli
luokittelun onnistumista kuvataan kriteerifunktioilla. Käytännössä voidaan laskea esimerkiksi
luokkien välisiä todennäköisyysteoreettisia etäisyysmittoja. Hyperspektrikuvauksessa eri kanavat
eli piirteet korreloivat voimakkaasti, joten jokaista kanavaa ei tarvitse ottaa mukaan luokitteluun.
Näin luokittelu voidaan suorittaa pienemmällä ja vähemmän korreloivien kanavien osajoukolla.
Kaikkien osajoukkojen kombinaatioiden laskeminen on mahdotonta, jos kanavia on runsaasti.
Osajoukon valinta voidaan tehdä kokoavilla tai jäsentävillä algoritmeilla. Kokoavat algoritmit
aloittavat tyhjästä joukosta, johon ne lisäävät piirteitä kunnes paras osajoukko löydetään.
Vähentävät algoritmit aloittavat kaikkien piirteiden joukosta ja poistavat siitä piirteitä, kunnes
jäljelle jää paras piirteiden osajoukko. Osajoukko voidaan myös löytää algoritmilla, joka
vuorotellen kokoaa ja jäsentää piirrejoukkoa. Koska kaikkia osajoukkojen kombinaatiota ei tutkita,
niin aina ei päästä varmuuteen siitä, ettei uutta vähemmän korreloivaa osajoukkoa löytyisi.
Seuraavassa esitellään muutamia yleisesti käytettyjä piirteiden valinta-algoritmeja.
4.2.1. Branch and bound
Branch and bound -algoritmi on jäsentävä optimaalinen hakumenetelmä. Siinä käydään
implisiittisesti läpi kaikkien piirteiden mahdolliset alijoukot. Algoritmi ei suorita täydellistä hakua,
mutta sen peräytymisominaisuus mahdollistaa kaikkien piirrekombinaatioiden implisiittisen
tutkinnan. Branch and bound -algoritmin huonoja puolia ovat sen laskennallinen raskaus ja suuren
opetusjoukon käytön vaatiminen. Parhaimman piirrejoukon haku perustuu siihen, että poistetaan
valittuja piirteitä alkuperäisestä piirrejoukosta. Seuraavaksi, edellisessä vaiheessa saaduista
joukoista muodostetaan edelleen osajoukkoja samaan tapaan. Prosessia jatketaan kunnes alijoukot
ovat halutun kokoisia. [Heikkilä & Törmä 1996]
26
Ratkaisu saadaan muodostamalla ratkaisupuu, jonka solmuissa vähennetään aina alkuperäisten
piirteiden lukumäärää yhdellä. Ratkaisupuu etsii parhaimman kriteerifunktion tuloksen antavan
osajoukon. Puun juuressa eli nollatasossa ei piirteitä ole vielä poistettu, joten niitä on käytettävissä
kaikki D kappaletta. Ensimmäiselle tasolle siirryttäessä juuren piirrejoukosta poistetaan 1. tason
solmuissa määrätyt piirteet. Seuraavan tason solmut näyttävät samaan tapaan mitkä piirteet
poistetaan. Prosessia jatketaan kunnes päästään puun viimeiselle tasolle. Tämän tason
järjestysnumero on dD − . Viimeisellä tasolla olevista solmut määrittävät viimeiset piirteet, jotka
jäljelle jääneestä piirrejoukosta poistetaan. Koska jokaisella tasolla vähennetään piirrejoukosta
yksi piirre, niin yhteensä piirteiden lukumäärä vähenee dD − :lla ja edelleen piirteitä jää jäljelle
haluttu d kappaletta. Viimeisen tason solmuista eli puun lehdistä pääsee kustakin yksilöllistä
polkua pitkin kulkemalla puun juureen. Tällä polulla olevat solmut määrittävät, mitkä piirteet
poistetaan alkuperäisestä piirrejoukosta. [Narenda & Fukunaga 1977]
Kuva 4.1: Branch and Bound –ratkaisupuu.
Viidestä piirteestä voidaan valita kahden piirteen osajoukkoja kuvan 4.1 hakupuun esittämällä
tavalla. Puun solmut ilmoittavat niiden piirteiden numerot jotka vähennetään piirrejoukosta.
Alussa, puun juuressa, kaikki viisi piirrettä ovat mukana joukossa ja siirryttäessä alemmalle tasolle
vähennetään aina solmun osoittama piirre joukosta siten, että 3 tasolla on enää kahden piirteen
kokoisia osajoukkoja jäljellä.
Branch and bound -algoritmi käyttää hyväksi sisäkkäisten piirrejoukkojen
monotonisuusominaisuutta eli useat piirrekombinaatiot voidaan hylätä niitä tutkimatta.
27
Ratkaisupuu on epäsymmetrinen ja solmun poikien määrään vaikuttaa tason, jolla solmu sijaitsee,
järjestysnumero sekä solmun kriteerifunktion arvo. Ratkaisupuu muodostetaan harvimmasta osasta
tiheimpään käyttäen depth-first -hakua. Ensin muodostetaan oikeanpuoleisin oksa ja
kriteerifunktion arvo kyseisen oksan haaran päässä asetetaan kynnysarvoksi. Seuraavaksi palataan
taaksepäin lähimpään haarautumiskohtaan ja seuraavaksi oikeanpuoleisin oksa tutkitaan. Jos
jonkin solmun kohdalla kriteerifunktion arvo alittaa sen hetkisen kynnysarvon, niin tämän solmun
poikia ei tarvitse enää tutkia, sillä myös niiden kriteerifunktioiden arvot alittavat kynnysarvon.
Näin haku voidaan keskeyttää ja siirrytään peräytymisominaisuuden ansiosta ylöspäin lähimpään
käsittelemättömään solmuun. Prosessia jatketaan kunnes koko puu on tutkittu tai jos saavutetaan
puun dD − :s taso. Tällöin ollaan saavuttu solmuun, jonka kriteerifunktion arvo ylittää
kynnysarvon, joten kynnysarvo päivitetään. Puun tutkimista jatketaan samaan tapaan uudella
kynnysarvolla. [Heikkilä & Törmä 1996]
4.2.2. Parhaat piirteet
Hyvin yksinkertainen ja nopea algoritmi, joka testaa piirteet yksitellen riippumatta muista
piirteistä. Kriteerifunktion arvot, jotka siis kuvaavat luokittelun onnistumista, lasketaan erikseen
jokaiselle piirteelle. Piirteet järjestetään kriteerifunktioiden arvojen määräämään järjestykseen ja
valitaan d kappaletta suurimpien kriteerifunktioiden tuottavia parhaita piirteitä [Heikkilä, Törmä
1996]. Koska tämä menetelmä testaa piirteet yksitellen, eikä muita piirteitä oteta huomioon
piirteiden valinnassa, niin hyperspektrikuvalta tämä algoritmi valitsee todennäköisesti
parhaimmiksi piirteiksi d kappaletta vierekkäisiä kanavia, jotka ovat sisällöltään lähes identtisiä.
Siksi tätä algoritmia ei kannata käyttää hyperspektrikuvan kanavien valinnassa.
4.2.3. Sequential Forward Selection (SFS)
SFS on yksinkertainen kokoava piirteiden valinta-algoritmi. Se valitsee ensin suurimman
kriteerifunktion arvon antavan piirteen. Seuraavaksi lisätään valittuun piirrejoukkoon yksi piirre
kerrallaan. Lisättävä piirre valitaan siten, että se tuottaa suurimman kriteerifunktion arvon
laskettuna jo aikaisemmin valitun piirrejoukon kanssa. SFS ottaa huomioon jossain määrin
piirteiden väliset tilastolliset riippuvuudet, mutta se ei pysty poistamaan jo valittuja piirteitä. Tämä
haittaa silloin, kun jokin aikaisemmin valittu piirre tulee tarpeettomaksi uusien piirteiden valinnan
28
myötä. SFS-algoritmista on olemassa myös yleistetty versio, jossa lisätään r piirrettä kerrallaan
yhden sijaan. Muuten se toimii aivan samaan tapaan kuin SFS. Yleistetty SFS on hiukan
monimutkaisempi ja sen suorittaminen vaatii enemmän laskenta-aikaa, varsinkin jos r on suuri,
mutta sillä saadaan todennäköisesti luotettavampia tuloksia. [Heikkilä & Törmä 1996]
4.2.4. Sequential Backward Selection (SBS)
SBS-algoritmi toimii samaan tapaan kuin SFS, mutta se on jäsentävä algoritmi. SBS aloittaa
kaikkien piirteiden joukosta, josta poistetaan piirteitä yksitellen kunnes dD − piirrettä on
poistettu. Piirrettä poistettaessa valitaan aina sellainen piirre, jonka poistamisen jälkeen jäljelle
jääneen joukon kriteerifunktio on mahdollisimman suuri. Ensimmäistä piirrettä poistettaessa
joudutaan siten laskemaan 1−D kokoisten piirrejoukkojen, jotka saadaan poistamalla
alkuperäisestä piirrejoukosta vuorotellen yksi piirre kerrallaan, kriteerifunktioiden arvot. Toisen
piirteen valinnassa lasketaan 2−D kokoisilla piirrejoukoilla. Laskenta helpottuu jokaisen piirteen
poistamisen jälkeen, mutta silti SBS-algoritmi on raskaampi kuin SFS, sillä kriteerifunktioiden
arvot joudutaan laskemaan aluksi hyvin korkeaulotteisissa avaruuksissa.
SBS tuottaa lisäksi parhaan saavutettavissa olevan luokkien erottuvuuden mitan, jota voidaan
käyttää arvioimaan piirteiden irroituksessa menetetyn informaation määrää. Myös SBS-
algoritmista on olemassa yleistetty versio, joka on muuten yhtenevä SBS:n kanssa, mutta siinä
poistetaan useampia piirteitä kerrallaan. Yleistetyssä versiossa otetaan huomioon riippuvuudet
kunkin hetkisen piirrejoukon piirteiden välillä sekä poistettavien piirteiden välillä. Yleistetyssä
menetelmässä täytyy jokaisessa vaiheessa tutkia
⎟⎟⎠
⎞⎜⎜⎝
⎛ −r
kD (4.2)
joukkoa, kun poistettavien piirteiden lukumäärä on r ja k merkitsee kuinka monta piirrettä on
poistettu joukosta. Yleistetyllä menetelmällä saatu joukkojen määrä on huomattavasti enemmän
kuin SBS-algoritmilla, joka joutuu käymään läpi kD − joukkoa. [Heikkilä, Törmä 1996]
29
4.2.5. Lisää-l ota pois-r
Tämä algoritmi käyttää ensin SFS-algoritmia piirrejoukon kasvattamiseen l-piirteellä ja sitten
SBS-algoritmilla vähennetään tästä joukosta r piirrettä. Tällä menetelmällä voidaan poistaa osittain
piirejoukkojen sisäkkäisyyttä. Kuitenkaan poistettavien tai lisättävien piirteiden keskinäisistä
riippuvuuksista ei välitetä. Tämä ongelma ratkaistaan käyttämällä yleistettyä lisää-l ota pois-r -
algoritmia. Tässä käytetään yleistettyjä SFS ja SBS -algoritmeja piirrejoukon kasvattamiseen ja
vähentämiseen.
Hyperspektrikuvien peräkkäiset kanavat ovat usein lähes identtisiä. Ainoa ero niissä on havaittava
aallonpituusalue, joka kahden peräkkäisen kanavan välillä eroaa vain muutaman nanometrin. Jos
piirteiden valintaa käytetään hyperspektrikuvien kanavien valintaan, niin peräkkäisten kanavien
samankaltaisuus kannattaisi ottaa huomioon laskettaessa eri piirteiden valinta-algoritmeja.
Yksinkertaisimmillaan voitaisiin ensin suorittaa karkea piirteiden valinta, jossa valittaisiin joka n.
kanava. Tämän jälkeen piirrejoukko olisi jo supistunut huomattavasti ja voitaisiin käyttää edellä
mainittuja laskennallisesti raskaampia ja monimutkaisempia piirteiden valinta-algoritmeja.
4.3. Piirteiden irroitus
Piirteiden irroituksessa muunnetaan piirreavaruutta yksinkertaisemmaksi käyttäen lineaarista
muunnosta
Axy = , (4.3)
missä x on alkuperäinen piirrevektori (dimensio D) ja y on muunnettu piirrevektori (dimensio d). A
on muunnosmatriisi, joka määritellään esimerkiksi luokkienvälisten todennäköisyysteoreettisten
erottuvuusmittojen avulla. Tällöin luokista täytyy tietää niiden tiheysfunktiot ja a’priori
todennäköisyydet. Joskus hyperspektrikuvalla olevien materiaalien tärkeät ominaisuudet, joiden
avulla materiaali voidaan tunnistaa, voivat näkyä ainoastaan hyvin kapeilla aallonpituusalueilla,
joiden sijaintia ei etukäteen tiedetä. Tällöin on tärkeää, että piirteiden irroituksessa näitä kaistoja ei
hävitetä muiden kanavien massaan.
30
4.3.1. Pääkomponenttimuunnos
Kuvasta 4.2a näkee, että AISA-kuvan kanavat korreloivat voimakkaasti. Tämän takia, käytettäessä
esimerkiksi suurimman uskottavuuden luokittelijaa, voi luokkien kovarianssimatriisit tulla
singulaarisiksi. Matriisin kääntäminen ei tällöin onnistu eikä luokittelija toimi. Tästä ongelmasta
päästään eroon tiivistämällä kuvien sisältämä informaatio pienempään sekä korreloimattomaan
kanavamäärään. Näin luokittelijan parametrit tulevat harhattomammiksi ja luokittelun suoritusta
voidaan nopeuttaa sekä tuloksia parantaa. Pääkomponenttimuunnos on Karhunen-Loéve –
muunnoksen erikoistapaus ja sillä voidaan tiivistää kuvaavan spektrometrin kanavajoukkoa
pienempään sekä korreloimattomaan kanavajoukkoon (katso kuva 4.2b), jossa kanavat on
järjestetty pienenevän varianssin mukaiseen järjestykseen. Pääkomponenttimuunnos on
optimaalinen vaihtoehto, jolla saadaan pienin keskimääräinen neliöllinen virhe, mutta
laskennallisesti se on raskas. Lisäksi hyperspektrikuvalla hankalasti näkyvät ja vähäpätöisiltä
tuntuvat piirteet, jotka saattavat karakterisoida tietyn materiaalin, voidaan hävittää
pääkomponenttimuunnoksella.
Kuvat 4.2a ja 4.2b: Kuva 4.2a esittää AISA-kuvan peräkkäisten kanavien 2 ja 3 hajontakuviota
(scatter plot). Kuva 4.2b esittää kahden ensimmäisen pääkomponenttikanavan hajontakuviota.
Taulukko 4.1: AISA-kuvan pääkomponenttikanavat.
Pääkomponenttikanava Hajonta Varianssi 9 1.53 0.02% 1 77.85 56.90% 10 1.02 0.01% 2 66.14 41.06% 11 0.92 0.01% 3 11.74 1.29% 12 0.72 0.00% 4 5.09 0.24% 13 0.68 0.00% 5 4.20 0.17% 14 0.62 0.00% 6 4.08 0.16% 15 0.57 0.00% 7 2.58 0.06% 16 0.54 0.00% 8 2.53 0.06% 17 0.51 0.00%
31
Kuvat 4.3a, 4.3b, 4.3c ja 4.3d: AISA-kuvasta pääkomponenttimuunnoksella muokatut neljä ensimmäistä pääkomponenttikuvaa.
Pääkomponenttimuunnoksen tarkoituksena on muuntaa korreloivien piirteiden joukko uuteen
korreloimattomaan muotoon. Muunnos kiertää piirteiden muodostamia vektoriavaruuden akseleita
siten, että kunkin koordinaattiakselin varianssi maksimoituu. Akseleille asetetaan ehto, että ne ovat
ortogonaalisia, eli ne ovat aina kohtisuorassa muihin akseleihin nähden. Ensimmäistä akselia
kierretään siten, että sen varianssi maksimoituu. Seuraavan akselin varianssi maksimoidaan myös,
mutta lisäksi akselin on oltava kohtisuorassa ensimmäiseen akseliin nähden. Seuraavat akselit
asetetaan aina siten että ne toteuttavat varianssin maksimoitumisen sekä sen että ne ovat aina
kohtisuorassa edellisiin akseleihin nähden. Kuten taulukosta 4.1 sekä kuvista 4.3a, 4.3b, 4.3c ja
4.3d näkee, pääkomponenttimuunnoksella määritetty ensimmäinen koordinaattiakseli sisältää
eniten informaatiota ja yleensä seuraavissa akseleissa informaation määrä vähenee nopeasti.
Tämän takia luokitteluun riittää muutaman ensimmäisen pääkomponenttimuunnoksella tuotetun
akselin eli pääkomponentin valinta. Sinänsä pääkomponenttimuunnos on häviötön muunnos, mutta
tämä tarkoitta sitä että kaikki sen tuottamat pääkomponentit valitaan mukaan lopulliseen
piirrejoukkoon, mikä on harvinaista. [Short & Robinson 2003]
32
4.3.2. n-ulotteiset todennäköisyystiheysfunktiot piirteiden irroituksessa
Multi- sekä hyperspektridataa voidaan muokata sekä analysoida monenlaisin eri menetelmin
käyttäen n-ulotteisia todennäköisyystiheysfunktioita (nPDF). Menetelmää on käytetty
kaukokartoitusdatan havainnollistamiseen, ohjattuun ja ohjaamattomaan luokitteluun sekä
piirteiden irroitukseen. Lisäksi se on hyödyllinen apuväline luokittelijan opetusalueiden
valitsemisessa. Menetelmän ajatuksena on muodostaa alkuperäisestä kuvasta nPDF-diagrammi,
jonka avulla kuva saa selkeämmän esitysmuodon. Ohjaamattomassa luokittelussa nPDF-arvoista
saadaan valittua suoraan luokkien lukumäärä sekä luokkien keskipisteiden sijainnit.
Kuva 4.4: 3D hahmoavaruus. D1-D4 ovat erään hahmoavaruuden piirteen etäisyyksiä kuution
nurkkiin #1-#4.
Piirteiden irroitus tapahtuu siten, että uudet kanavat valitaan hyperulotteisen kuution nurkista.
Kuva 4.4 havainnollistaa tilannetta 3D tapauksessa. Jos kanavien lukumäärää halutaan pienentää
esimerkiksi neljään kanavaan, niin nämä kanavat voidaan valita samassa järjestyksessä
hyperulotteisen kuution neljästä ensimmäisestä nurkasta. Seuraavaksi lasketaan piirteiden
etäisyydet hyperkuution nurkkiin. Jos
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=Χ
nx
xx
M2
1
33
on n-ulotteinen hahmovektori, niin hahmovektorin ja hyperkuution nurkkien väliset Euklidiset
etäisyydet saadaan laskettua kaavalla:
( )( ) 21
1
22⎟⎟⎠
⎞⎜⎜⎝
⎛∗−+∗= ∑
=
n
jjjjji bxRaxD , (4.4)
jossa j merkitsee kanavan numeroa. Muuttujat a ja b saavat arvoikseen joko 0 tai 1, riippuen
hyperkuution nurkasta i sekä kanavan numerosta j. Muuttujien a ja b arvot saadaan määriteltyä
seuraavalla tavalla: 3D tapauksessa kuution nurkilla on kolme koordinaattiarvoa. Kulma #1 on
origo ja sen x, y, z koordinaatit ovat (0,0,0). Koordinaatit kulmalle #2 ovat (0,0,255), kulmalle #3
ovat (0,255,0) ja kulmalle #4 ovat (0,255,255). Nyt laskentaa voidaan helpottaa käyttämällä
binäärilukuja lukujen a ja b ratkaisemisessa. Muutetaan koordinaatit siten, että nolla pysyy
nollana, mutta 255 korvataan ykkösellä. Kuvassa 4.4 pääkulmien binääriesitykset näkyvät
sulkeissa.
Seuraavassa 15D esimerkki (kanavat ensimmäisestä viidenteentoista kulkevat esityksessä
vasemmalta oikealle):
kulma #1: 000000000000000
kulma #2: 001001001001001
kulma #3: 010010010010010
kulma #4: 011011011011011
Jos kanavan binääriluku on 0, niin silloin a on 1 ja b on 0. Jos kanavan binääriluku on 1, niin
silloin a on 0 ja b on 1. Tämän jälkeen voidaan nPDF-komponentit laskea seuraavalla kaavalla:
2/12 NBDSnPDF BIT
ii ∗
∗= , (4.5)
jossa:
i = nurkan numero,
S = haluttu skaalauskerroin,
BIT = käytetyn datan bittien lukumäärä ja
NB = kanavien lukumäärä.
Piirteiden irroituksessa nPDF-menetelmä on merkittävästi pääkomponenttimuunnosta nopeampi.
Lisäksi hyperspektridatan dimension kasvaessa pääkomponenttimuunnoksen suoritusajat kasvavat
34
dramaattisesti verrattuna nPDF-menetelmään. Pääkomponenttimuunnoksen laskeminen vaatii
lisäksi enemmän muistia, mikä vaikeuttaa sen käyttöä eteenkin suurten hyperspektridatatiedostojen
kanssa [Cetin & Levandowski 1993].
35
5. Luokittelualgoritmit
Tässä kappaleessa esitellään työssä käytetyt luokittelualgoritmit. Algoritmit on jaettu kahteen
luokkaan. Ensin esitellään uudet hyperspektrikuvien analysointiin tarkoitetut algoritmit. Lopuksi
perehdytään kahteen hyvin yleiseen kaukokartoituksessa käytettyyn luokittelualgoritmiin.
5.1. Hyperspektridatan luokittelualgoritmit
Tässä kappaleessa esitetään useimmin käytettyjä algoritmeja hyperspektridatan analysoinnissa ja
luokittelussa. Eri algoritmien käyttötarkoitus vaihtelee paljon eikä niiden vertailu ole helppoa
lukuun ottamatta Spectral Angle Mapper sekä Spectral Correlation Mapperia, jotka muistuttavat
toisiaan hyvin läheisesti. Siksi ei kannata miettiä, mikä näistä algoritmeista on paras vaan tulisi
ajatella mihin käyttötarkoitukseen eri algoritmit sopivat parhaiten. Yksi hyperspektrikuva voi olla
usean gigatavun kokoinen, joten sitä analysoivien algoritmien täytyy toimia tehokkaasti. Liian
monimutkaiset sekä kompleksiset algoritmit kuluttavat tietokoneen laskenta-aikaa eikä siihen aina
ole varaa. Laskennan pitää sujua nopeasti vaikka luokittelu laskettaisiin käyttäen kaikkia
hyperspektrikuvan kanavia. Perceptron-neuroverkkoa ei erityisesti ole kehitetty hyperspektridatan
analysointiin, mutta sitä on käytetty mitä erilaisimpien ongelmien ratkaisemisessa ja sen käyttöä
haluttiin kokeilla myös hyperspektrikuvien luokittelussa.
5.1.1. Spectral Angle Mapper (SAM)
Hyperspektrikuvan pikselien arvoihin vaikuttaa instrumentin mittaama kohteesta ja sen
ympäristöstä lähteneen säteilyn määrä sekä kohteen spektriset ominaisuudet. Pikselin spektrin
voidaan ajatella olevan n-ulotteinen vektori, missä n on kanavien lukumäärä (katso kuva 5.1).
Täysin musta piste sijaitsee vektoriavaruuden origossa, muuten jokaisella vektorilla on tietty
pituus ja suunta. Vektorin pituus vastaa nyt kohteen valaistusta/kirkkautta ja vektorin suunta on
kohteen "värin" funktio. Tässä "väri" tarkoittaa kohteen spektristen ominaisuuksien suhdetta eri
kanavilla. Topografia, pilvet, varjot sekä auringon ja instrumentin kulma maahan nähden
vaikuttavat enimmäkseen pikselin valoisuuteen eli vektorin pituuteen. Nämä kaukokartoituksessa
36
vaikeasti kontrolloitavissa olevat ilmiöt eivät kuitenkaan vaikuta juurikaan vektorin suuntaan,
joten luokittelu tehdään siihen perustuen [IMAGRS-L 1996].
Kuva 5.1: Kahden eri materiaalin spektrien A ja B välinen kulma kahden kanavan tapauksessa.
Spectral Angle Mapper (SAM) on nopea, selkeä ja yleisesti käytetty hyperspektrikuvien
luokittelualgoritmi. SAM vertaa luokiteltavan kuvan jokaisen pikselin spektriä tunnettuihin
spektreihin, jotka voivat olla laskettu kuvan opetusalueista tai valittu spektrikirjastoista.
Instrumentin havaitseman heijastuksen korjaaminen todelliseksi kohteen heijastukseksi on tärkeää,
kun spektrejä vertaillaan eri aineistojen kesken. Esimerkiksi hyperspektrikuvan radiometriset
virheet on korjattava, kun referenssitietona käytetään spektrikirjastoa. Jos referenssispektrit
kerätään samalta kuvalta, niin kuvan radiometriset virheet, jotka vaikuttavat samalla tavalla koko
kuvaan, eivät vaikuta tulokseen. Vertailu tapahtuu käsittelemällä spektrejä vektoreina ja
laskemalla niiden välinen kulma:
⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜
⎝
⎛
⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛=
∑∑
∑
==
=−
21
1
221
1
2
11cosn
ii
n
ii
n
iii
rt
rtα , (5.1)
jossa r on luokiteltava vektori, t on hahmovektori ja n on hyperspektrikuvan kanavien lukumäärä.
Kaava 5.1 saadaan johdettua vektoreiden pistetulosta:
( )rtrtrt ,cos=• . (5.2)
37
Pikseli luokitellaan siihen luokkaan, jonka kanssa se muodostaa pienimmän kulman. Näin
vektorien pituus eli kohteen valaistus/kirkkauserot eivät vaikuta tulokseen. Toisaalta värejä on
vaikea erottaa pimeässä. Tämä ilmiö on helposti havaittavissa SAM-luokittelijassakin. Hyvin
tummat alueet kuvautuvat vektoriavaruuden origon lähettyville. Alueet voivat kuulua samaan
luokkaan ja sijaita hyvinkin lähellä toisiaan, mutta niiden välinen kulma voi olla suuri jolloin ne
luokitellaan virheellisesti. [Kruse et al. 1993]
SAM-luokittelutuloksen lisäksi voidaan luokiteltavan kuvan sekä referenssidatan
heijastusspektrien väliset kulmat jokaiselta pikseliltä tallentaa erikseen. Tuloksena saadaan kuva,
jossa tummat alueet kertovat vektorien välillä olevan pieni kulma eli luokittelutulos on hyvä.
Vaaleilla alueilla kulma on suuri ja siten myös luokittelutulos on epävarma. Kuvan visuaalista
tulkintaa voidaan vielä helpottaa kääntämällä sen värit, jolloin vaaleat alueet ovat hyvin
luokiteltuja alueita ja tummat alueet huonosti luokiteltuja. Tällaiset kuvat tarjoavat hyvän
yleiskuvan esimerkiksi alueen mineraalien kartoittamisprosessissa. [Kruse et al. 1997]
5.1.2. Spectral Correlation Mapper (SCM)
Spectral Correlation Mapper -algoritmi ei eroa paljoa SAM:sta ja sitä voidaankin pitää SAM:n
kehittyneempänä versiona. SCM:ssä spektrivektorien kulmat lasketaan samaan tapaan kuin
SAM:ssa, mutta sitä ennen spektrivektorit standardisoidaan. Tämä tehdään vähentämällä
spektrivektoreista vektorien keskiarvo. SCM voidaan laskea kaavalla:
( )( )
( ) ( ) ⎟⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜⎜
⎝
⎛
⎟⎠
⎞⎜⎝
⎛−⎟
⎠
⎞⎜⎝
⎛−
−−=
∑∑
∑
==
=−
21
1
221
1
2
11cosn
ii
n
ii
n
iii
rrtt
rrttα , (5.3)
joka eroaa aikaisemmasta kaavasta 5.1 siten, että nyt spektrivektoreista t ja r vähennetään kaikista
kanavista lasketut keskiarvot t ja r .
SAM:ssa vektorien väliset kulmat saivat arvoja °−° 900 väliltä, eikä sillä pystytä esittämään
piirteiden välistä negatiivista korrelaatiota. SCM saa arvonsa väliltä -1-1 ja siten se huomioi myös
piirteiden välistä negatiivista korrelaatiota. Lisäksi SCM-algoritmin on havaittu olevan tarkempi
38
analysoidessa erilaisia käyriä ja sen todettiin eliminoivan paremmin varjojen vaikutuksen
[Carvalho 2000]. Tutkimuksessa saavutetut johtopäätelmät tehtiin analysoimalla keinotekoisia 5-
kanavaisia spektrejä, jotka eivät vastaa luonnossa esiintyviä spektrejä. Käytännössä erot SAM:n ja
SCM:n välillä eivät ole yhtä suuria.
5.1.3. Spectral Unmixing
Maanpinta muodostuu harvoin homogeenisistä alueista. Erilaiset maalajit sekä kasvillisuus ovat
usein sekoittuneet keskenään. Yhden pikselin sisältämä alue voi edustaa maastossa useita eri
kasvillisuus- sekä maalajiluokkia. Perinteisessä kaukokartoituksessa erilaisia maaston kohteita
voidaan havaita pikselin tarkkuudella. Pikseliä pienemmän kohteet sekoittuvat ja yleensä tämä
pikseli luokitellaan sen materiaalin mukaan, jota pikselissä on eniten. Väärän luokittelutuloksen
mahdollisuus on myös suuri, jos pikseliltä ei löydy yhtä hallitsevaa materiaalia. Tällöin kohteen
heijastusspektri on muodostunut useamman eri materiaalin spektristä saman kuvapikselin sisällä.
Kuvaavat spektrometrit määrittävät kohteesta lähes jatkuvan heijastusspektrin, mihin aikaisemmin
pystyttiin ainoastaan laboratoriomittauksilla. Kohteen heijastusspektrin avulla Spectral Unmixing -
malli pyrkii erottamaan pikseliin sekoittuneista spektreistä eri materiaalien spektrit sekä
materiaalien suhteelliset osuudet.
Materiaalien spektrit sekoittuvat lineaarisesti, jos materiaalien sekoittuneisuuden mittakaava on
makroskooppista. Tämä tarkoittaa, että sekoittuneessa pikselissä olevat puhtaat materiaalit ovat
paljain silmin erotettavissa toisistaan. Instrumentin havaitsema spektri on näiden puhtaiden
materiaalien lineaarinen kombinaatio ja siitä voidaan purkaa sekoittuneet materiaalit sekä laskea
niiden suhteet. Lineaarisen Spectral Unmixing –mallin matemaattinen muoto on:
( )∑=
+=m
jijiji FRDN
1
ε , (5.4)
jossa:
i = 1,2,…,n
n = kanavien lukumäärä
m = piirteiden lukumäärä
iDN = pikselin heijastusarvo kanavalla i
ijR = materiaalin j tunnettu heijastusarvo kanavalla i
39
jF = materiaalin j suhteellinen osuus pikselillä
iε = kanavan i virhetermi.
Lineaarisen Spectral Unmixing -mallin käyttäminen edellyttää puhtaiden referenssispektrien, jotka
edustavat homogeenisiä materiaaleja sekä sisältävät vähän kohinaa, löytämistä. Lineaarista mallia
voidaan lähestyä myös toisesta suunnasta: hajotetaan sekoittuneen pikselin spektri
komponentteihin ja verrataan sitä tunnettuihin referenssispektreihin, joita löytyy esimerkiksi
spektrikirjastoista [Kruse et al. 1997].
Lineaarisen mallin etuja ovat sen helppokäyttöisyys ja ymmärrettävyys. Lisäksi se antaa hyviä
tuloksia useimmissa tilanteissa sekä sitä voidaan käyttää erilaisten instrumenttien kanssa. Toisaalta
lineaarinen malli ei ota huomioon pikseliin sekoittuneiden materiaalien lukumäärän tai spektrin
sävyn vaihtelua. Joissain tapauksissa, esimerkiksi ilmakehän aiheuttaessa häiriöitä materiaalien
spektreihin, malli voi epäonnistua erilaisten materiaalien erottamisessa. Käyttämällä Multple
Endmember Spectral Mixture Analysis (MESMA) -mallia voidaan edellä kuvatusta ongelmasta
päästä eroon. MESMA on laajennus yksinkertaiseen lineaariseen malliin ja se sallii piirteiden
lukumäärän ja laadun vaihtelun kuvan eri osissa. Malli tarvitsee koko kuvalta satoja eri
piirrevektoreita, mutta käyttää niistä vain muutamaa yksittäisen pikselin analysoinnissa. [Roberts
et al. 1997]
Kuva 5.2: Piirrevektorit edustavat eri materiaalien heijastusspektrejä, joista yhdessä muodostuu
sekoittunut pikseli. Piirrevektorit rajaavat avaruudesta alueen jonka sisälle jää sekoittunut pikseli.
40
Sekoittuneen pikselin paikka tässä alueessa riippuu siitä kuinka paljon kutakin materiaalia on
kyseisellä pikselillä. Kuvassa 2-ulotteinen avaruus ja kolme piirrevektoria.
Referenssivektoreiden kerääminen on vaikein tehtävä käytettäessä lineaarista Spectral Unmixing -
mallia. Referenssivektoreita voidaan kerätä joko suoraan hyperspektrikuvalta tai
spektrikirjastoista. Kun referenssivektorit valitaan suoraan kuvalta on tärkeää, että pikselit, joilta
vektorit kerätään, ovat puhtaita eli sisältävät vain yhtä materiaalia. Referenssivektorien lukumäärä
voi tuottaa myös ongelmia. Jotta Spectral Unmixing -malli saataisiin ratkaistua, täytyy siinä olla
enemmän tunnettuja kuin tuntemattomia parametreja. Tämä tarkoittaa sitä, että mukaan otettavien
vektorien määrä on rajoitettu kuvan kanavien määrään. Käytännössä kanavat korreloivat
keskenään, joten referenssivektoreiden suurin mahdollinen lukumäärä on selvästi kanavien
lukumäärää pienempi. Toisaalta mukaan otettavien referenssivektoreiden lukumäärä ei voi olla
liian pieni, vaan kaikkien oleellisten materiaalien, joita kuvalla esiintyy, piirrevektorit täytyy ottaa
mukaan laskentaan. Näin malli saa tarvittavat tiedot sekoittuneen spektrin purkamiseen oikeisiin
komponentteihin [Roberts et al. 1997].
Suoritettaessa Spectral Unmixing –algoritmia voidaan referenssispektrien lukumäärää rajoittava
ongelma kiertää. Tämä tapahtuu jakamalla kuva osiin, esimerkiksi kasvillisuusindeksin perusteella
kasvillisuusalueisiin sekä kasvittomiin alueisiin. Tämän jälkeen kuvan molemmille osille voidaan
suorittaa erikseen Spectral Unmixing –luokittelu. Hyperspektrikuvan sekoittuneet pikselit
sisältävät usein myös varjoja. Nämä varjot vaikuttavat pikselin heijastusspektriin, kuten muutkin
pikselin materiaalit. Siksi myös varjoa kuvaava piirre täytyy ottaa mukaan malliin. Tämän varjo-
piirteen huomioiminen on tärkeää vaikka sen heijastusarvot kaikilla kanavilla olisivat hyvin pieniä
[Radelof et al. 1999].
5.1.4. Spectral Feature Fitting (SFF)
Spectral Feature Fitting (SFF) vertaa tutkittavan kohteen spektriä vastaavaan referenssispektriin.
SFF:ssä käytetään hyväksi eri materiaalien yksilöllisiä absorptio-ominaisuuksia. Absorption
intensiivisyys sekä sen vaikutus näkyvän valon ja infrapunasäteilyn eri aallonpituusalueille
vaihtelevat johtuen materiaalin mikroskooppisesta rakenteesta. Esimerkiksi kasvin lehtivihreä
absorpoi voimakkaasti 0.68 µm aallonpituuksia sekä lehdissä olevat vesimolekyylit absorpoivat
41
säteilyä 0.98 ja 1.20 µm aallonpituuksilla. Kasvilajit sisältävät eri määriä lehtivihreää sekä vettä,
joten niiden heijastusspektrit eroavat erityisesti absorptio-ominaisuuksiltaan ja tähän perustuu
SFF:n kyky erottaa eri kasvilajit toisistaan.
Spectral Feature Fitting vaatii etukäteistietoa etsittävästä materiaalista. Materiaalin absorptio-
ominaisuudet, joiden perusteella materiaali voidaan tunnistaa, sekä absorptiokaistojen sijainnit
täytyy selvittää. SFF-algoritmissa kaikkien kuvaavan spektrometrin kanavien käyttäminen ei tuo
mittauksen kannalta oleellista tietoa. Ainoastaan ne kanavat, joissa materiaalien absorptio-
ominaisuudet sijaitsevat, on järkevää ottaa huomioon. Spektrometrin on lisäksi havaittava useita
riittävän kapeita kanavia materiaalien absorptiokohdissa, jotta materiaalien absorptiopiirteet
saadaan estimoitua riittävän tarkasti ja materiaalit voidaan erottaa toisistaan. Varjot latistavat
absorptiopiirteitä ja huonontavat niiden tulkittavuutta, joten jyrkimmät varjonpuoleiset rinteet ja
muut varjoalueet kannattaa kynnystää kokonaan pois SFF-analyysistä [Kokaly et al. 2002].
SFF sovittaa kappaleen 3.4 mukaan normalisoidut spektrikäyrät yhteen ja tutkii, miten paljon
nämä käyrät eroavat toisistaan. Tutkittavan kohteen spektrin absorptiopiirteiden eli -piikkien
syvyyksiä sekä muotoja verrataan vastaaviin referenssispektrin ominaisuuksiin. Vertailu tehdään
usein pienimmän neliösumman tekniikkaa käyttäen. Kun SFF-algoritmia käytetään luokittelussa,
niin luokiteltavan pikselin absorptiopiirteitä verrataan referenssispektrien absorptiopiirteisiin.
Pikseli voidaan luokitella esimerkiksi pienimmän neliösumman algoritmilla laskettujen
luokiteltavan pikselin sekä referenssispektrien korrelaatiokertoimien mukaan [Kokaly et al. 2002].
5.1.5. Perceptron-neuroverkko
Neuroverkot muodostuvat neutroneista ja niiden välisistä yhteyksistä. Tiedonkäsittely
neuroverkkojen avulla eroaa paljon tietokoneen yleisten prosessien ja ohjelmien tiedonkäsittelystä.
Neuroverkkojen avulla yritetään jäljitellä luonnossa esiintyviä tiedonkäsittelyjärjestelmiä,
esimerkiksi ihmisen aivoja [Törmä 1997]. Aivojen toiminnallinen yksikkö on hermosolu eli
neuroni, joka on yhteydessä muihin neuroneihin synapsien kautta. Yksittäiset neuronit eivät pysty
kovinkaan monimutkaiseen prosessointiin vaan ne ottavat vastaan signaaleja ja välittävät niitä
eteenpäin muihin neuroneihin. Ihmisen aivoissa on keskimäärin 1210 hermosolua eli neuronia ja
jokaisella neuronilla on keskimäärin 410 synapsia. Näin muodostuu erittäin monimutkainen
42
verkko, jossa on noin 1610 erilaista kytkentää. Ihmisen oppiminen solutasolla tapahtuu neuronien
välisten yhteyksien muutoksina. Oppimisessa uusia yhteyksiä syntyy neuronien välille, sekä jo
olemassa olevat yhteydet joko vahvistuvat tai heikkenevät. Muutos yhteyksien toiminnassa saa
aikaan impulssien kulun helpottumista tai vaikeutumista.
Tietokoneille kehitetyt neuroverkot toimivat periaatteiltaan aivan samaan tapaan kuin ihmisen
aivot. Neuroverkon perusyksikkö on neuroni, joka saa syötteen muilta neuroneilta kytkentöjen
kautta. Neuroni muokkaa syötettä ja lähettää tuloksen eteenpäin kytkentöjen kautta muille
neuroneille. Kytkennöille on määritelty painot, jotka muuttavat kytkentöjen kautta kulkevia
signaaleja. Neuroverkon oppiminen merkitsee kytkentöjen painojen sovittamista siten, että verkko
suoriutuu tehtävästä mahdollisimman hyvin [Törmä 1997]. Neuroverkon opettaminen painoja
sovittamalla vastaa ihmisen aivoissa hermosolujen välisten yhteyksien eli synapsien toiminnan
muutoksia.
Yksi yleisimmistä nykyään käytetyistä neuroverkoista on monikerros-perceptron (Multi-layer
Perceptron). Tällainen neuroverkko muodostuu kolmenlaisista kerroksista: syötekerroksesta,
piilotetuista kerroksista ja vastekerroksesta. Syötekerros ottaa vastaan syötteen ja esittää sen
piilotetuille kerroksille. Luokiteltaessa kaukokartoitusdataa kunkin kanavan pikselien
harmaasävyarvot toimivat neuroverkon syötteenä ja syötekerroksessa neutroneita on tavallisesti
yksi kutakin piirrettä vastaan. Piilotettuja kerroksia on verkossa yksi tai useampia ja siellä pyritään
löytämään ratkaisu esitettyyn ongelmaan. Siellä syöte kulkee monimutkaisia ja eri painoisia
kytkentöjä pitkin ja samalla muokkaantuu halutunlaiseksi. Yksittäisessä neuronissa lasketaan
siihen saapuvista kytkennöistä tulevien signaalien painotettu summa ja tämä muutetaan
epälineaarisella funktiolla vasteeksi, joka edelleen ohjataan seuraavan kerroksen neuroneille.
Vastekerros kokoaa piilotetuista kerroksista saapuneet signaalit halutunlaiseksi vasteeksi.
Kaukokartoitusdatan luokittelussa haluttu vaste voi muodostua esimerkiksi eri maankäyttöluokista,
jolloin vastekerroksessa on neuroneita yhtä paljon kuin luokittelutulokseen halutaan luokkia.
[Kanellopoulos et al. 1991]
43
Kuva 5.3: Monikerros-perceptron neuroverkon rakenne.
Monikerros-perceptron neuroverkon rakenne on helppotajuinen ja sen opettaminen onnistuu
periaatteeltaan yksinkertaisella virheen takaisinkorjausmenetelmällä (error backpropagation).
Opettamisessa syötetään verkolle dataa ja verrataan verkosta saatavaa vastetta haluttuun tulokseen.
Seuraavaksi korjataan verkon kytkentöjen painoja siten, että vasteesta saataisiin halutun tuloksen
kaltainen. Operaatiota toistetaan kunnes vaste ei enää eroa merkittävästi halutusta tuloksesta.
Takaisinkorjausmenetelmä on nopea, mikäli voidaan käyttää rinnakkaista prosessointia.
Menetelmän huonot puolet tulevat esiin suurella verkolla, jolloin verkon opettaminen vie paljon
laskenta-aikaa eikä silloin iteraatiota voi toistaa kovinkaan montaa kertaa. Verkon opettaminen
vaatii lisäksi suuren opetusjoukon käyttämistä. Sopivien painojen löytyminen ei aina onnistu ja
ongelmaan parhaiten sopivan verkon arkkitektuurin valinta on vaikeaa. Usein joudutaankin
kokeilemaan erilaisia valistuneita arvauksia kunnes verkolle löydetään tarpeeksi hyvä rakenne.
[Törmä 1997]
5.2. Perinteisiä luokittelijoita
AISA-kuvat luokiteltiin myös perinteisillä Bayesin päätösteorian sekä minimietäisyyden
algoritmeilla, koska hyperspektridatalle kehitettyjen luokittelijoiden tuloksia haluttiin verrata myös
perinteisten luokittelijoiden kanssa. Näitä ohjattuja luokittelualgoritmeja on käytetty paljon
erilaisten multispektrikuvien analysoinneissa. Esimerkiksi 70- sekä 80-luvuilta lähtien Landsat-
sekä SPOT-satelliitit ovat tuottaneet runsaasti dataa. Satelliittidataa on luokiteltu Bayesin sekä
minimietäisyyden -algoritmeilla lukuisissa eri tutkimuksissa. Luokittelussa Bayesin päätösteorian
avulla on usein käytetty suurimman uskottavuuden (Maximum Likelihood) menetelmää [Stahler
1980]. Perinteisiä luokittelijoita on useimmiten käytetty erilaisten kasvi- tai maalajien
luokittelussa, esimerkiksi puuvillaviljelysten luokittelu [Dutta et al. 1994].
44
5.2.1. Bayesin päätösteoria
Luonnon materiaalien spektraalisessa heijastuskuviossa tapahtuu luonnollista vaihtelua materiaalin
pinnan rakenteen takia. Lisäksi heijastus muokkaantuu ilmakehän, kohinan sekä topografian
vaikutuksesta. Yhteen pikseliin voi myös sekoittua eri materiaaleja [Campbell 1996], joten
luokkien rajat eivät ole yksiselitteisiä. Luokittelussa Bayesin päätösteorian avulla käytetään
hyväksi tilastollisia mittoja. Luokille lasketaan opetusalueiden avulla todennäköisyysjakaumia
kuvaavat tiheysfunktiot ja luokitettavan pikselin luokka määräytyy sen funktion mukaan, joka
antaa pikselille suurimman todennäköisyyden.
Esitetään systeemin luokkia symboleilla iw , missä i = 1,2,...,n ja n on luokkien lukumäärä.
Olkoon x hahmovektori, joka saa arvonsa d-ulotteisesta piirreavaruudesta. Jos luokittelussa
käytetään piirteinä suoraan instrumentista saatavia kanavia, eikä kanavista lasketa uusia piirteitä,
niin d on alkuperäisten kanavien lukumäärä ja x -vektorin arvot ovat kyseisten kanavien
kirkkausarvoja. Luokittelussa Bayesin päätösteorian avulla määritetään todennäköisyydet:
( )xwP i . Nämä kuvaavat todennäköisyyttä, jolla x kuuluu oikeaan luokkaan iw ja niitä
kutsutaan a posteriori todennäköisyydeksi. Luokittelussa hahmovektorille x lasketaan eri
luokkien tuottamat a posteriori todennäköisyydet ja valitaan niistä suurin. Suurimman a posteriori
todennäköisyyden antava luokka merkitään edustamaan luokiteltavan pikselin luokkaa. Samalla
tavalla lasketaan uudet a posteriori todennäköisyydet kuvan jokaiselle pikselille. A posteriori
todennäköisyyksiä ei saada laskettua suoraan, mutta niihin voi käyttää Bayesin sääntöä:
( ) ( )( )xP
PwxPxwP ii
i
∗= , (6.5)
missä:
( ) ( )∑=
=n
iii PwxPxP
1 (6.6)
on x :n yhteistiheysfunktio ja )( iwxP eli luokan i tiheysfunktio voidaan selvittää opetusdatan
avulla.
45
Bayesin päätösteorian käyttö ohjatussa luokittelussa on hyvin suosittua ja sillä saadaan yleensä
hyviä tuloksia multispektrikuvien luokittelussa [Richards, Xiuping 1999]. Algoritmit ovat järeitä ja
tehokkaita ja ne vaativat runsaasti laskentaa sekä tietokoneen resursseja. Tämä menetelmä vaatii
kuitenkin enemmän opetusalueiden laadulta kuin muut ohjatun luokittelun menetelmät.
Opetusalueiden dataa estimoidaan erilaisilla, yleensä Gaussin, tiheysfunktioilla. Sopivan
tiheysfunktion valinta voi olla vaikeaa, eikä takeita sen löytymisestä aina ole. Opetusalueita ei
todennäköisesti pystytä estimoimaan millään siistillä funktiolla, jos alueet on valittu huonosti
[Campbell]. Tällöin täytyy käyttää ei-parametrisia tiheysfunktioita.
5.2.2. Minimietäisyyden luokittelija
Minimietäisyyden luokittelussa lasketaan ensin luokkien keskipisteet, jotka saadaan laskettua
opetusalueiden heijastusarvojen keskiarvoista. Luokkien keskipisteiden laskemiseen voidaan
käyttää myös muita mittoja, esimerkiksi mediaania. Seuraavaksi lasketaan euklidiset etäisyydet
luokiteltavan pikselin sekä jokaisen luokan keskipisteen väliltä. Pikseli ohjataan siihen luokkaan,
jonka kanssa niiden välinen etäisyys on pienin. Minimietäisyyden menetelmä on yksinkertainen ja
helppo toteuttaa, mutta nykyään se ei ole kovinkaan yleinen luokittelualgoritmi
kaukokartoituksessa. Menetelmä ei ole kovinkaan tarkka, joten tehokkaammat algoritmit ovat
syrjäyttäneet sen. Päällekkäiset sekä epämääräiset luokat aiheuttavat usein vaikeuksia
minimietäisyyden menetelmässä. Toisaalta luokittelija on helposti laajennettavissa, sillä luokkien
keskipisteitä sekä etäisyysmittoja voidaan laskea erilaisilla metodeilla. Minimietäisyysluokittelija
on myös optimaalinen kun luokilla on samat ortogonaaliset kovarianssimatriisit. [Campbell 1996]
46
6. Työssä käytetty AISA-data sekä maastotyöt
Tässä työssä käytettiin kahdelta eri koealueelta havaittua hyperspektridataa. Osa datan sisältämistä
virheistä korjattiin jo esikäsittelyvaiheessa. Geologian Tutkimuskeskus suoritti koealueiden
maastotyöt.
6.1. AISA-data
Lammin sekä Paraisten koealueet kuvattiin Geologian tutkimuskeskuksen toimesta syyskuussa
1999. Hankkeen tarkoituksena oli tutkia hyperspektrikaukokartoitusmenetelmien käyttöä
geologisiin tutkimuksiin. Alueet kuvattiin Metsäntutkimuslaitoksen AISA-spektrometrillä. Datan
esikäsittely tehtiin METLA:ssa korjaamalla kuvauslinjat yhtenäiskoordinaatistoon. Lisäksi osa
aineiston geometrisistä virheistä korjattiin.
Lammin alue on pohjois-etelä-suunnassa oleva yli 50 km pitkä ja 2 km leveä suorakaide. Se alkaa
etelässä Mommilan kylästä, keskus osuu Lammin kylän tietämille ja alue jatkuu aina Padasjoen
kuntaan Vesijaon kylään. Koealue sisältää paljon erilaisia jääkauden aikaisia maalajeja,
kerrostumia sekä muodostumia, joita jäämassan reuna sekä sulamisvedet muokkasivat ja
lajittelivat. Lisäksi suuri osa alueesta on ollut muinaisten Baltian jääjärven sekä Yoldiameren
vedenpinnan alla, jolloin alueen eteläosan pohjasedimentit muodostuivat. Alueen poikki kulkevalla
Salpausselkä-vyöhykkeellä sijaitsee tyypillisiä jäämassan reunan sekä jäätikköjokien muokkaamia
harjuja, reunamuodostumia sekä moreenikumpuja ja -selänteitä. [Törmä et al. 2001]
Paraisten koealue sijaitsee Paraisten kaivosalueen tietämillä ja sen ympäristössä, sisältäen myös
Paraisten keskustan. Alue sisältää paljon kaupunki- sekä pientaloalueita, havu- ja lehtipuita,
rannikkokasvillisuutta, kallioita sekä merta. Kuvalle on eksynyt myös jokunen pilvi, mikä heikensi
tulkittavuutta kyseisillä alueilla. Alue oli valittu GTK:n hankkeeseen kaivosten
ympäristövaikutusten selvittämiseksi.
47
Lammin koealue kuvattiin keskimäärin 1000 metrin korkeudesta ja lentonopeus oli 200 km/h.
Näin yhden pikselin kooksi saatiin 1.1 x 1.1 metriä ja mittauslinjojen leveydeksi 384 metriä.
Vierekkäisten lentolinjojen peitto valittiin 84 metriin. Kuvausten aikana sää muuttui huonommaksi
ja lentokoneen rauhattomuus lisääntyi. Lentolinjojen sivuttaispeitto ei enää riittänyt vaan
kuvauslinjojen väliin syntyi katvealueita. Samalla pilvisyys lisääntyi, mikä näkyy kuvauslinjojen
välisinä valoisuuseroina. Ensimmäinen kuvauslinja näkyy selvästi kirkkaimpana ja sen jälkeen
kuvauslinjat tummuvat nopeasti. Huonon sään takia kuvattiin kuusi lentolinjaa alun perin
suunnitellun kahdeksan lentolinjan sijaan. Mittauslennot tehtiin päivällä, auringon ollessa
korkeimmillaan, jolloin näkyvän valon määrä on suurimmillaan ja varjot ovat mahdollisimman
lyhyitä [Ruohomäki et al. 2002]. Varjoja näkyi kuitenkin kuvilla, sillä syyskuussa ei aurinko ole
keskipäivälläkään kovin korkealla. Myöhäinen vuodenaika aiheutti myös sen, että lehtivihreä oli
alkanut hävitä joistain kasveista sekä osa pelloista oli korjattu.
Taulukko 6.1: Lammi sekä Paraisten alueiden kuvauksissa käytettyjen kanavien aallonpituusalueet.
Kanava Aallonpituus MIN (nm) Aallonpituus MAX (nm) 1 448.99 456.27 2 470.84 478.13 3 491.24 498.53 4 520.38 527.67 5 548.06 555.35 6 572.83 580.12 7 597.60 604.89 8 620.91 628.20 9 644.67 652.27 10 667.46 675.05 11 696.32 703.91 12 744.93 752.52 13 776.83 784.42 14 796.57 804.17 15 840.62 848.22 16 857.33 864.93 17 866.45 874.04
AISA ohjelmoitiin tallentamaan 17 eri kanavaa, jotka sijaitsivat näkyvän valon sekä lähi-
infrapunasäteilyn aallonpituuksilla. Vastaavat aallonpituudet ovat noin 450-875 nm. Kanavien
leveydeksi saatiin noin 7-8 nm ja ne sijaitsivat kutakuinkin tasaisesti jakautuneena näkyvän valon
alueella. Lähi-infrapuna-alueella kanavien keskinäinen sijainti vaihteli. Kuvatut alueet olivat
laajoja, joten 17 kanavaa sisältävän 12 bittisen kuvadatan koko oli noin 4.5 GB sekä Lammin että
Paraisten alueelta.
48
6.2. AISA-datan esikäsittely
Datan esikäsittelyssä tehtiin radiometriset sekä geometriset korjaukset sekä kuvauslinjoista
muodostettiin yhtenäiskoordinaatistossa oleva mosaiikki. Esikäsittely tehtiin METLA:ssa VTT:n
kehittämällä ohjelmalla. Radiometrisessä korjauksessa instrumentin havaitsemasta raakadatasta
korjattiin erilaisia virheitä. Auringon korkeudesta johtuvat radianssin muutokset korjattiin käyttäen
Lambertin mallia. Ilmakehän vaikutusta ei kuitenkaan huomioitu, mutta erot instrumentin CCD-
kennon eri pikseleiden välillä korjattiin vertaamalla kunkin CCD-kennon pikselin mittaamaa
maastossa olevaa kalibrointikohdetta [Mäkisara et al. 1994]. Geometrisessä korjauksessa käytettiin
apuna differentiaali GPS-instrumentin havaintoja sekä lentokoneen navigointitietoja. Oikaisun
tärkeänä apuna käytettiin myös Maanmittauslaitoksen numeerista peruskarttaa ja oikaisun tarkkuus
vaihteli sen puitteissa metreistä muutamiin kymmeniin metreihin. Käytännössä oikaisu tehtiin
osoittamalla kontrollipisteitä AISA-datan sekä peruskartan välillä.
6.3. Maastotyöt
Maastotöitä tehtiin Lammin koealueella. Aineiston radiometristä kalibrointia varten maastoon
sijoitettiin signaalipintoja ennen kuvausta. Pintoina käytettiin aumamuovia, jonka toinen puoli oli
valkea ja toinen musta. Muovin tarkat heijastusominaisuudet määritettiin laboratoriomittauksilla.
Muovit sijoitettiin ensimmäisen kuvauslinjan alkuun ja niiden yli lennettiin vielä uudelleen
mittauslennon lopuksi. Koealueen kuvauksen jälkeen, vuosina 2000 ja 2001, suoritettiin alueella
maastoinventointia, jolloin valittiin 260 kasvillisuudeltaan ja maalajiltaan yhtenäistä aluetta. Nämä
koealat piirrettiin maastossa vektorikuvioina AISA-kuvan päälle, jolloin alueiden sijainti saatiin
tarkoin määriteltyä. Tämä oli tärkeää sillä osa koealoista oli hyvin pieniä ja tarkoin määriteltyjä
(esimerkiksi yksittäiset puiden latvukset). Koska AISA-kuvan oikaisutarkkuus oli kymmeniä
metrejä, niin pelkkien koordinaattien perusteella pienten kohteiden sijainti olisi todennäköisesti
pielessä. [Ruohomäki et al. 2002]
Koealoista saatu heijastus oli useimmiten peräisin kasvillisuudesta. Erityisesti tiheät lehti- sekä
kuusimetsät, peltojen nurmiviljelyt sekä sokerijuurikaspellot muodostivat heijastukseltaan
yhtenäisiä alueita. Harvemmissa metsissä varjot aiheuttivat suuria vaihteluita heijastusspektriin ja
49
lisäksi heijastukseen vaikutti maaston aluskasvillisuus. Viljapellot olivat jo kuvausajankohtana
puituja tai tuleentuneita, joten niissä ei ollut lehtivihreää ja niiden heijastukseen vaikutti
useimmiten myös maaperän heijastusominaisuudet. Paljaan maan heijastusspektrejä saatiin
enimmäkseen maanteistä, maanottopaikoista sekä kynnetyistä pelloista. Näiden alueiden maalajeja
oli useimmiten sora, hiekka, hieta, hiesu ja savi. [Ruohomäki et al. 2002]
Lammin alueen koealoilta havaittiin kasvillisuus, maaperä ja kosteus. Kasvillisuuden
inventoinnissa erotettiin puusto, josta kuvattiin puulaji, ikä ja peitteisyys sekä aluskasvillisuus,
josta pääkasvilaji, lehtivihreän määrä ja kosteusolosuhteet havaittiin. Peltoalueilta kirjattiin
viljelykasvi sekä pellon viljelytilanne. Maaperän ominaisuuksia tutkittiin erikseen pinta-, sekä
pohjamaan osalta. Maaperän maalaji kirjattiin pintamaan arvioinnin, maaperäkartan sekä
kairauksen avulla. Koealojen kosteusominaisuudet arvioitiin silmämääräisesti. Lopuksi alueilta
raportoitiin mitkä kohteet pääosin aiheuttivat heijastuksen ja kirjoitettiin lyhyt kuvaus alueesta.
Muutamilta koealoilta otettiin valokuvia [Törmä et al. 2001].
50
7. Luokittelu
AISA:lla havaitusta hyperspektridatasta valittiin pienempi alue, joka luokiteltiin Spectral Angle
Mapper, Spectral Correlation Mapper, Spectral Unmixing, Perceptron-neuroverkko, Bayesin
päätössäännön sekä minimietäisyyden algoritmeilla. Tarkoituksena oli vertailla eri algoritmien
toimintaa ja suoritusaikoja. Luokittelualgoritmeille pyrittiin löytämään mahdollisimman hyvät
opetusaluejoukot. Työssä kokeiltiin useita eri opetusaluejoukkoja, joista valittiin parhaiten
vertailuun sopivat opetusalueet. Useimmat luokittelualgoritmit vaativat myös erilaisia parametreja
tai kynnysarvoja, jotka vaikuttivat luokitteluun. Erilaisia parametrien arvoja vertailtiin ja etsittiin
parhaan lopputuloksen antavat arvot.
Hyperspektrikuville kehitetyt luokittelualgoritmit käyttävät luokittelussa referenssimateriaalina
opetusalueiden heijastusarvoista muodostettuja referenssispektrejä. Nämä referenssispektrit
vaikuttavat oleellisesti hyperspektrikuvan luokitteluun. Eri metodein muodostetut heijastusspektrit
eroavat hiukan toisistaan, joten myös niitä vertailtiin sekä tutkittiin miten eri tavoin muodostetut
heijastusspektrit vaikuttavat luokittelun lopputulokseen.
7.1. Opetusalueiden valinta
Opetusalueet valittiin samalta alueelta kuin luokiteltava kuva. Opetusalueiksi kelpuutettiin puhtaita
kasvillisuuden, maaperän tai keinotekoisten materiaalien alueita, joilta saatiin yhtenäinen heijastus.
Koealueiden suuruus vaihteli, mutta yleensä ne olivat useamman sadan pikselin kokoisia tai
suurempia. Ainoastaan rakennukset-luokkaa edustaneiden opetusalueiden pinta-alat olivat
pienempiä.
Opetusalueiden valinnassa käytettiin hyväksi aikaisemmin tehdyissä maastotöissä kerättyjen
koealueiden tietoja. Näitä koealueita ei kuitenkaan käytetty suoraan luokittelun
referenssimateriaalina. Opetusalueet valittiin siten, että ne edustavat kaikkia luokiteltavan kuvan
tärkeitä maaston tai ihmisen tekemiä kohteita. Opetusalueiksi kelpasivat siten seuraavanlaiset
kohteet: lehtimetsä, havumetsä, rakennukset, tiet, ruoho, sokerijuurikaspellot, kynnöspellot sekä
muut viljapellot.
51
Hyperspektri-instrumentilla saadaan enemmän tietoa eri materiaalien heijastuksista ja kohteiden
karakterisoivat ominaisuudet tulevat paremmin esille. Toisaalta – myös saman kasvillisuusluokan
sisältä voi löytyä vaihtelua. Joskus tämä vaihtelun havaitseminen on hyödyllistä ja joskus siitä on
vain haittaa. Esimerkiksi kasvisairauksien etsimisessä kuusimetsästä on tärkeää, että kuusimetsästä
erotetaan terveet ja sairastuneet alueet. Toisaalta kasvilajien luokittelussa kuusimetsästä saatavan
heijastuksen toivotaan olevan mahdollisimman homogeeninen. Käytännössä hyperspektri-
instrumenttien tarkkuudet ovat useimmiten sitä luokkaa, että niillä voidaan selvästi havaita
eroavaisuuksia saman kasvillisuusluokan heijastuksessa. Siksi joudutaan keräämään enemmän
referenssidataa saman kasvillisuusluokan sisältä. Tämän takia hyperspektridatan luokittelussa
tarvitaan enemmän opetusalueita kuin perinteisissä luokitteluissa.
7.2. Heijastusspektrien analysointi
Hyperspektrikuvien, jotka oli kuvattu Lammin alueelta, heijastusspektrejä analysoitiin erilaisin
metodein. Lammin alueen maasto sisältää erilaisia kasvillisuusluokkia, eikä paljasta maaperää
juurikaan näy kasvillisuuden alta. Siksi tässä työssä tutkittiin, miten eri kasvillisuusluokat voidaan
erottaa toisistaan. Erilaisia kasvillisuusluokkia edustivat paju, koivu, mänty, kuusi, heinä ja
sokerijuurikas. Näihin kasvillisuusluokkiin päädyttiin, koska maastoinventoinnissa oli runsaasti
tietoa kyseisistä luokista. Erilaisia viljapeltoluokkia ei otettu tähän vertailuun mukaan, sillä
kuvausajankohtana vilja oli tuleentunut ja useat pellot olivat jo korjattu. Näin viljapeltojen
heijastukseen vaikutti maaperän laatu sekä tuleentuneet oljenkorret, joiden heijastuksesta ei juuri
löytynyt ominaisia piirteitä eri viljakasviluokkien välillä. Kasvillisuusluokista kuusi otettiin myös
tarkemman analysoinnin kohteeksi, sillä kuusi oli ainoa luokka, jolle löytyi riittävästi
maastoinventoinnissa kerättyjä erilaista maaperää sisältäviä koealoja. Valoisuusolosuhteiden
muutosta sekä erilaisten maaperälajien vaikutusta kuusen heijastusspektriin tutkittiin.
7.2.1. Kasvillisuusluokkien erottumisen analysointia luokkien välisten spektrikulmien avulla
Samoille kasvillisuusluokille löytyi Lammin koealueelta kymmeniä koealoja, jotka erosivat
toisistaan mm. pinta-alan, sijainnin, maaperän, aluskasvillisuuden sekä valoisuusolosuhteiden
mukaan. Vertailusta karsittiin sellaiset koealat pois, joiden heijastus ei ollut pääosin peräisin
52
kyseisestä kasvillisuusluokasta. Esimerkiksi taimikoita ei otettu mukaan, sillä niistä saatuun
heijastukseen vaikuttaa paljon myös maaperän tai aluskasvillisuuden heijastus. Lisäksi vertailusta
pyrittiin poistamaan sellaisia koealoja, joiden ominaisuudet poikkesivat merkittävästi saman
kasvillisuusluokan ominaisuuksista ja joiden heijastus ei vastannut kyseisen kasvillisuusluokan
tyypillistä heijastusta. Jäljelle jääneiden koealojen pikseleiltä laskettiin keskiarvot kaikille
hyperspektrikuvan 17 eri kanavalle. Näistä keskiarvoista saatiin heijastusspektrit, jotka edustivat
kukin omaa koealaa. Nämä heijastusspektrit luokiteltiin edellä mainittujen kasvillisuusluokkien
mukaan, ja kunkin luokan heijastusspektreistä laskettiin keskiarvot eri kanaville, jotka edustavat
eri kasvillisuusluokkien keskimääräisiä heijastusspektrejä. Lisäksi saman luokan heijastusspektrien
keskihajonnat laskettiin kullekin kanavalle. Vähentämällä keskimääräisestä heijastusspektristä
saman luokan keskihajonnat, saatiin kyseisen luokan heijastusspektrin alakvartiili. Yläkvartiili
saatiin edelleen laskemalla yhteen keskimääräinen heijastusspektri sekä keskihajonta. Ylä- ja
alakvartiilit kuvaavat sellaisia käyriä, että saman luokan heijastusspektrit useimmiten osuvat
kvartiilien välille, kuten kuvasta 7.1 voidaan havaita. Tässä työssä käytetyt kvartiilit eroavat
yleisesti käytetyistä kvartiileista, jotka määritellään siten, että x-prosenttia havainnoista on
kvartiilin ylä/alapuolella.
PAJUALUEIDEN KESKIMÄÄRÄINEN HEIJASTUSSPEKTRI JA SEN KVARTIILIT
0
1000
2000
3000
4000
5000
6000
7000
8000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
KANAVAT
HEI
JAST
USA
RVO
KESKIARVO
YLÄKVARTIILI
ALAKVARTIILI
Paju1
Paju2
Paju3
Kuva 7.1: Pajualueiden keskiarvoista laskettu keskimääräinen heijastusspektri ja sen ylä- ja
alakvartiili sekä yksittäisiä pajun heijastusspektrejä.
Kasvillisuusluokkien heijastusspektrejä vertailtiin laskemalla niiden välisten spektrikulmien
arvoja. Heijastusspektrejä käsiteltiin vektoreina ja niiden välisten spektrikulmien arvot laskettiin
vektoreiden pistetulon avulla, samaan tapaan kuin kappaleen 5.1.1. Spectral Angle Mapper –
algoritmilla. Vertailussa käytettiin koealojen pikseleistä laskettuja keskiarvomittoja. Näin
53
heijastusspektrit edustivat aina tietyn pikselijoukon keskimääräistä heijastusta. Näin saadut
tulokset eroavat Spectral Angle Mapper –luokittelusta, jossa spektrikulmien arvot laskettiin
erikseen jokaiselle luokiteltavan kuvan pikselille. Hyperspektridata sisälsi paljon valoisuuseroja,
joten eri luokkien väliset mitat oli kätevä laskea heijastusspektrien välisinä kulmina. Näin
valoisuuserot eivät vaikuta tuloksiin merkittävästi, kuten kappaleessa 7.6.4. tullaan huomaamaan.
Keskimääräisten spektrien lisäksi muodostettiin ylä- ja alakvartiilit ja spektrikulmien arvot
laskettiin myös näiden välille, sillä haluttiin tutkia myös kasvillisuusluokkien sisältämien
heijastusspektrien hajonnan vaikutusta spektrikulman suuruuteen ja sen kautta myös luokkien
erottuvuuteen. Jos tarkastellaan ainoastaan keskimääräisiä heijastusspektrejä, unohdetaan se
tosiasia, että saman kasvillisuusluokan sisällä heijastusominaisuudet voivat vaihdella.
Spektrikulmien laskeminen pelkästään keskimääräisille heijastusspektreille voi tuottaa
hyvännäköisiä tuloksia, joissa eri luokat erottuvat toisistaan hyvin. Jos luokkien sisältämissä
heijastusspektreissä on hajontaa, niin todellisuudessa luokkien erottuminen ei ole yhtä varma asia.
Kvartiilit otettiin mukaan, jotta saataisiin todellisempia mittoja luokkien erottuvuudesta. Eri
kasvillisuusluokkien heijastusarvojen keskihajonnan todettiin pysyttelevän näiden kvartiilien
välillä.
Heijastusspektrien väliset spektrikulmien arvot saatiin kiinnittämällä erikseen kunkin
kasvillisuusluokan keskimääräinen heijastusspektri referenssispektriksi ja laskemalla sen sekä eri
luokkien keskimääräisten heijastusspektrien sekä niiden ylä- ja alakvartiilien väliset spektrikulmat.
Spektrikulmien arvot havainnollistettiin pylväsdiagrammeilla kuvissa 7.2 – 7.7. Diagrammin
otsikko kertoo, minkä kasvillisuusluokan keskimääräinen heijastusspektri on referenssispektrinä ja
pylväät kuvaavat referenssispektrin sekä muiden kasvillisuusluokkien heijastusspektrien välisten
spektrikulmien arvoja. Spektrikulman arvo referenssispektrin ja yläkvartiilin välillä ei välttämättä
täydy olla suurempi kuin referenssispektrin ja alakvartiilin välillä. Myöskään referenssispektrin ja
keskimääräisen heijastusspektrin välinen spektrikulman arvo ei välttämättä sijaitse kvartiilien
välissä. Näistä kolmesta luvusta voidaan kuitenkin päätellä, että useimmiten kyseisen luokan
heijastusspektrien sekä referenssispektrin välinen spektrikulma sijaitsee näiden lukujen välillä.
Luokka erottuu muista luokista hyvin, jos spektrikulmat ovat pienempiä kyseisen luokan
keskimääräisen heijastusspektrin sekä saman luokan ylä- ja alakvartiilikäyrien välillä kuin
kyseisen luokan keskimääräisen heijastusspektrin sekä muiden luokkien keskimääräisten spektrien
sekä niiden ylä- ja alakvartiilikäyrien välillä.
54
PAJU
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
PAJU KOIVU MÄNTY KUUSI HEINÄ SOKERIJUURI
SPEK
TRIK
ULM
AN
AR
VO
KESKIARVO
YLÄKVARTIILI
ALAKVARTIILI
Kuva 7.2: Pajun keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden
ylä- ja alakvartiilien, välisten spektrikulmien vertailua.
Kuvassa 7.2 referenssispektrinä on paju, joten spektrikulmat on laskettu pajun
keskimääräisen heijastusspektrin sekä eri kasvillisuusluokkien (paju, koivu, mänty, kuusi,
heinä ja sokerijuurikas) keskimääräisten heijastusspektrien sekä niiden ylä- ja
alakvartiilikäyrien välillä. Ensimmäisen pylvään arvo on 0, sillä vertailussa on sama pajun
keskimääräisten heijastusspektri. Kuvasta voidaan päätellä, että pajun heijastusspektri
sekoittuu koivun sekä sokerijuurikkaan kanssa laskettaessa spektrien välisiä spektrikulmia.
KOIVU
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
KOIVU PAJU MÄNTY KUUSI HEINÄ SOKERIJUURI
SPEK
TRIK
ULM
AN
AR
VO
KESKIARVO
YLÄKVARTIILI
ALAKVARTIILI
Kuva 7.3: Koivun keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden
ylä- ja alakvartiilien, välisten spektrikulmien vertailua.
Kuvan 7.3 mukaan koivun spektrikulmien arvot voidaan erottaa hyvin muista luokista ottamatta
huomioon pajua, joka saattaa sekoittua koivun kanssa. Koivun ja sokerijuurikkaan väliset
spektrikulmat ovat niin suuria, että ne pitäisi voida erottaa toisistaan. Koivun sekä männyn, kuusen
55
ja heinän spektrikulmat ovat selvästi niin suuria, että mitään ongelmia koivun sekoittamiseksi
näiden luokkien kanssa ei ole, kun vertaillaan luokkien heijastusspektrien välisiä spektrikulmia.
MÄNTY
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
MÄNTY PAJU KOIVU KUUSI HEINÄ SOKERIJUURI
SPEK
TRIK
ULM
AN
AR
VO
KESKIARVO
YLÄKVARTIILI
ALAKVARTIILI
Kuva 7.4: Männyn keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden
ylä- ja alakvartiilien, välisten spektrikulmien vertailua.
Mäntyluokan sisällä spektrikulmien hajonta on erittäin pientä kuvan 7.4 mukaan. Spektrikulmien
suuruudet mäntyluokan sisällä ovat selvästi muita luokkia pienempiä. Ainoastaan männyn ja
kuusen väliset spektrikulmat voivat sekoittua, muuten mäntyluokka pitäisi olla helppo erottaa
muista luokista laskettaessa luokkien välisiä spektrikulmia.
KUUSI
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
0,20
0,22
KUUSI PAJU KOIVU MÄNTY HEINÄ SOKERIJUURI
SPEK
TRIK
ULM
AN
AR
VO
KESKIARVO
YLÄKVARTIILI
ALAKVARTIILI
Kuva 7.5: Kuusen keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden
ylä- ja alakvartiilien, välisten spektrikulmien vertailua.
Myös kuusiluokan sisällä laskettujen spektrikulmien hajonta on hyvin pientä, kuten kuvan 7.5
diagrammista ilmenee. Kuuset on helppo erottaa muista luokista, mutta sekoittuminen on
56
mahdollista mäntyluokan kanssa. Kuusen ja muiden luokkien kanssa laskettujen spektrikulmien
arvojen hajonta oli suurta.
HEINÄ
0,000,020,040,060,080,100,120,140,160,180,200,22
HEINÄ PAJU KOIVU MÄNTY KUUSI SOKERIJUURI
SPEK
TRIK
ULM
AN
AR
VO
KESKIARVO
YLÄKVARTIILI
ALAKVARTIILI
Kuva 7.6: Heinän keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien, sekä niiden
ylä- ja alakvartiilien, välisten spektrikulmien vertailua.
Heinän sekä muiden luokkien väliset spektrikulmien arvot sekoittuivat helposti keskenään.
Varsinkin heinän erottaminen männystä ja kuusesta oli vaikeaa.
SOKERIJUURIKAS
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
SOKERIJUURI PAJU KOIVU MÄNTY KUUSI HEINÄ
SPEK
TRIK
ULM
AN
AR
VO
KESKIARVO
YLÄKVARTIILI
ALAKVARTIILI
Kuva 7.7: Sokerijuurikkaan keskimääräisen heijastusspektrin sekä eri kasvien heijastusspektrien,
sekä niiden ylä- ja alakvartiilien, välisten spektrikulmien vertailua.
Spektrikulmien hajonta oli erittäin pientä homogeenisen sokerijuurikasluokan sisällä. Muiden
luokkien kanssa spektrikulmien arvot olivat selvästi suurempia. Näin sokerijuurikasluokan
erottaminen muista luokista onnistuu hyvin vertailemalla luokkien välisiä spektrikulmia.
57
7.2.2. Kuusen heijastusspektrin analysointia
Kasvillisuusluokkien erottumisen analysoinnissa karsittiin koealoja, joiden ominaisuudet
poikkesivat merkittävästi saman kasvillisuusluokan ominaisuuksista. Näin kuusiluokkaan jäi 34
tyypillistä suomalaista kuusimetsää sisältävää aluetta. Alueiden koot olivat tyypillisesti joitain
satoja tai tuhansia pikseleitä. Kuusialueilta saatiin alueiden heijastusspektrit laskemalla pikselien
keskiarvot erikseen 17 eri kanavalle, kuten edellisessäkin kappaleessa tehtiin. Nämä
heijastusspektrit asetettiin valoisuusolosuhteidensa mukaiseen järjestykseen ja laskettiin näiden
spektrien sekä keskimääräisen kuusenspektrin väliset spektrikulmat. Keskimääräinen
kuusenspektri saatiin kuusialueiden heijastusspektrien keskiarvosta. Tutkittaessa maaperän
vaikutusta kuusen spektriin luokiteltiin kuusialueiden heijastusspektrit maaperälajien karkeuden
mukaan. Spektrikulmien arvot laskettiin näiden heijastusspektrien sekä keskimääräisen
kuusenspektrin välille.
KUUSEN HEIJASTUSSPEKTREJÄ
0
500
1000
1500
2000
2500
3000
3500
4000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
KANAVAT
HEI
JAST
USA
RVO
KUUSIALUE
KUUSI1
KUUSI2
KUUSI3
Kuva 7.8: Erilaisia kuusen heijastusspektrejä. Kuusi 1, 2 ja 3 ovat yksittäisiä kuusialueiden pikseleitä
ja kuusialue on laajemman alueen pikseleistä laskettu heijastusspektri.
Kuusialue käsittää valoisia kuusenlatvoja, varjoja sekä metsänpohjaa ja alueen
heijastusominaisuudet vaihtelevat voimakkaasti. Siksi yksittäisten pikselien arvot voivat poiketa
selvästi alueen muista pikseleistä. Kun koko alueesta lasketaan keskimääräinen heijastusspektri,
saadaan koko aluetta kuvaava tunnusluku, mutta samalla menetetään tieto alueen tekstuurista.
Kuvassa 7.8 on kuusialueen pikseleistä laskettu heijastusspektri, sekä muutama yksittäisen
kuusipikselin heijastusspektri.
58
VALAISTUKSEN VAIKUTUS SPEKTRIKULMAAN
0
0,025
0,05
0,075
0,1
0,125
0,15
0,175
0,2
0,225
0,25
<- HYVÄ VALAISTUS HUONO ->
SPEK
TRIK
ULM
AN
AR
VO
Kuva 7.9: Kuusialueiden välisten spektrikulmien muuttuminen valoisuuden vähentyessä. Paksumpi
viiva on aineistoon sovitettu eksponentiaalinen käyrä. Spektrikulma on laskettu keskimääräisen
kuusen heijastusspektrin sekä kuusialueiden, joiden valaistusolosuhteet vaihtelevat, heijastusspektrien
välille.
Valaistuksen vaikutus kuusialueiden heijastusspektrien välisiin spektrikulmiin näkyy kuvassa 7.9.
Pienet valoisuuden erot eivät juuri vaikuta spektrikulman arvoon, mutta valoisuuden vähetessä
spektrikulman arvo kasvaa. Lisäksi on huomioitava, että valaistuksen ollessa huonoa
spektrikulmien arvojen hajonta kasvaa melkoisesti ja näin esimerkiksi Spectral Angle Mapper -
luokittelun epävarmuus lisääntyy.
59
MAAPERÄN VAIKUTUS KUUSEN SPEKTRIKULMIIN
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
<- HIENOT MAALAJIT MAAPERÄ KARKEAT MAALAJIT ->
SPEK
TRIK
ULM
AN
AR
VO
Kuva 7.10: Erilaisen maaperän vaikutus kuusialueiden heijastusspektrien välisiin spektrikulmiin.
Spektrikulma on laskettu keskimääräisen kuusen heijastusspektrin sekä eri maalajeilla kasvaneiden
kuusialueiden heijastusspektrien välille.
Kuvan 7.10 mukaan erilaiset maalajit eivät näyttäisi vaikuttavan kuusen heijastusspektrien välisiin
kulmiin. Kuusialueet olivat hyvin peitteisiä, joten maaperän suora vaikutus alueiden
heijastusspektriin oli hyvin vähäinen. Maaperän on kuitenkin todettu vaikuttavan esimerkiksi
kasvin rakenteeseen ja sen kautta myös heijastukseen [Huete 1989]. Tämän toteamiseksi vaaditaan
kuitenkin huomattavasti suuremman koealuejoukon keräämistä sekä maastohavaintoja myös
kasvillisuuden rakenteesta.
7.3. Referenssispektrit
Hyperspektrikuvien luokittelussa luokiteltavan pikselin heijastusspektriä verrataan luokkien
referenssispektreihin, minkä perusteella pikselin luokka määräytyy. Referenssispektri vastaa
muodoltaan heijastusspektriä ja niitä on laskennassa helpoin käsitellä vektoreina, joiden dimensio
vastaa hyperspektridatan kanavien lukumäärää. Referenssispektrit voidaan hakea suoraan
spektrikirjastoista tai ne voidaan muodostaa kuvan opetusalueista laskemalla. Hyperspektrikuvan
hyvin tunnettujen pikseleiden heijastusspektrejä voidaan käyttää myös suoraan
referenssispektreinä. Hiukan harvinaisempi ja kalliimpi keino on käydä maastossa mittaamassa
esimerkiksi helikopteriin ripustetulla spektrometrillä referenssispektrejä.
60
Tässä työssä referenssispektreiksi valittiin hyvin tunnettujen pikseleiden heijastusspektrejä. Lisäksi
heijastusspektrejä muodostettiin hyperspektrikuvan opetusalueista eri metodeilla. Kansainväliset
spektrikirjastot sisälsivät enimmäkseen erilaisten mineraalien spektrejä, joten Suomen
kasvillisuuden luokittelussa niistä ei ollut apua. Kun jokaiselle erilliselle luokalle haettiin useita
referenssispektrejä nousi lopullinen referenssispektrien määrä joissain tapauksissa yli sataan.
Hyvin tunnettujen pikselien heijastusspektrien valitseminen referenssispektreiksi oli nopeaa mutta
virhealtista. Valittuun pikseliin tuli tällöin kiinnittää erityisen paljon huomiota. Pikselin
heijastuksen tuli olla peräisin kyseisen, pikseliä edustavan, luokan materiaalin heijastuksesta.
Lisäksi referenssispektrin tuli edustaa mahdollisimman hyvin kyseisen luokan heijastusarvoja. Jos
luokan heijastusominaisuudet muuttuivat riittävästi saman luokan sisällä, jouduttiin samalle
luokalle etsimään uusia referenssispektrejä. Useimmiten eri luokille jouduttiin keräämään useita
referenssispektrejä, jotta kyseisen luokan heijastusominaisuudet saatiin määritettyä riittävän
tarkasti.
7.4. Eri tavoin muodostettujen referenssispektrien vertailu
Optimaalisen opetusalueen heijastusominaisuudet eivät juurikaan vaihtele alueen eri osissa.
Esimerkiksi tiheä sokerijuurikaspelto aiheutti hyvin tasaisen heijastuksen kuvattuna AISA:lla, kun
spatiaalinen erotuskyky oli noin yhden metrin luokkaa. Sen sijaan tiheäkin havumetsä oli
heijastusominaisuuksiltaan hyvin epätasainen. Korkeat puunlatvat aiheuttivat voimakkaan
heijastuksen sekä varjostivat latvojen välissä olevia havukerroksia, joiden heijastus oli vähemmän
intensiivistä. Kun saman opetusalueen heijastusominaisuudet vaihtelevat rajusti, on tältä alueelta
kerättyjen referenssispektrien valitsemiseen kiinnitettävä erityistä huomiota. Erilaiset menetelmät
aluetta kuvaavan heijastusspektrin luomiseksi tuottavat erilaisia tuloksia ja edustavimman
heijastusspektrin löytäminen voi olla vaikeaa.
Luokitteluissa käytetyistä luokista kuusen heijastusominaisuudet vaihtelivat hyvin voimakkaasti.
Siksi heijastusspektrin luomismenetelmien tarkempaa analysointia varten hyperspektrikuvalta
valittiin kuvan 7.11 osoittava 1010× -kokoinen alue, joka kuvasi tyypillistä tiheää kuusimetsää.
Sadan pikselin alue käsitti valoisia kuusenlatvoja, varjoja sekä hiukan metsänpohjaa. Aluetta
edustavia heijastusspektrejä kerättiin eri menetelmin. Ensiksi laskettiin tutkittavan alueen pikselien
61
keskiarvot kaikille 17 kanavalle erikseen. Heijastusspektri saatiin kuvaamalla keskiarvot kanavien
aallonpituuksien funktiona. Toisena tapana muodostaa heijastusspektrit käytettiin keskiarvojen
laskemisen sijaan mediaania, eli keskimmäistä arvoa. Kolmantena tapana käytettiin moodia, eli
valittiin heijastusarvo, joka esiintyi yleisimmin tutkittavalla sadan pikselin alueella kullekin
kanavalle erikseen.
Kuva 7.11: Tarkemman analysoinnin kohteena oleva pieni kuusialue, jonka kirkkaat pikselit ovat
valoisia kuusenlatvuksia ja tummat pikselit ovat varjossa olevia kuusenhavuja sekä metsänpohjaa.
Lopuksi alueelta valittiin kirkkaan heijastuksen omaavia puhtaita pikseleitä, jotka edustivat kuvalla
aurinkoisia ja selkeästi näkyviä kuusenlatvoja. Näistä pikseleistä saatiin suhteellisen puhtaita
kuusenhavun heijastusspektrejä. Näistä heijastusspektreistä ei laskettu keskiarvoja, mediaaneja tai
moodeja, vaan heijastusspektrikäyrät piirrettiin samaan koordinaatistoon. Seuraavaksi valittiin se
käyrä, joka näytti kuvaavan parhaiten koko joukkoa. Aikaisemmin lasketut eri keskiarvomitat
laskettiin erikseen jokaiselle kanavalle välittämättä naapurikanavien arvoista. Tällöin
heijastusspektri ikään kuin latistuu ja sen materiaalia kuvaavat piirteet heikkenevät. Nyt pyrittiin
valitsemaan kokonainen ja paras heijastusspektri, jota ei muokata ollenkaan.
62
Eri metodein muodostetut heijastusspektrit
0
10
20
30
40
50
60
70
80
1 2 3 4 5 6 7 8 9 1 11 1 1 1 15 1 17Kanavat
Hei
jast
usar
vo
Keskiarvo
Mediaani
Moodi
Puhdas pikseli
Kuva 7.12: Keskiarvo, mediaani, moodi -tavoilla lasketut heijastusspektrit sekä puhtaan havupikselin
heijastusspektri, joka valittiin puiden latvojen spektrien joukosta.
Erilaisilla metodeilla kerättyjä referenssispektrejä testattiin käytännössä Spectral Angle Mapper –
algoritmilla, jolla laskettiin kuvalla 7.12 näkyvien referenssispektrien sekä kuvan 7.11 osoittaman
alueen pikselien väliset spektrikulmat. Luokittelun tuloksena saatiin alkuperäisen havualueen
kokoinen kuva, jonka pikselien arvot saatiin vastaavien spektrien välisistä kulmista, kun spektrejä
käsiteltiin vektoreina. Jos onnistuttiin luomaan hyvin kuusimetsää kuvaava referenssispektri, niin
sen ja kuvapikselien väliset spektrikulmat olivat pieniä, ja siten vastaavat pikselit näkyivät
tummina. Tulkinnan helpottamiseksi kuvista, jotka havainnollistavat eri referenssispektrien sekä
kuvan 7.11 osoittaman alueen pikselien välisiä spektrikulmia, käännettiin värit siten, että tummat
pikselit tulivat vaaleiksi ja vaaleat tummiksi.
Kuva 7.13: Kuvat esittävät eri tavoin muodostettujen referenssispektrien sekä kuvan 7.11 osoittaman
alueen välisiä spektrikulmia. Värit on käännetty, joten kirkkaat pikselit kertovat hyvästä
luokittelutarkkuudesta.
Seuraavaksi 1010× -alueen pikseleista etsittiin sellaisia, joiden heijastus oli selkeästi peräisin
kuusen latvuksista eikä esimerkiksi metsän aluskasvillisuudesta. Näiden pikseleiden sijainnit
63
tallennettiin ja vastaavat arvot haettiin aikaisemmin lasketuista referenssispektrien ja kuvapikselien
välisistä spektrikulmista. Näistä arvoista laskettiin vielä keskiarvot sekä keskihajonnat eri
referenssispektrien tapauksissa. Lisäksi minimi- ja maksimiarvot taulukoitiin.
Taulukko 7.1: Eri tavoin määritettyjen referenssispektrien vaikutus luokiteltavan pikselin sekä
referenssispektrin väliseen kulmaan selkeillä kuusenlatvusalueilla.
Keskiarvo Mediaani Moodi Puhdas pikseli Min 1.12 1.75 2.75 0.99 Max 6.49 7.24 10.16 5.89 Keskiarvo 3.11 3.83 6.52 2.51 Keskihajonta 1.39 1.44 1.69 1.01
Taulukosta 7.1 huomataan, että referenssispektrien laskentatapaan kannattaa kiinnittää huomiota.
Kannattaa kuitenkin huomioida, että tässä tarkasteltiin selkeitä kuusenlatva-alueita. Metsänpohjan
sekä muiden epämääräisten alueiden ottaminen huomioon muuttaisi todennäköisesti tilannetta.
Referenssispektrien laskemisessa pikselien keskiarvo tuotti paremman tuloksen kuin mediaani.
Moodilla laskettu referenssispektri antoi huonoimman tuloksen. Puhdas pikseli –menetelmä toimi
odotetusti hyvin, sillä spektrien välisiä kulmia tarkasteltiin selkeillä kuusialueilla.
7.5. Luokittelualgoritmien suorittaminen
Luokittelussa käytettiin Geomatican multi- sekä hyperspektrikuville tarkoitettuja algoritmeja.
Lammin alueen datasta valittiin pienempi alue, jolta kerättiin opetus- ja testialueet. Luokiteltava
alue kuvasi tyypillistä maalaismaisemaa, joka sisälsi erilaisia peltoja, lehti- ja havumetsiä sekä
haja-asutusalueita. Luokittelussa alue jaettiin seuraaviin luokkiin: lehtimetsä, havumetsä,
rakennukset, tiet, kynnöspelto ja viljapelto.
Eri kuvalta kerättyjä referenssispektrejä kokeiltiin myös edellä mainitun alueen luokittelussa.
Referenssispektrit kerättiin tällöin Paraisten aineistosta ja niitä käytettiin Lammin alueen Spectral
Angle Mapper –luokittelussa. Lisäksi luokitteluun valittiin Lammin datasta leveän suorakulmion
muotoinen alue, joka sisälsi kuvauslinjoista johtuvia valoisuuseroja. Referenssispektrit, joilla koko
alue luokiteltiin, oli kerätty yhdeltä kuvauslinjalta ja niiden valaistusominaisuudet erosivat muista
kuvan osista lentolinjojen mukaan. Luokittelu tehtiin Spectral Angle Mapper -algoritmilla sekä
64
myös Bayesin päätössäännön avulla. Tarkoituksena oli tutkia, miten eri valaistusolosuhteet
vaikuttavat referenssidataan ja sitä kautta luokittelun tulokseen. Lisäksi Spectral Angle Mapperin
suorituskykyä haluttiin vertailla perinteisen luokittelijan kanssa tilanteessa, jossa kuvan
valoisuusolosuhteet muuttuvat.
7.5.1. Spectral Angle Mapper sekä Spectral Correlation Mapper
Spectral Angle Mapper –luokittelua varten kerättiin lukuisia referenssispektrejä eri luokista. Nämä
spektrit valittiin hyperspektrikuvan niiden opetusalueiden sisältä, jotka toimivat myös perinteisten
luokittelijoiden opetusalueina. Näin vertailu eri luokittelijoiden välillä oli mahdollista.
Referenssispektrien valinnassa kiinnitettiin erityisesti huomiota siihen, että kyseinen
referenssispektrijoukko edustaisi mahdollisimman hyvin koko opetusaluetta. Spectral Angle
Mapper –luokittelu tehtiin myös käyttäen muualta, kuin luokiteltavalta alueelta kerättyjä
referenssispektrejä.
Muita luokittelutulokseen vaikuttavia tekijöitä oli referenssispektrien lisäksi luokittelun
hylkäyskulman suuruus. Luokittelussa laskettiin luokiteltavan pikselin heijastusspektrin sekä
referenssispektrien välinen spektrikulma. Jos tämä kulma oli suurempi kuin hylkäyskulma, niin
kyseinen pikseli luokiteltiin hylkäysluokkaan ja sen arvoksi annettiin nolla. Tässä työssä
hylkäyskulman arvoksi valittiin 5 tai 8 astetta. Kun luokiteltava kuva sekä referenssispektrit
kerättiin samalta alueelta, niin spektrikulman arvo oli hyvin pieni ja lähes kaikki pikselit saatiin
luokiteltua johonkin luokkaan, vaikka hylkäyskulmana pidettiin 5 astetta. Käytettäessä muualta
hankittuja referenssispektrejä spektrikulmien arvot ylittivät usein 8 asteen rajan, jota pidettiin tässä
tapauksessa hylkäyskulmana. Siksi osa kuvasta jäi luokittelematta.
Luokittelussa oli myös mahdollista tutkia tarkemmin eri referenssispektrien sekä luokiteltavan
kuvan pikselien heijastusspektrien välisiä spektrikulmia. Näiden kulmien suuruudet voitiin
tallentaa uudelle kanavalle ja tuloksena saatiin kuva, joka havainnollistaa spektrikulmien suuruutta
ja siten luokittelun onnistumista. Pienet spektrikulmat näkyvät tummana ja ne merkitsevät, että
luokiteltava pikseli sekä referenssispektri ovat hyvin samankaltaisia. Tämä merkitsee suurempaa
varmuutta siitä, että luokiteltava pikseli sekä referenssispektri olisivat samaa materiaalia. Vaaleat
alueet merkitsevät sitä vastoin spektrikulmien suuria arvoja. Tällöin luokiteltava pikseli sekä
65
referenssispektri eivät juurikaan muistuta toisiaan ja todennäköisesti ne myös kuuluvat eri
luokkiin.
Kuva 7.14: Peltikaton sekä kuvan pikselien välisten heijastusspektrien väliset spektrikulmat.
Tulkinnan helpottamiseksi kuvan värit on käännetty siten, että vaaleat alueet merkitsevät pientä
spektrikulmaa ja tummat alueet suurempaa spektrikulmaa.
Spektrikulman suuruutta havainnollistavat kuvat ovat hyödyllisiä erinäisten materiaalien
etsimisessä ja tunnistamisessa hyperspektrikuvilta. Kuvassa 7.14 on esitetty referenssispektrin,
joka on kerätty rakennuksen peltikatosta, sekä hyperspektrikuvan väliset spektrikulmat. Kuvasta
on helppo löytää muut peltikattoiset rakennukset, joita kuvan kirkkaimmat pikselit edustavat. Tie
näkyy kuvalla myös suhteellisen kirkkaana, joten se sekoittaa hiukan kuvan peltikattojen
tulkittavuutta.
Spectral Correlation Mapper –luokittelussa käytettiin samoja referenssispektrejä, kuin siinä
Spectral Angle Mapper –luokittelussa, jossa luokittelun referenssispektrit kerättiin luokiteltavan
kuvan kanssa samalta alueelta. Ennen luokittelua hyperspektrikuvan jokaisen pikselin
heijastusspektri sekä referenssispektrit normalisoitiin. Muuten luokittelu tehtiin samaan tapaan
kuin Spectral Angle Mapper –algoritmin kanssa. Spektrien normalisointi tapahtui vähentämällä
niistä keskiarvo, joka oli laskettu kaikista kanavista.
66
7.5.2. Spectral Unmixing
Spectral Unmixin –luokittelua varten alkuperäisen hyperspektrikuvan pikselikokoa suurennettiin
kymmenkertaiseksi. Kuvan 7.15b pikselit ovat laskettu kuvan 7.15a vastaavien 1010× -kokoisten
alueiden pikseleiden keskiarvoista. Näin luokitteluun saatiin mukaan pikseleitä, joiden materiaalit
ovat selkeästi sekoittuneet. Lisäksi Spectral Unmixing -algoritmin tuloksia pystyttiin analysoimaan
helpommin kun käytössä oli 10 kertaa luokittelukuvaa tarkempi kuva. Esimerkiksi kuvalta 7.15a a
voidaan helposti nähdä, minkälaisista pikseleistä kuvan 7.15a b suuret pikselit ovat muodostuneet.
Kuvat 7.15a ja 7.15b: Alkuperäinen kuva (a) ja sama kuva kymmenkertaisella pikselikoolla (b).
Spectral Unmixing –luokittelussa käytettiin seuraavien luokkien referenssispektrejä: havupuu,
kynnöspelto, lehtipuu, pelto, rakennus, tie ja varjo. Luokittelun tuloksena Spectral Unmixing tuotti
kuvat 7.16a-7.16g eri luokkien suhteellisista osuuksista. Eri luokkien osuuskuvien kirkkaat pikselit
tarkoittavat, että sillä alueella kyseisen luokan osuus on suuri ja alueen heijastusspektri on
muodostunut pääosin tämän luokan materiaalin vaikutuksesta. Tumma pikseli merkitsee, että
kyseisen luokan heijastus ei juurikaan vaikuta sekoittuneen pikselin heijastusspektriin ja luokan
osuus tällä pikselillä on vähäinen.
67
Kuvat 7.16: Spectral Unmixing –algoritmin tuottamat luokkien suhteelliset osuuskuvat. (a) esittää
havupuun, (b) kynnöspellon, (c) lehtipuun, (d) pellon, (e) rakennuksen, (f) tien ja (g) varjon
suhteellista osuutta kyseisellä pikselillä.
Spectral Unmixing –luokittelun tuloksia on helppo analysoida kun eri luokkien osuuskuvia
verrataan alkuperäiseen erotuskyvyltään hyvään kuvaan 7.15a. Alkuperäisestä kuvasta voidaan
havaita pikselit, jotka vaikuttavat erotuskyvyltään huonon kuvan sekoittuneessa pikselissä.
Havupuuluokan osuuskuvasta 7.16a sekä alkuperäisestä kuvasta 7.15a voidaan havaita, että
luokittelu havupuun osalta ei tuottanut merkittävää tulosta. Sen sijaan kuvalla 7.16b voidaan
selvästi havaita vaaleammalla kynnöspellot, jotka myös näkyvät alkuperäisessä kuvassa 7.15a.
Samoin kuvalla 7.16c näkyy vaaleampana alueet, joilla myös oikeasti on paljon koivumetsää ja
joiden suhteellinen osuus on kyseisellä pikselillä on suuri. Kuvalla 7.16d peltoalue erottuu
vaaleampana, mutta myös tausta näkyy vaaleana vaikka tätä luokkaa ei juurikaan kuvan keskellä
olevaa peltoaluetta lukuun ottamatta ole. Rakennusluokan osuuskuvalta 7.16e voidaan havaita, että
osa rakennuksista onnistutaan esittämään hyvin ja erityisesti voidaan huomata, kuinka rakennusten
koko vaikuttaa pikselien kirkkauteen, mikä johtuu rakennuksen osuudesta kyseisellä pikselillä.
Toisaalta joitain rakennuksia ei tällä kuvalla pystytä havaitsemaan ollenkaan. Tämä johtuu
todennäköisesti rakennusten erilaisista kattomateriaaleista. Osuuskuvat 7.16f ja 7.16g eivät
juurikaan vastaa todellista tilannetta, joten tien sekä varjojen kannalta luokittelu ei myöskään
tuottanut kunnollista tulosta vaan nämä luokat sekoittuivat muihin materiaaleihin ja osuuskuvat
olivat tasaisen kirkkaita kauttaaltaan.
68
7.5.3. Perceptron-neuroverkko
Tässä työssä aiemmin mainitut hyperspektrikuville tarkoitetut luokittelualgoritmit perustuivat
referenssikohteiden heijastusspektrien eli referenssispektrien käyttöön. Luokittelussa käytettiin
useita referenssispektrejä. Samasta luokasta saattoi olla kerättynä kymmeniä hiukan toisistaan
poikkeavia referenssispektrejä. Perceptron-neuroverkko sekä perinteisissä luokittelijoissa valittiin
jokaista luokkaa kohden opetusalueet, joilta laskettiin luokittelussa käytettävät keskiarvo- tai muut
yleistysmitat.
Luokittelussa käytettiin Perceptron-verkkoa, joka muodostui syötekerroksesta, kahdesta
piilotetusta kerroksesta sekä vastekerroksesta. Syötekerros sisälsi 17 neuronia, yksi kullekin
AISA-kuvan kanavalle. Molemmissa piilotetuissa kerroksessa oli 10 neuronia, jotka syöttivät
tiedon edelleen kuudelle vastekerroksen neuronille, jotka vastasivat luokittelun luokkajakoa.
Vaikka verkon rakenne oli suhteellisen yksinkertainen, eikä luokiteltava kuvakaan ollut kovin
suuri, verkon opettaminen vaati paljon laskenta-aikaa. Laajemman alueen, esimerkiksi koko
Lammin-alueen, luokittelu olisi vienyt todella paljon aikaa. Toisaalta niin suuren alueen luokittelu
olisi vienyt paljon aikaa millä tahansa luokittelijalla, mutta Perceptron-neuroverkko luokittelija vei
tutkituista algoritmeista selvästi eniten tietokoneen laskenta-aikaa.
Perceptron-verkkon käyttöön liittyi sopivan verkon rakenteen muodostaminen sekä useiden
oppimisessa käytettävien parametrien säätäminen. Lopputulokseen vaikuttavia muuttujia oli
paljon, eikä sopivien parametrien valintaan ollut selviä sääntöjä. Parametrien arvoina käytettiin
valistuneita arvauksia ja niillä suoritettiin luokittelu. Lisäksi luokittelua kokeiltiin eri kokoisilla ja
muotoisilla verkoilla. Menetelmä oli hankala sillä erilaisia kombinaatioita oli lukuisia ja jokainen
luokittelu vei runsaasti aikaa.
7.5.4. Minimietäisyyden sekä suurimman uskottavuuden menetelmät
Perinteisiä luokittelijoita varten AISA-kuvalle suoritettiin piirteiden irroitus sekä piirteiden valinta.
Piirteiden irroituksessa käytettiin pääkomponenttimuunnosta, jossa piirteiden määrää pudotettiin
neljään ensimmäiseen pääkomponenttiin. Piirteiden valinnassa käytettiin Geomatican CHNSEL-
algoritmia, joka perustuu Branch and bound –algoritmiin. Alkuperäisestä 17 kanavan joukosta
69
valittiin neljä vähiten korreloivaa kanavaa, jotka sijaitsivat vihreän ja punaisen valon sekä lähi-
infrapunasäteilyn aallonpituusalueella. Lammin alueelta valittu pienempi kuva luokiteltiin käyttäen
minimietäisyyden sekä Bayesin algoritmeja. Luokittelussa Bayesin pääsäännön avulla
todennäköisyysjakaumien estimoinnissa käytettiin suurimman uskottavuuden menetelmää. Tästä
työssä suurimman uskottavuuden luokittelijalla tarkoitetaan Bayesin luokittelijaa, jossa
todennäköisyysjakaumat on estimoitu suurimman uskottavuuden menetelmällä. Molemmissa
luokitteluissa käytettiin luokkien normaalijakaumaoletusta sekä pääkomponenttimuunnoksen
neljää ensimmäistä pääkomponenttikanavaa. Lisäksi sama alue luokiteltiin suurimman
uskottavuuden menetelmällä käyttäen CHNSEL-algoritmin valitsemaa kanavien joukkoa.
Luokittelu minimietäisyyden sekä suurimman uskottavuuden algoritmeilla sujui hyvin, kun
luokiteltavan datan dimensiota oli pienennetty riittävästi piirteiden irroitus- ja valinta-
algoritmeilla.
Kuva 7.17: Koivu-luokan histogrammit. Kolme ylintä histogrammia on laskettu AISA-kuvan
kanaville 3, 8 ja 14 ja kolme alinta histogrammia on laskettu kolmelle ensimmäiselle
pääkomponenttikanavalle.
70
Kuva 7.18: Rakennus-luokan histogrammit. Kolme ylintä histogrammia on laskettu AISA-kuvan
kanaville 3, 8 ja 14 ja kolme alinta histogrammia on laskettu kolmelle ensimmäiselle
pääkomponenttikanavalle.
Kuvat 7.17 ja 7.18 esittävät AISA-kuvan kanavien histogrammeja. Kolme ensimmäistä
histogrammia esittävät vihreän, punaisen sekä lähi-infrapunasäteilyn aallonpituudella olevien
kanavien harmaasävyjakaumaa. Alemmalla rivillä olevat historammit esittävät AISA-kuvalta
laskettujen kolmen ensimmäisen pääkomponenttikanavan harmaasävyjakaumaa. Kuvista voidaan
helposti havaita, että koivu-luokkaa on helppo estimoida normaalijakaumalla. Rakennusten
harmaasävyarvot sen sijaan eivät sopineet normaalijakaumaan. Muiden luokkien harmaasävyarvot
olivat kohtalaisen normaalijakautuneita lukuun ottamatta tie-luokkaa.
Pääkomponenttimuunnoksella ei todettu olevan vaikutusta, jolla ongelmalliset rakennus- sekä
tieluokkien jakaumat olisivat lähestyneet normaalijakaumaa.
7.6. Luokittelutulokset ja -kuvat
Tulosten vertailun helpottamiseksi luokittelutulokset ja -kuvat on kerätty samaan kappaleeseen. Eri
luokittelualgoritmeilla on luokiteltu sama hyperspektrikuvan alue. Algoritmien vaatimat
opetusalueet on kerätty samalta kuvalta sekä samanlaisista valaistusolosuhteista kuin luokiteltava
alue. Spectral Angle Mapperia sekä minimietäisyyden luokittelijaa on myös vertailtu tilanteissa,
joissa opetusalueiden sekä luokiteltavan kuvan valaistusominaisuudet ovat muuttuneet.
Luokitteluun valittiin seuraavat luokat: havumetsä, lehtimetsä, kynnöspelto, sokerijuurikaspelto,
viljapelto, rakennus sekä tie. Kuvissa 7.20 – 7.22 luokiteltiin eri luokittelualgoritmeilla Lammin
hyperspektrikuvalta valittu pienempi alue, jota väärävärikuva 7.19 esittää. Luokiteltava alue
71
sisältää rakennuksia, muutamia peltoja, teitä sekä havu- ja lehtimetsää. Seuraavissa kuvissa 7.25 ja
7.26 on luokiteltu alue, joka sisältää useita kuvauslinjoja ja jonka valaistusominaisuudet
vaihtelevat kuvauslinjojen väleillä. Lopuksi, kuvissa 7.27a ja 7.27b on luokittelussa käytetty
sellaisia opetusalueita, jotka on kerätty Paraisten alueen kaukokartoitusdatasta, kun luokiteltava
alue sijaitsee Lammin alueella.
Kuva 7.19: Väärävärikuva luokiteltavana olevasta hyperspektrikuvan alueesta sekä luokittelun
värikoodit.
Taulukko 7.2: Opetusalueiden sisältämien pikseleiden lukumäärä
Alue Koko pikseleinä Havu 8740 Kynnös 16113 Lehti 3090 Pelto 6691 Talot 1091 Tie 1045
Luokittelun jälkeen laskettiin virhematriisit, joiden avulla voitiin tarkastella luokittelun tarkkuutta.
Virhematriisin riveillä esitetään vertailukohteena olevat oikeat luokat ja sarakkeilla vastaavat
estimoinnin tuottamat luokat. Matriisin diagonaalilla sijaitsevat oikein luokiteltujen pikselien
osuudet prosentteina. Virhematriiseista laskettiin myös seuraavat tarkkuusmitat, jotka helpottivat
eri luokittelijoiden vertailua: keskimääräinen tarkkuus, kokonaistarkkuus ja kappa-tekijä.
Keskimääräisellä tarkkuudella tarkoitetaan eri luokkien luokittelutarkkuuksien keskiarvoa.
Kokonaistarkkuus on muuten samanlainen, mutta se ottaa huomioon testialueiden suuruudet ja
72
painottaa niitä laskuissa. Kappa-tekijällä tarkoitetaan luokittelun satunnaisuutta. Kapan arvot
vaihtelevat nollan ja yhden välillä. Suuret kapan arvot tarkoittavat, että luokittelu on parempi kuin
satunnainen luokittelu. Esimerkiksi kappa-arvo: 0.82 tarkoittaa, että luokittelutulos on 82
prosenttia parempi, kuin mitä satunnaisella luokittelulla olisi saatu.
7.6.1. Spectral Angle Mapper sekä Spectral Correlation Mapper
(a) (b)
Kuvat 7.20a ja 20b: Kuva 7.20a on Spectral Angle Mapperin ja kuva 7.20b on Spectral Correlation
Mapperin luokittelukuva.
Taulukot 7.2a ja 7.2b: Spectral Angle Mapper –luokittelun virhematriisi sekä tarkkuusmittoja.
Havu Kynnös Lehti Pelto Talot Tie Keskimääräinen tarkkuus
84.06%
Havu 72.6 0.0 8.5 6.1 0.0 0.0 Kokonaistarkkuus 90.43% Kynnös 0.0 98.9 0.0 0.6 0.0 0.2 Kappa 0.8671 Lehti 4.6 0.0 95.0 0.0 0.0 0.0 Pelto 1.9 0.2 0.0 97.8 0.0 0.0 Talot 0.0 5.2 0.0 1.1 65.4 18.3 Tie 0.7 4.9 0.0 3.5 3.3 74.7
73
Taulukot 7.3a ja 7.3b: Spectral Correlation Mapper –luokittelun virhematriisi sekä tarkkuusmittoja.
Havu Kynnös Lehti Pelto Talot Tie Keskimääräinen tarkkuus
80.92%
Havu 71.8 0.0 24.1 3.6 0.0 0.0 Kokonaistarkkuus 88.93% Kynnös 0.0 96.6 0.0 0.7 0.0 0.1 Kappa 0.8471 Lehti 3.5 0.0 96.4 0.0 0.0 0.0 Pelto 1.7 0.1 0.0 98.1 0.0 0.0 Talot 0.2 1.4 0.0 1.5 61.7 14.5 Tie 4.9 2 0.0 2.1 9.8 60.9
Molemmat hyperspektrikuville kehitetyt algoritmit luokittelivat alueen hyvin. Varsinkin lehtimetsä
sekä kynnös- ja viljapelto luokiteltiin hyvin tarkasti. Rakennukset olivat vaikeita luokittelun
kohteita sillä heijastus rakennusten kattomateriaaleista oli hyvin heterogeenistä ja sekoittui joskus
teiden heijastukseen. Silti useimmat rakennukset onnistuttiin luokittelemaan oikein. Keräämällä
lisää rakennusten referenssispektrejä olisi luokittelutulos todennäköisesti parantunut niiltä osin.
Toisaalta referenssispektrien lisääminen ei tuonut apua siihen, että joidenkin rakennusten sekä
teiden heijastusspektrit olivat hyvin samankaltaisia ja näin ollen nämä luokat sekoittuivat.
Spectral Angle Mapper luokitteli virheellisesti osan havumetsästä hylkäysluokkaan, lehtimetsään
tai peltoon. Spectral Correlation Mapper sen sijaan luokitteli huomattavan suuren havumetsän
osuuden lehtimetsäksi. Molemmilla algoritmeilla havumetsä luokiteltiin oikein lähes samalla
tarkkuudella. Spectral Angle Mapper luokitteli tiet paremmin verrattuna Spectral Correlation
Mapper –algoritmiin, joka sekoitti tiet useimmin rakennuksiin. Myös rakennukset onnistuttiin
luokittelemaan hiukan tarkemmin Spectral Angle Mapperilla, jolla myös luokittelun kokonais-
sekä keskimääräinen tarkkuus oli parempi.
74
7.6.2. Perceptron-neuroverkko sekä minimietäisyyden menetelmä
(a) (b)
Kuvat 7.21a ja 7.21b: Kuva 7.21a on Perceptron-neuroverkko algoritmin ja kuva 7.21b on
minimietäisyyden menetelmän luokittelukuva.
Taulukot 7.4a ja 7.4b: Perceptron-neuroverkkoluokittelun virhematriisi sekä tarkkuusmittoja.
Kynnös Pelto Talot Tie Havu Lehti Keskimääräinen tarkkuus
93.39%
Kynnös 99.0 0.5 0.0 0.6 0.0 0.0 Kokonaistarkkuus 96.08% Pelto 0.1 99.4 0.0 0.1 0.4 0.0 Kappa 0.9451 Talot 0.2 1.1 81.6 17.0 0.0 0.0 Tie 1.6 0.6 4.5 93.3 0.0 0.0 Havu 0.0 0.3 0.0 0.0 89.9 9.8 Lehti 0.0 0.0 0.0 0.0 2.8 97.2
Taulukot 7.5a ja 7.5b: Minimietäisyyden menetelmän virhematriisi sekä tarkkuusmittoja.
Kynnös Pelto Tie Talot Havu Lehti Keskimääräinen tarkkuus
73.12%
Kynnös 98.8 0.0 0.0 1.2 0.0 0.0 Kokonaistarkkuus 86.16% Pelto 0.3 97.2 0.0 0.0 2.3 0.2 Kappa 0.8167 Tie 9.6 2.7 25.7 54.2 7.8 0.0 Talot 18.3 0.6 13.6 41.4 26.1 0.0 Havu 0.0 9.4 0.0 0.0 84.2 6.5 Lehti 0.0 1.3 0.0 0.0 7.3 91.5
75
Perceptron-neuroverkolla saatiin muille luokittelijoille hankalat luokat: havumetsä sekä
rakennukset luokiteltua selvästi paremmin. Myös tien ja rakennusten erottaminen toisistaan
onnistui kohtalaisen hyvin. Rakennusten luokittelutulos oli huonoin, mutta niistäkin yli 80
prosenttia luokiteltiin oikein. Havu- sekä tieluokka luokiteltiin seuraavaksi huonoiten, noin 90
prosentin tarkkuudella. Loput luokat luokiteltiin oikein melkein 100 prosenttisesti. Neuroverkolla
saatiin parhaimmat luokittelutulokset. Luokittelun tarkkuusluvut olivat vertailun parhaita.
Kuten Spectral Angle Mapper sekä Spectral Correlation Mapper, minimietäisyyden algoritmi
luokitteli lehtimetsän sekä kynnös- ja viljapellon erittäin hyvin. Havumetsäkin luokiteltiin
kohtalaisen tarkasti, mutta rakennusten sekä teiden luokittelu epäonnistui pahasti.
Minimietäisyyden luokittelun kokonais- sekä keskimääräinen tarkkuus oli tässä työssä tutkituista
luokittelijoista huonoimpia.
7.6.3. Suurimman uskottavuuden menetelmä
(a) (b)
Kuvat 7.22a ja 7.22b: Luokittelukuvat suurimman uskottavuuden luokittelijalle. Ennen luokittelua
piirteiden määrää on vähennetty valitsemalla parhaat piirteet kuva 7.22a tai käyttäen
pääkomponenttimuunnosta kuva 7.22b.
76
Taulukot 7.6a ja 7.6b: Suurimman uskottavuuden luokittelun virhematriisi sekä tarkkuusmittoja, kun
piirteiden määrää on vähennetty pääkomponenttimuunnoksella.
Kynnös Pelto Tie Talot Havu Lehti Keskimääräinen tarkkuus
86.14%
Kynnös 95.3 0 0.1 4.6 0 0 Kokonaistarkkuus 91.09% Pelto 0 93.1 0 0.3 0.2 0 Kappa 0.88342Tie 0 0 93.1 3.2 0 0 Talot 0 0 36.6 51.9 4.4 0 Havu 0 0 0 0.2 91.7 5.8 Lehti 0 0 0 0 3.7 91.8
Suurimman uskottavuuden luokittelu onnistui hyvin. Lukuun ottamatta rakennuksia kaikki muut
luokat luokiteltiin yli 90% tarkkuudella. Piirteiden määrän vähentäminen valitsemalla luokitteluun
neljä vähiten korreloivaa kanavaa sekä piirteiden irroitus pääkomponenttimuunnoksella tuottivat
lähes samanlaiset tulokset. Siksi neljän parhaan kanavan luokittelun virhematriisi on jätetty pois.
Pääkomponenttimuunnosluokittelun tulokset olivat hieman parempia verrattuna neljän parhaan
kanavan luokitteluun, lukuun ottamatta rakennusluokkaa, joka luokiteltiin paremmin neljän
parhaan kanavan luokittelussa.
SAM SCM NEURO MINDIS MLC
Keskimääräinen tarkkuus
Kokonaistarkkuus60
70
80
90
100
KeskimääräinentarkkuusKokonaistarkkuus
Kuva 7.23: Spectral Angle Mapper (SAM), Spectral Correlation Mapper (SCM), Perceptron-
neuroverkko (NEURO), minimietäisyyden (MINDIS) sekä suurimman uskottavuuden (MLC)
luokittelijoiden kokonais- sekä keskimääräiset tarkkuusluvut.
Kun luokiteltava kuva sekä opetusalueet on kerätty samalta valaistusominaisuuksiltaan
yhtenäiseltä alueelta, niin Perceptron-neuroverkkoluokittelija antoi parhaimman tuloksen, kun
tarkastellaan luokittelun tarkkuuslukuja. Suurimman uskottavuuden sekä Spectral Angle Mapper -
77
luokittelun tarkkuusluvut olivat myös hyviä. Minimietäisyysluokittelijan tulokset olivat muita
algoritmeja huonompia.
7.6.4. Valoisuuserojen vaikutus luokitteluun
Lammin alueella kuvatusta hyperspektrikuvasta valittiin leveä suorakulmainen alue, joka sisälsi
useita kuvauslinjoja. Kuvassa 7.24 on kyseisen alueen väärävärikuva ja siitä voidaan havaita
kolmen eri kuvauslinjan väliset valoisuuserot. Oikeanpuoleinen linja kuvattiin ensimmäiseksi
hyvissä olosuhteissa. Seuraavan kuvalinjan kohdalla sää oli pilvistynyt, siksi kyseinen linja näkyy
edellistä tummempana. Edelleen seuraavalle kuvauslinjalle siirryttäessä sää huononi lisää ja
valoisuus väheni edelleen. Väärävärikuvan vasemmassa reunassa näkyy muutamia rakennuksia
sekä tie. Laajat vaaleanvihreät alueet ovat sokerijuurikaspeltoja ja kuvan oikeassa reunassa kasvaa
metsää sekä muuta peltoa.
Kuva 7.24: Väärävärikuva hyperspektrikuvan luokiteltavasta alueesta, jossa näkyy kuvauslinjojen
väliset valoisuuserot.
Usean kuvauslinjan sisältämä alue luokiteltiin kahdella eri algoritmilla: Spectral Angle Mapperilla
sekä suurimman uskottavuuden luokittelijalla. Jälkimmäisessä luokittelussa käytettiin lisäksi
pääkomponenttimuunnosta piirteiden irroituksessa. Tarkoitus oli vertailla näiden kahden eri
menetelmän tuloksia luokittelussa, jossa alueen valoisuusolosuhteet muuttuvat dramaattisesti.
Kuvassa 7.25 on Spectral Angle Mapper –luokittelun tuloskuva ja kuvassa 7.26 on suurimman
uskottavuuden luokittelijan tuloskuva.
78
Kuva 7.25: Luokittelukuva Spectral Angle Mapper –luokittelulle.
Kuva 7.26: Luokittelukuva suurimman uskottavuuden luokittelijalle.
Verrattaessa luokittelutuloksen kuvaa 7.26 sekä saman alueen väärävärikuvaan 7.24 voidaan
selvästi havaita, että suurimman uskottavuuden luokittelija ei pysty luokittelemaan alueita, joiden
valoisuusominaisuudet vaihtelevat. Ainoastaan ensimmäinen kuvauslinja eli kuvan oikea reuna on
pystytty luokittelemaan tyydyttävästi. Siirryttäessä vasemmalle seuraavalle kuvauslinjalle ei
selkeää sokerijuurikaspellon luokkaa ole pystytty luokittelemaan ollenkaan. Sitä vastoin Spectral
Angle Mapperin luokittelukuva 7.25 osoittaa, kuinka paljon paremmin SAM toimii olosuhteissa,
joissa kuvan valoisuuserot muuttuvat.
79
7.6.5. Luokittelu Paraisten alueen referenssispektreillä
Lammin hyperspektrikuvalta valittu alue luokiteltiin myös sellaisilla referenssispektreillä sekä
opetusalueilla, jotka oli valittu Paraisten hyperspektrikuvalta. Tarkoituksena oli tutkia, miten eri
mittausprojektista kerätty referenssimateriaali sopii hyperspektrikuvan luokitteluun. Luokittelu
suoritettiin Spectral Angle Mapperilla sekä suurimman uskottavuuden luokittelijalla.
Luokittelualgoritmeja varten Paraisten alueelta kerättiin referenssispektrejä sekä opetusalueita.
Luokittelijoiden vertailun vuoksi referenssispektrit sekä opetusalueet kerättiin samoilta alueilta.
Ennen suurimman uskottavuuden luokittelua suoritettiin pääkomponenttimuunnos, jolla piirteiden
määrää vähennettiin neljään pääkomponenttikanavaan. Muunnos tehtiin sekä referenssitietoa
sisältävälle Paraisten hyperspektrikuvalle että luokiteltavalle Lammin hyperspektrikuvalle.
(a) (b)
Kuvat 7.27a ja 7.27b: Kuva 7.27a on Spectral Angle Mapperin luokittelukuva ja Kuva 7.27b on
suurimman uskottavuuden algoritmin luokittelukuva. Referenssidatana on käytetty Paraisten alueelta
kerättyjä referenssispektrejä sekä opetusalueita.
Vaikka Lammin sekä Paraisten hyperspektrikuvat ovat otettu samalla instrumentilla sekä niiden
kanavat ovat yhtäläiset, niin luokkien heijastusominaisuudet muuttuvat siirryttäessä kuvalta
toiselle. Syitä tähän löytyy esimerkiksi kuvausprojektien erilaisista ilmakehistä,
kuvausajankohdista sekä luokkamateriaalien paikallisista ominaisuuksista. Eri kuvausprojektista
kerätyllä referenssitiedolla ei saatu kunnollisia tuloksia. Spectral Angle Mapper –luokittelussa
80
lehti- sekä havupuut luokittuivat siedettävästi, mikä näkyy kuvassa 7.27a. Sen sijaan rakennukset,
tiet ja pellot sekoittuivat tai jäivät kokonaan luokittelematta. Luokittelukuva kuitenkin näyttää
huomattavasti paremmalta verrattuna suurimman uskottavuuden luokittelukuvaan 7.27b, missä yli
70 % kuvasta on jätetty kokonaan luokittelematta ja loputkin on väärin luokiteltu.
81
8. Yhteenveto
Tämän diplomityön tarkoituksena oli tutkia kasvillisuuden sekä maaperän määrittämistä
hyperspektrisen kaukokartoitusdatan avulla. Työssä luokiteltiin lentokoneeseen asennetun AISA-
instrumentin mittaamaa hyperspektridataa erilaisilla algoritmeilla. Perinteisten luokittelijoiden
sekä hyperspektridatalle suunniteltujen algoritmien tuloksia vertailtiin keskenään. Ohjatussa
luokittelussa referenssitiedon vaikutus luokittelun tulokseen on suuri ja sen kerääminen on usein
luokittelun työläin vaihe. Siksi tutkittiin erilaisten opetusalueiden sekä referenssitietoa
muodostavien metodien vaikutusta lopputuloksiin. Lisäksi haluttiin selvittää erilaisten
kaukokartoituskuville tehtävien korjausten sekä piirteiden valinnan ja irroituksen mahdollisuuksia
hyperspektrikuvauksen näkökulmasta.
Luokittelualgoritmit erosivat toisistaan paljon, joten samaa referenssitietoa ei voitu käyttää
kaikissa luokittelijoissa. Esimerkiksi perinteiset luokittelualgoritmit vaativat opetusalueiden
käyttämistä, kun taas Spectral Angle Mapper, Spectral Unmixing sekä Spectral Correlation
Mapper vaativat referenssispektrien käyttöä. Siksi oli tärkeää määrittää erityyppisten
referenssitietojen vaikutukset lopputuloksiin sekä löytää jokaiselle luokittelualgoritmille
mahdollisimman hyvän opetusjoukon. Referenssispektrejä muodostettiin opetusalueiden
heijastusarvoista erilaisilla keskiarvomitoilla. Referenssispektreiksi valittiin myös yksittäisten
pikselien heijastusspektrejä. Näin saatiinkin hyviä tuloksia jos pikseli oli tarkoin määritelty ja
edusti homogeenistä aluetta, kuten yksittäinen puun latvus.
Luokittelualgoritmeista Perceptron-neuroverkkoluokittelijalla saatiin parhaimmat tulokset, mutta
verkon opettaminen vei paljon aikaa. Myös suurimman uskottavuuden menetelmällä saatiin hyvät
tulokset. Algoritmi oli kuitenkin hidas eikä se toiminut alueilla, joissa oli paljon valoisuuseroja.
Spectral Angle Mapper antoi lähes yhtä hyvät tulokset. Lisäksi se oli nopeampi ja toimi selvästi
paremmin, jos kuvalla oli valoisuuseroja. Spectral Angle Mapperin etuna voidaan pitää myös sitä,
että datalle ei tarvinnut suorittaa pääkomponenttimuunnosta. Referenssitiedon valitseminen
kokonaan eri kuvalta kuin luokiteltava kuva huononsi luokittelutuloksia huomattavasti. Spectral
Angle Mapper -algoritmilla saatiin tässä tapauksessa kuitenkin huomattavasti parempia tuloksia
kuin suurimman uskottavuuden menetelmällä. Työssä todettiin Spectral Unmixing -algoritmin
toimivan hyvin luokiteltaessa kynnöspeltoja, lehtipuita ja rakennuksia. Sitä vastoin tulokset olivat
82
huonoja havupuun, peltojen ja tien kanssa. Spectral Unmixing -algoritmille oli vaikeaa löytää
kunnollisia referenssispektrejä, sillä malli vaati jokaisen kuvalla esiintyvän oleellisen materiaalien
heijastusspektrin määrittämistä.
Hyperspektri-instrumentilla saadaan entistä tarkempaa tietoa kohteen spektrisistä ominaisuuksista.
Analysoimalla sekä vertailemalla eri kohteiden heijastusspektrejä voidaan tehdä erilaisia oletuksia
kohteen laadusta sekä tutkia materiaalien erottuvuutta. Tässä työssä laskettiin myös eri luokkien
välisiä erottuvuusmittoja ja tutkittiin kuinka hyvin eri luokat ovat erotettavissa muista luokista.
Erottuvuusmittana käytettiin heijastusspektrien välistä spektrikulmaa, jonka on todettu toimivan
hyvin kuvan valoisuusolosuhteiden muutoksissa. Vertailussa olevat luokat olivat paju, koivu,
kuusi, mänty, heinä ja sokerijuurikas. Havaittiin, että lehtipuut sekoittuivat keskenään, mutta
erottuivat hyvin havupuista ja heinästä. Vastaavasti mänty sekoittui kuusen ja heinän kanssa
joissain tapauksissa, mutta niiden erottaminen lehtipuista oli helppoa. Sokerijuurikas erottui hyvin
kaikista luokista, lukuun ottamatta pajua.
Kuusen heijastusspektri otettiin tarkemman analysoinnin kohteeksi, sillä haluttiin selvittää,
vaikuttaako maaperän laatu kuusen heijastusspektriin ja voitaisiinko kuusen heijastusspektrin
perusteella määrittää maalaji. Lisäksi tutkittiin kuvauksen aikana syntyneiden valoisuuserojen
vaikutusta kuusialueiden välisiin spektrikulmiin. Todettiin, että pienet valoisuuserot eivät juuri
vaikuta alueiden välisiin spektrikulmiin, mutta tulokset huononevat nopeasti, valaistuksen ollessa
riittävän huono. Tutkittavat kuusialueet olivat tiheitä, joten maaperästä ei saatu suoraa havaintoa.
Maaperän ei todettu vaikuttavan tilastollisesti merkittävästi kuusen heijastusspektriin.
Kuusialueiden heijastuksen sisäinen hajonta oli suurta ja lisäksi heijastukseen vaikutti myös monet
muut tekijät, joista ei välttämättä ollut havaintoa. Maaperän määrittäminen kasvin
heijastusspektrin avulla olisi merkittävä saavutus, mutta se vaatii huomattavasti laajemman
opetusaluejoukon käyttämistä sekä enemmän maastohavaintoja kasvin rakenteesta.
83
Lähdeluettelo
Arkimaa, H., Kuosmanen, E., Kuosmanen, V. & Laitinen, J. 2002. Environmental studies using
airborne hyperspectral AISA and HYMAP data in the mining area of Kemi. Geologian
tutkimuskeskus, RS/2002/4.
ASTER Spectral Library 2004. Saatavissa: http://speclib.jpl.nasa.gov/ (viitattu 1.1.2004).
Boschke, F. 1975. Spectroscopy. Berliini, Springer. 294 s. ISBN 3-540-09462-8
Campbell, J. 1996. Introduction to remote sensing. 2. painos. New York, The Guilford Press. 622
s. ISBN 1-57230-041-8
Carvalho, O. & Meneses, P. 2000. Spectral Correlation Mapper (SCM): An Improvement on the
Spectral Angle Mapper (SAM). NASA, JPL, AVIRIS Workshop 2000.
Cetin, H. & Levandowski, D. 1991. Interactive classification and mapping of multi-
dimensional remotely sensed data using n-dimensional probability density functions
(nPDF). Photogrammetric Engineering and Remote Sensing, Vol. 57, s. 1579-1587.
Cracknell, A. & Hayes, L. 1991. Introduction to remote sensing. London, Taylor & Francis. 293 s.
ISBN 0-85066-335-0
Crippen, R. 1987. The Regression Intersection Method of Adjusting Image Data for Band
Ratioing. International Journal of Remote Sensing, Vol. 8, s. 137-155.
Dutta, S., Sharma, S. A., Khera, A. P., Ajai, Yadav, M., Hooda, R. S., Mothikumar, K. E. &
Manchanda, M. L. 1994. Accuracy assessment in cotton acreage estimation using Indian remote
sensing satellite data. ISPRS Journal of Photogrammetry and Remote Sensing, Vol. 49, s. 21-26.
84
ENVI Tutorial 2003. Saatavissa: http://www.ice.mtu.edu/online_docs/envi31/tut10.htm (viitattu:
1.1.2003).
EUMETSAT 2004. Saatavissa: http://www.eumetsat.de/ (viitattu 1.1.2004).
Huete, A. 1989. Soil ifluences in remotely sensed vegetation-canopy spectra. Teoksessa: Asrar, G.
(toim.). Theory and Application of Optical Remote Sensing Chassem Asrar. New York, Wiley.
734 s. ISBN 0-471-62895-6
Heikkilä, J. & Törmä, M. 1996. Hahmontunnistus – Tilastollinen lähestymistapa. Espoo,
Teknillinen korkeakoulu. 286 s. ISBN 951-22-2974-9
IMAGRS-L, 1996. Mailing List WWW Gateway (online). Boardman, J., Re: Spectral angle.
Saatavissa: http://adis.cesnet.cz/cgi-bin/lwgate/IMAGRS-L/ (viitattu 1.11.2003).
Kallio, K., Kutser, T., Hannonen, T., Koponen, S., Pulliainen, J., Vepsäläinen, J., Pyhälahti, T.
2001. Retrieval of water quality from airborne imaging spectrometry of various lake types in
different seasons. The Science of the Total Environment, Vol. 268, no. 1-3, s. 59-77.
Kanellopoulos, I., Varfis, A., Wilkinson, G. & Mégier, J. 1991. Neural network classification of
multi-date satellite imagery. Teoksessa: Putkonen, J. (toim.). IGARSS '91: 1991 International
Geoscience and Remote Sensing Symposium. Remote sensing: global monitoring for Earth
management. Espoo, Finland. June 3-6, 1991. Vol. IV, s. 2215-2218. ISBN: 0-87942-676-4
Kokaly, R. F., Despain, D. G., Clark, R. N. & Livo, K. E. 2002. Mapping vegetation in
Yellowstone National Park using spectral feature analysis of AVIRIS data. Remote Sensing of
Environment, Vol. 84, s. 437-456.
85
Kruse, F., Lefkoff, A., Boardman, J., Heidebrecht, K., Shapiro, A., Barloon, P. & Goetz, A. 1993.
The spectral image processing system (SIPS) - interactive visualization and analysis of imaging
spectrometer data. Remote Sensing of Environment, Vol. 44, s. 145-163.
Kruse, F., Richardson, L. & Ambrosia, V. 1997. Techniques developed for geologic analysis of
hyperspectral data applied to near-shore hyperspectral ocean data. Fourth International Conference
on Remote Sensing for Marine and Coastal Environments. Orlando, Florida. March 17-19, 1997.
S. 233-246.
Lillesand, T., Kiefer R. 2000. Remote sensing and image interpretation. 4. painos. New York, John
Wiley & Sons. 724 s. ISBN 0-471-25515-7
Meer, F., Jong, S. 2001. Imaging spectrometry, basic principles and prospective applications.
Dordrecht, Kluwer Academic. 403 s. ISBN 1-4020-0194-0
Mäkisara, K., Meinander, M., Rantasuo, M., Okkonen, J., Aikio, M., Sipola, K., Pylkkö, P.,
Braam, B. 1993. Airborne imaging spectrometer for applications (AISA). Teoksessa: IGARSS '93:
1993 International Geoscience and Remote Sensing Symposium. Better understanding of earth
environment. Tokyo, Japan. August 18-21, 1993. S. 479-481. ISBN: 0-7803-1240-6
Mäkisara, K., Lohi, A. & Kärnä, J.P. 1994. A system for geometric and radiometric correction of
airborne imaging spectrometer data. Teoksessa: Stein, T. (toim.). IGARSS '94: 1994 International
Geoscience and Remote Sensing Symposium. Surface and atmospheric remote sensing:
technologies, data analysis and interpretation. California, USA. August 8-12, 1994. S. 851-853.
ISBN: 0-7803-1497-2
Mäkisara, K. & Tomppo E. 1996. Airborne imaging spectrometer in National Forest Inventory.
Teoksessa: Stein, T. & Brunk, J. (toim.). IGARSS '96: 1996 International Geoscience and Remote
Sensing Symposium. Remote sensing for a sustainable future. Vol. II. New York, USA. May 27-
31, 1996. S. 1010-1013. ISBN: 0-7803-3068-4
86
Narendra, P. & Fukunaga, K. 1977. A branch and bound algorithm for feature subset selection.
IEEE Transactions on Computers, Vol. 26, s. 917-922.
Othanian, H. 1989. Physics. 2. painos. New York, Norton. 1148 s. ISBN 0-393-95750-0
Paltridge, G. & Platt, C. 1976. Radiative Processes in Meteorology and Climatology. New York,
Elsevier Scientific Publishing company. 318s.
Peltoniemi, J. 1997. Measuring the bidirectional reflectance functions of Sjökulla test field targets.
European Goniometer users' workshop. Ispra, February 26-28, 1997.
Radeloff, V. C., Mladenoff, D. J. & Boyce, M. S. 1999. Detecting jack pine budworm defoliation
using spectral mixture analysis: separating effects from determinants. Remote Sensing of
Environments, Vol. 69, s. 156-169.
Richards J. A. & Xiuping J. 1999. Remote sensing digital image analysis: an introduction. 3rd,
revised and enlarged edition. Berlin, Springer. 363 s. ISBN 3-540-64860-7
Roberts, D., Gardner, M., Church, R., Ustin, S. & Green, R. 1997. Optimum strategies for
mapping vegetation using multiple endmember spectral mixture models. Teoksessa: Descour, M.
& Shen, S. (toim.). SPIE Conf. Vol. 3118, Imaging Spectrometry III. San Diago, CA, July 27-Aug
1, 1997. S. 108-119. ISBN 0-8194-2540-0
Ruohomäki, T., Törmä, M., Rainio, H., Lumme, J. & Mäkilä, M. 2002. Soil types, vegetation and
AISA-imagery in Lammi test area. Geologian tutkimuskeskus, GTK/RS/2002/6
Schott, J. & Henderson-Sellers, A. 1984. Radiation, the Atmosphere and Satellite Sensors.
Teoksessa: Henderson-Sellers, A. (toim.). Satellite Sensing of a Cloudy Atmosphere. Observing
the Third Planet. London, Taylor and Francis.
87
Short, N. & Robinson, J. 2003. Remote sensing tutorial. Saatavissa:
http://rst.gsfc.nasa.gov/AppC/C1.html (viitattu: 1.11.2003).
Specim 2003. Saatavissa: www.specim.fi (viitattu: 1.11.2003).
Stahler, A. H. 1980. The use of prior probabilities in maximum likelihood classification of
remotely sensed data. Remote Sensing of Environment, Vol. 10, s. 135-163.
Tsai, F. & Philpot, W. 1998. Derivative analysis of hyperspectral data. Remote Sensing of
Environment, Vol. 66, s. 41-51.
Törmä, M. 1997. Neuraaliverkot ja niiden käyttö kuvien analysoinnissa. Maankäyttö, 1/97, s 5-9.
Törmä, M., Rainio, H. & Ruohomäki, T. 2001. Kasvillisuuden ja eräiden maalajien luokittelukoe
käyttäen Aisa-spektrometriaineistoa: Lammin testialue. Geologian tutkimuskeskus,
GTK/RS/2001/3.