next up previous contents
Next: Kirjallisuutta Up: Tekoäly Previous: Tietämystekniikan sovelluksia II: Luonnollisen

Tietämystekniikan sovelluksia III: Hahmontunnistus

Hahmontunnistustutkimuksen perinteinen toiminta-ala on ollut numeerisen anturidatan, esimerkiksi ääni- tai kuvasignaalien, käsittely ja luokittelu korkeamman tason rakenteiden tunnistamiseksi. Äänidatasta pyritään jäsentämään äänteitä tai sanoja, ja kuvadatasta esineitä (esim. robotiikassa), tekstuureja (esim. satelliittidatan analyysissa) tai hahmoja (esim. käsinkirjoitetun tekstin luokittelussa).

Viime aikoina hahmontunnistuksen menetelmiä on alettu soveltaa myös symbolimuotoisen datan (esim. tietokannoissa) käsittelyyn: koneoppimistutkimuksessa (engl. ``machine learning'') kehitetään menetelmiä luokittelujen tai toimintojen automaattiseen oppimiseen esimerkeistä, ja tiedonrikastustutkimuksessa t.\ tiedon louhinnassa (engl. ``data mining'', ``knowledge discovery in databases'') pyritään löytämään suurissa data-aineistoissa (esim. kaupan tai hallinnon rekisterit) ilmeneviä säännönmukaisuuksia automaattisesti, ilman että järjestelmän käyttäjällä on selvää ennakkokäsitystä siitä millaisia säännönmukaisuuksia data voisi sisältää. Sovelluksia näille menetelmille on tarjolla esimerkiksi kaupan asiakasprofiilien määrittämisessä, tai monimutkaisten järjestelmien kuten tehtaiden tai tietoliikenneverkkojen vikakäyttäytymisen luokittelussa ja ennustamisessa.

Hahmontunnistuksen perustekniikoita ovat signaalimuunnokset, tilastolliset mallit ja testit, sekä tehokkaat algoritmit suurten tietomäärien käsittelyyn. Uusi, tai oikeastaan uudelleen kelpuutettu menetelmäperhe ovat ns. neuroverkot. Nämä ovat yksinkertaistettujen hermosolumallien (alunperin McCullochin-Pittsin neuronimallin vuodelta 1943) motivoima hahmontunnistus- ja koneoppimismenetelmien perhe.

Neuroverkkopohjainen hahmontunnistus oli huomattavan kiinnostuksen kohteena 1950-luvulla ja 1960-luvun alkupuolella, mutta ajautui kriisiin 1960-luvun puolivälissä, kun silloisen perustekniikan, ns. Rosenblattin perceptron-neuromallin rajoitukset tulivat ilmeisiksi, eikä mallin oikeaa yleistystä löydetty. Alalla tehtiin 1970-luvun ajan pienellä volyymilla laadukasta, mutta vähän huomattua työtä: mm. suomalaisen Teuvo Kohosen nyt maailmanmaineeseen nousseet perusideat ovat tuolta ajalta. Kiinnostus neuroverkkomalleja kohtaan alkoi taas lisääntyä 1980-luvun alkupuolella, kun kilpailevien symbolimanipulaatioon perustuvien tekniikkojen edistys vuorostaan hidastui, ja vuosikymmenen puolivälissä useat tutkimusryhmät toisistaan riippumatta keksivät Rosenblattin tekniikoita oikealla tavalla yleistävän ns. vastavirta-algoritmin (engl.\ ``backpropagation algorithm'') neuroverkkojen syntetisointiin annetusta esimerkkidatasta. Alan tutkimus on nykyisin hyvin laajaa, ja neuroverkkotekniikoita soveltavia hahmontunnistusjärjestelmiä lienee toteutettu jo kymmeniä tuhansia.



Pasi Koikkalainen
Tue Apr 9 18:52:40 EET DST 2002