Kieliteknologinen kokemus
Yleisen kielitieteen opinnot
- lukuisia erilaisia tietokonelingvistiikan kursseja (mm. Beta- ja Pascal-ohjelmointi, kielitieteen matemaattiset ja laskennalliset mallit jne.)
- yleisen kielitieteen gradu "Automaattinen lauseenjäsennys ja dependenssikielioppi"
Työkokemus kieliteknologiassa
- 13 kuukautta tutkijana Sitran Suomen kielen automaattisen tulkinnan tietotekniikka -projektissa 1984 - 85. Tehtävänä lauseenjäsennysohjelmiston kieliopin kehittäminen kuvausformalismilla, jäsentimen testaaminen ja jäsentimen sanakirjan kasvattaminen
- 5 kuukautta Tampereen yliopiston tietokonelingvistiikan amanuenssina 1988
- 3 vuotta Kotimaisten kielten tutkimuskeskuksen atk-suunnittelija ja vs. atk-erikoistutkija 1988 - 1991. Pääasiassa erilaisia aineistonkäsittelyjä (mm. tekstikorpuksia, Perussanakirja, Suomen murteiden sanakirja: lajitteluita, poimintoja, kirjapainokäsittelyitä tms.)
- 3 vuotta Helsingin yliopiston kielikeskuksen av-suunnittelija 1992 - 98. Yhtenä tehtävänä tietokoneavusteisen kielenopetuksen seuranta ja ohjelmien hankinta
- suunnittelija eWSOY:ssä vuodesta 1999 (mm. SGML-aineiston käsittelyä, DTD-suunnittelua)
- projektipäällikkö Lingsoftissa (sanakirjamateriaalien XML-muunnosprojektit) syyskuu 2001 -
Omia ohjelmia
- Stemma
: suomen kielen substantiivien sanavartalo-ohjelma (Icon)
- V-Stemma
: suomen kielen verbien sanavartalo-ohjelma (TAWK)
- Wosent
: joukko erilaisia sanatason frekvenssiohjelmia, lause-erotin tms. (TAWK)
- Suomen kielen tavutusohjelman prototyyppi (TAWK)
Kehitteillä
- ®egstemma: Stemman pohjalta tehtävä edistynyt hakuvartalo-ohjelma (Icon)
- Stemma+: verbien nominalisaatioita Stemmalle syöttävä ohjelma
Ohjelmointikielet
- Icon-ohjelmointia vuodesta 1988
- (T)AWK-ohjelmointia vuodesta 1996
- Omnimark-ohjelmointia vuodesta 2000
- vaihtelevasti erilaisia lajittelu, haku- yms. ohjelmia vuodesta 1988
Julkaisut
Tieteellisiä julkaisuja automaattisesta kääntämisestä, lauserakenteen dependenssianalyysista ja suomen substantiivivartaloiden tuottamisesta.
Yleistajuisia julkaisuja erilaisista automaattisen kielenkäsittelyn ilmiöistä.
Ks. julkaisuluettelo