HomeSavon rykmentti → Hakuohje

Nimien hakeminen

Nimen syöttö

Yleensä hakuun syötetään pelkästään sukunimi (sotilasnimi), tai vain nimen alku. Sukunimi on pakollinen tieto.

Jos etunimi annetaan, sille tehdään aina kirjaimellinen haku. Haku pelkällä etunimellä ei ole käytössä.

"Vähemmän on enemmän." Syötä vain vähän kirjaimia nimen alusta. Hakua voi aina yrittää uudelleen pidemmällä nimelle jos tuli aivan liikaa hakutuloksia.

Hakutavat

Hakulomake tarjoaa kaksi vaihtoehtoista hakutapaa, näistä lisää alempana

Kummallakin hakutavalla on erilaiset hyvät ja huonot puolet.

Aineistossa olevia nimiä ei ole normalisoitu. Toisin sanoen ne on syötetty siinä muodossa kuin ne esiintyvät alkuperäisissä lähteissä. Sama nimi voi olla kirjoitettuna hyvinkin monella eri tavalla eri lähteissä tai eri esiintymiskerroilla.

Kirjaimellinen haku

Haku hyväksyy sellaiset nimet jotka alkavat täsmälleen samoilla kirjaimilla kuin mitä on syötetty hakulomakkeelle.
Esimerkiksi haku "BJÖ" voisi löytää nimet Björn, Björk, Björklund; mutta jättää huomiotta esimerkiksi nimet Biörnström, Biörn, Biörck.

Vihje: jos haku ei anna tuloksia, lyhennä haettavaa merkkijonoa. Tosin tällöin saattaa tulla hankalan suuri määrä osumia.

Sumea haku

Sumea haku etsii nimiä jotka "kuulostavat" samalta. Siten se löytää usein sellaisia nimiä joita kirjaimellinen haku ei tunnista.
Huonona puolena on se että haku tuottaa myös "vääriä positiivia", ts. nimiä jotka eivät varmastikaan ole samoja, mutta jotka tarttuvat käytettyihin "samalta kuulostava" sääntöihin. Esimerkiksi "Hatain" ja "Hattuin" olisivat sumean haun kannalta samalta kuulostavia nimiä.

Vihje: Sumeassa haussa tarkimmin tuloksen saa syöttämällä nimen kokonaan nykyaikaisessa muodossa. Lyhyillä hakujonoilla tulee suurempia määriä vääriä positiivisia.

Sumean haku käyttää muunneltua Soundex algoritmia. Alkuperäisiä sääntöjä on sovellettu vastaamaan paremmin ruotsin ja suomen kieliä.

Soundex algoritmista löytyy tietoa englanniksi esimerkiksi wikipediasta.
Ruotsin kielen sumeaa hakua on selvitetty tässä (ruotsinkielinen PDF).

Miksi nimiä ei sitten ole normalisoitu?

Nimiviitteitä on paljon: sekä Kuopion että Iisalmen komppaniassa yli 10,000 kummassakin.
Olen pitänyt ensisijaisena tavoitteena nimien saamisen edes jossakin muodossa esille (ts. alkuperäinen kirjoitusasu). Mahdollinen jälkikäsittely on toisella sijalla; mukaan lukien nimien normalisointi.


© Väinö Holopainen 2015