Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4
Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4
Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4
Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4
Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4
Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4
ispell-fi: Suomen kielen oikaisulukusanasto ispellille
Versio 0.7 (30. elokuuta 2000)
Martin Vermeer ja
Pauli Virtanen
_________________________________________________________________
Tämä projekti pyrkii saamaan aikaan sanasto- ja affiksitiedostot,
jotka mahdollistavat suomenkielisten asiakirjojen oikaisuluvun
ispellillä.
Sekä sanasto- että affiksitiedostot levitetään Free Software
Foundationin GNU General Public Licensen version 2 ehtojen alaisina.
(Ks. tiedosto COPYING).
______________________________________________________________________
Nykyinen tila
Tämän ispellin oikaisulukusanaston pitäisi kattaa noin 90%-99%
yleisistä suomen kielen sanoista.
Sanasto on käyttökelpoinen, ja sen pitäisi olla myös suhteellisen
virheetön. (Ks. Viat.)
______________________________________________________________________
Sanaston kolme eri kokoa
Sanastosta on kolme erikokoista versiota: pieni, keskisuuri ja suuri.
Nämä eroavat toisistaan vain muodostettujen sanojen taivutusmuotojen
määrän osalta. (Katso tilastotietoja tiedostosta CHANGELOG.)
Pieni versio tunnistaa 756588 sanaa, ja vaatii levytilaa 2,7 megaa.
Muistia ispell kuluttaa sen kanssa noin 5 megaa, joten sen pitäisi
toimia myös pienitehoisilla koneilla.
Keskisuuri versio tunnistaa 889302 sanaa, ja vaatii levytilaa 5,3
megaa. Muistia ispell kuluttaa sen kanssa noin 10 megaa. Tätä sanastoa
suositellaan käytettäväksi.
Suuri versio tunnistaa 6678677 sanaa, ja vaatii levytilaa 9,0 megaa.
Muistia ispell kuluttaa sen kanssa huimat 19 megaa, joten tämän
sanaston käyttäminen saattaa olla hieman kyseenalaista.
______________________________________________________________________
Asennusohjeet
Voit hakea nämä tiedostot osoitteesta
ftp://ispell-fi.sourceforge.net/pub/ispell-fi/.
1. Hae tiedosto finnish.dict.bz2
2. Lisäksi hae jokin seuraavista affiksitiedostoista
+ Pieni versio: finnish.small.aff.bz2
+ Keskisuuri versio: finnish.medium.aff.bz2 (suositeltu)
+ Suuri versio: finnish.large.aff.bz2
Seuraavaksi joko
3. Hae tiedosto build.sh
4. Aja komento "sh build.sh " hakemistossa, jossa tiedostot
ovat. (Koko on joko small, medium tai large.)
5. Kopioi luotu finnish.hash-tiedosto hakemistoon /usr/lib/ispell/
(Tai sinne, missä ispellin .hash -tiedostot ovat.)
tai
3. Pura hakemasi tiedostot bzip2-ohjelmalla.
4. Aja "buildhash finnish.dict finnish.hash", jossa
on purkamasi affiksitiedoston nimi. Älä välitä
mahdollisista ilmestyvistä varoituksista. Kaiken pitäisi toimia
kunnolla niistä huolimatta.
5. Kopioi luotu finnish.hash-tiedosto hakemistoon /usr/lib/ispell/
(Tai sinne, missä ispellin .hash -tiedostot ovat.)
Ispellin pitäisi nyt pystyä oikolukemaan suomenkielistä tekstiä.
______________________________________________________________________
Viat
Osa maiden (ja paikkojen) nimistä on edelleen sanastossa pienellä
alkukirjaimella. Lisäksi paikkojen, maiden ja kielten nimien osuus ei
ole vielä kovin kattava.
Sanasto sisältää luullakseni melko paljon harvinaisia sanoja, sekä
joidenkin erikoisalojen (lingvistiikka, atk) termejä. Ne saattavat
hidastaa ispellin toimintaa, viedä turhaa levytilaa ja muistia. En
kuitenkaan tiedä, kuinka kannattavaa niiden poistaminen sanastosta on.
(Työlästä se varmastikin on.)
Sanastossa on myös jonkin verran lyhenteitä, jotka saattavat aiheuttaa
virheellisten sanojen hyväksymisen.
______________________________________________________________________
Auttaminen
Lisäsanalistat ovat tervetulleita, varsinkin jos ne ovat sekä laajoja
että virheettömiä (ja vapaasti lisättävissä tähän GNU GPL-lisenssin
mukaisesti levitettävään pakettiin).
On myös avuksi, jos ilmoitat tämän sanaston tekijöille, kun ispell
hyväksyy selkeästi väärin kirjoitetun sanan. Muista kuitenkin
tarkistaa ensin, että ongelma on tosiaankin tässä sanastossa eikä
henkilökohtaisessa sanastossasi (joka on yleensä tiedostossa
~/.ispell_finnish).
______________________________________________________________________
Sanaston lähteet
* Martin Vermeerin kirjoittama alkuperäinen sanasto (versiossa 0.1,
ja aikaisemmin).
* Internetistä osoitteesta
ftp://ftp.uu.net:/doc/dictionaries/Finnish haettu sanasto. Se
sisältää kuitenkin paljon kirjoitusvirheitä ja vain pieniä
kirjaimia, joten se tarvitsi paljon oikaisulukemista
(oikolukuohjelmalla ja silmin), ennen kuin se voitiin ottaa
käyttöön.
* Melko paljon sanoja ~/.ispell_finnish -tiedostosta.
* 200 suomen yleisintä sanaa (Suomen Taajuussanakirjan mukaan.)
______________________________________________________________________
Affiksitiedostojen lähteet
Nämä affiksitiedostot perustuvat Martin Vermeerin kirjoittamaan
affiksitiedostoon (joka oli versiossa 0.1, ja aikaisemmin). Lisäksi
suureksi avuksi on ollut kirja Finnish grammar. Fred Karlsson (1983),
Werner Söderström Oy, Juva. sekä myös sen suomenkielinen versio Suomen
Peruskielioppi.
Tällä hetkellä affiksitiedostot ovat osittain automaattisesti
generoituja genfisuffix-ohjelmalla. Jos olet utelias, niin voit hakea
lähdekoodin osoitteesta
ftp://ispell-fi.sourceforge.net/pub/ispell-fi/genfisuffix/genfisuffix
-0.7.tar.bz2.
______________________________________________________________________