Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4

Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4

Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4

Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4

Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4

Warning: Cannot modify header information - headers already sent by (output started at /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code:102) in /var/www/iplanru/data/www/intesco.ru/d59ed/index.php(1) : eval()'d code(2) : eval()'d code on line 4
ispell-fi: Suomen kielen oikaisulukusanasto ispellille Versio 0.7 (30. elokuuta 2000) Martin Vermeer ja Pauli Virtanen _________________________________________________________________ Tämä projekti pyrkii saamaan aikaan sanasto- ja affiksitiedostot, jotka mahdollistavat suomenkielisten asiakirjojen oikaisuluvun ispellillä. Sekä sanasto- että affiksitiedostot levitetään Free Software Foundationin GNU General Public Licensen version 2 ehtojen alaisina. (Ks. tiedosto COPYING). ______________________________________________________________________ Nykyinen tila Tämän ispellin oikaisulukusanaston pitäisi kattaa noin 90%-99% yleisistä suomen kielen sanoista. Sanasto on käyttökelpoinen, ja sen pitäisi olla myös suhteellisen virheetön. (Ks. Viat.) ______________________________________________________________________ Sanaston kolme eri kokoa Sanastosta on kolme erikokoista versiota: pieni, keskisuuri ja suuri. Nämä eroavat toisistaan vain muodostettujen sanojen taivutusmuotojen määrän osalta. (Katso tilastotietoja tiedostosta CHANGELOG.) Pieni versio tunnistaa 756588 sanaa, ja vaatii levytilaa 2,7 megaa. Muistia ispell kuluttaa sen kanssa noin 5 megaa, joten sen pitäisi toimia myös pienitehoisilla koneilla. Keskisuuri versio tunnistaa 889302 sanaa, ja vaatii levytilaa 5,3 megaa. Muistia ispell kuluttaa sen kanssa noin 10 megaa. Tätä sanastoa suositellaan käytettäväksi. Suuri versio tunnistaa 6678677 sanaa, ja vaatii levytilaa 9,0 megaa. Muistia ispell kuluttaa sen kanssa huimat 19 megaa, joten tämän sanaston käyttäminen saattaa olla hieman kyseenalaista. ______________________________________________________________________ Asennusohjeet Voit hakea nämä tiedostot osoitteesta ftp://ispell-fi.sourceforge.net/pub/ispell-fi/. 1. Hae tiedosto finnish.dict.bz2 2. Lisäksi hae jokin seuraavista affiksitiedostoista + Pieni versio: finnish.small.aff.bz2 + Keskisuuri versio: finnish.medium.aff.bz2 (suositeltu) + Suuri versio: finnish.large.aff.bz2 Seuraavaksi joko 3. Hae tiedosto build.sh 4. Aja komento "sh build.sh " hakemistossa, jossa tiedostot ovat. (Koko on joko small, medium tai large.) 5. Kopioi luotu finnish.hash-tiedosto hakemistoon /usr/lib/ispell/ (Tai sinne, missä ispellin .hash -tiedostot ovat.) tai 3. Pura hakemasi tiedostot bzip2-ohjelmalla. 4. Aja "buildhash finnish.dict finnish.hash", jossa on purkamasi affiksitiedoston nimi. Älä välitä mahdollisista ilmestyvistä varoituksista. Kaiken pitäisi toimia kunnolla niistä huolimatta. 5. Kopioi luotu finnish.hash-tiedosto hakemistoon /usr/lib/ispell/ (Tai sinne, missä ispellin .hash -tiedostot ovat.) Ispellin pitäisi nyt pystyä oikolukemaan suomenkielistä tekstiä. ______________________________________________________________________ Viat Osa maiden (ja paikkojen) nimistä on edelleen sanastossa pienellä alkukirjaimella. Lisäksi paikkojen, maiden ja kielten nimien osuus ei ole vielä kovin kattava. Sanasto sisältää luullakseni melko paljon harvinaisia sanoja, sekä joidenkin erikoisalojen (lingvistiikka, atk) termejä. Ne saattavat hidastaa ispellin toimintaa, viedä turhaa levytilaa ja muistia. En kuitenkaan tiedä, kuinka kannattavaa niiden poistaminen sanastosta on. (Työlästä se varmastikin on.) Sanastossa on myös jonkin verran lyhenteitä, jotka saattavat aiheuttaa virheellisten sanojen hyväksymisen. ______________________________________________________________________ Auttaminen Lisäsanalistat ovat tervetulleita, varsinkin jos ne ovat sekä laajoja että virheettömiä (ja vapaasti lisättävissä tähän GNU GPL-lisenssin mukaisesti levitettävään pakettiin). On myös avuksi, jos ilmoitat tämän sanaston tekijöille, kun ispell hyväksyy selkeästi väärin kirjoitetun sanan. Muista kuitenkin tarkistaa ensin, että ongelma on tosiaankin tässä sanastossa eikä henkilökohtaisessa sanastossasi (joka on yleensä tiedostossa ~/.ispell_finnish). ______________________________________________________________________ Sanaston lähteet * Martin Vermeerin kirjoittama alkuperäinen sanasto (versiossa 0.1, ja aikaisemmin). * Internetistä osoitteesta ftp://ftp.uu.net:/doc/dictionaries/Finnish haettu sanasto. Se sisältää kuitenkin paljon kirjoitusvirheitä ja vain pieniä kirjaimia, joten se tarvitsi paljon oikaisulukemista (oikolukuohjelmalla ja silmin), ennen kuin se voitiin ottaa käyttöön. * Melko paljon sanoja ~/.ispell_finnish -tiedostosta. * 200 suomen yleisintä sanaa (Suomen Taajuussanakirjan mukaan.) ______________________________________________________________________ Affiksitiedostojen lähteet Nämä affiksitiedostot perustuvat Martin Vermeerin kirjoittamaan affiksitiedostoon (joka oli versiossa 0.1, ja aikaisemmin). Lisäksi suureksi avuksi on ollut kirja Finnish grammar. Fred Karlsson (1983), Werner Söderström Oy, Juva. sekä myös sen suomenkielinen versio Suomen Peruskielioppi. Tällä hetkellä affiksitiedostot ovat osittain automaattisesti generoituja genfisuffix-ohjelmalla. Jos olet utelias, niin voit hakea lähdekoodin osoitteesta ftp://ispell-fi.sourceforge.net/pub/ispell-fi/genfisuffix/genfisuffix -0.7.tar.bz2. ______________________________________________________________________