Suomenkielinen sijataivutin - Case inflector for Finnish
Project description
Taivutin
Tämä kirjasto taivuttaa suomenkielisiä nomineja (substantiivit, adjektiivit, pronominit ja numeraalit; nimisanat, laatusanat, asemosanat ja lukusanat) sijoissa (talo -> talon). Muiden sanaluokkien taivutukseen se ei (ainakaan vielä) paneudu.
Sen peruskäyttö ei vaadi sanaluokkien tai taivutusluokkien tarkkaa tuntemista.
Asennus
Helpoin tapa asentaa taivutin on PyPin kautta:
pip install taivutin
Asentaminen onnistuu kuitenkin myös suoraan tämän koodivaraston kautta. Koodivarasto ei ole sellaisenaan käyttökelpoinen, vaan se pitää asentaa. Tämä onnistuu joko ajamallla
python3 setup.py install
tai asentamalla koodiarkiston ohesta löytyvä valmiiksi käännetty .whl-paketti komennolla
pip install <paketin nimi>.whl
Molemmat menetelmät upottavat nykysuomen sanalistan Python-tiedostoon.
Käyttö
Kirjaston pääasiallinen käyttö tapahtuu Taivutin-olion taivuta-metodin kautta. Taivutin osaa taivuttaa joko mallisanan "talo" tai sijamuodon nimen mukaan.
from taivutin import Taivutin
t = Taivutin()
print(t.taivuta("makaronilaatikko", "talojen")) # 'makaronilaatikkojen'
print(t.taivuta("makaronilaatikko", "mon gen")) # 'makaronilaatikkojen'
Näin kutsuttuna taivutin yrittää arvata, miten sanaa kuuluisi taivuttaa. Sen käytöstä voi ohjata seuraavilla avainparametreilla:
taivutusluokka
: yksi kotuksen käyttämistä taivutustyypeistä merkkijonona. Kielitoimiston sanakirja kertoo siitä löytyvälle sanalle taivutusluokan.asteluokka
: yksi kotuksen käyttämistä astevaihtelutyypeistä merkkijonona. Kielitoimiston sanakirja kertoo siitä löytyvälle sanalle asteluokan.sointu
: joko'ETU'
tai'TAKA'
riippuen siitä, halutaanko taivutuksessa etu- vai takavokaalinen vokaalisointu.nimi
:True
,False
taiNone
riippuen siitä, halutaanko sanaa taivuttaa erisnimenä vai yleisnimenä.None
antaa taivuttimen arvata. Tämä on merkitsevää esimerkiksi etunimen Meri tapauksessa: halutaanko sana taivuttaa nimenä Meri - Merin vai yleissanana Meri - Meren.
Esimerkiksi:
t.taivuta("meri", "gen") # meren
t.taivuta("Meri", "gen") # Merin
t.taivuta("Meri", "gen", nimi=False) # Meren
Taivuttimen tuntemat sijat
Taivutin tuntee seuraavat sijat ja käyttää niistä seuraavia lyhennyksiä:
sijamuoto | taivuttimen käyttämä lyhennys | esimerkki |
---|---|---|
nominatiivi | nom | talo |
genetiivi | gen | talon |
partitiivi | part | taloa |
essiivi | ess | talona |
inessiivi | iness | talossa |
elatiivi | elat | talosta |
illatiivi | ill | taloon |
adessiivi | ade | talolla |
ablatiivi | abl | talolta |
allatiivi | all | talolle |
translatiivi | trans | taloksi |
instruktiivi | ins | taloin |
abessiivi | abe | talotta |
komitatiivi | kom | taloineen |
Vastaavat monikot saa lisäämällä sijan eteen "mon". Esimerkiksi monikon genetiivin saa komennolla t.taivuta(sana, "mon nom")
.
Lisenssiasioista
Pähkinänkuoressa: tätä kirjastoa voi käyttää GNU LGPL-lisenssillä. LGPL lisenssistä lisää (englanniksi). Voit käyttää kirjastoa kaupalliseen tai ei-kaupalliseen käyttöön vapaasti julkaisematta sovelluksesi koodia. Jos muokkaat kirjaston koodia, sinun tulee julkaista nämä muokkaukset samalla lisenssillä.
Tarkemmin: Itse kirjaston koodi on LPGL-lisensioitua. Lisäksi kirjasto käyttää kolmea valmista kokonaisuutta: Nykysuomen sanalistaa, Kotuksen Etunimien taivutus -aineistoa ja LGPL-lisensioitua taivutustietokomponenttia.
Nykysuomen sanalista löytyy kansiosta taivutin/nykysuomen-sanalista/
. Kotimaisten kielten keskus levittää Nykysuomen sanalistaa GNU LGPL -, EUPL v.1.1 - ja Creative Commons Nimeä 3.0 Muokkaamaton -kolmoislisensioinnilla. Kolmoislisensiointi tarkoittaa, että käyttö on hyväksyttävää, kunhan se täyttää jonkin lisenssin ehdot. Lisää tietoa löytyy tiedostosta taivutin/nykysuomen-sanalista/README.md
.
Etunimien taivutus löytyy kansiosta taivutin/etunimien-taivutus/
. Kotimaisten kielten keskus ilmoitti sähköpostitse asiaa tiedustellessa, että sitä voi käyttää CC-BY 4.0 -lisenssin ehtojen mukaisesti.
Taivutustietokomponentti löytyy kansiosta taivutin/yhteistaivutus
.
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.