出版社:Árni Magnússon Institute for Icelandic Studies
摘要:Í greininni er lýst tilurð og eiginleikum íslensks textagrunns - Íslensks orðasjóðs - sem unnið er að við Háskólann í Leipzig. Íslenskur orðasjóður er íslenskur textagrunnur með innbyggðu orðasafni sem samanstendur af u.þ.b. 250 milljónum orða og orðmynda úr íslensku nútímamáli. Íslenskur orðasjóður var unninn við Háskólann í Leipzig sem hluti af rannsóknarvinnu við verkefnið Leipzig Corpora Collection (http://corpora.informatik.uni-leipzig.de/). Textarnir í texta grunninum eru úr vefsíðusöfnun Landsbókasafns Íslands - Háskólabókasafns haustið 2005 og notendaumhverfiðvar þróað við tölvunarfræðideild Háskólans í Leipzig. Textagrunnurinn verður birtur á Veraldarvefnum til frjálsrar notkunar. Í greininni er notkunarmöguleikum textagrunnsins lýst, bæði sem orðasafns fyrir almenna notendur og sem rannsóknartækis við rannsóknir í hagnýtum og almennum málvísindum.
其他摘要:Corpora are important linguistic resources. In this paper I describe the details of an Icelandic corpus, that is a part of a collection of corpora in 17 different languages which can be accessed online from http://corpora.informatik.uni-leipzig.de, and, with Icelandic instructions, at http://wortschatz.uni-leipzig.de/ws_ice/index.php. I discuss the possible usage of the corpus as a corpus based dictionary for non-linguistic users, and as a research tool for linguistic purposes in both applied and theoretical linguistics.