Show simple item record

dc.contributor.advisorAlegría Loinaz, Iñaki ORCID
dc.contributor.advisorMaritxalar Anglada, Montserrat
dc.contributor.authorEtxeberria Uztarroz, Izaskun ORCID
dc.contributor.otherLenguajes y Sistemas Informáticos;;Hizkuntza eta Sistema Informatikoakes
dc.date.accessioned2016-11-08T07:37:27Z
dc.date.available2016-11-08T07:37:27Z
dc.date.issued2016-07-11
dc.date.submitted2016-07-11
dc.identifier.urihttp://hdl.handle.net/10810/19492
dc.description221 p.es
dc.description.abstractTesi-lan hau hizkuntzaren azterketa eta prozesamenduaren arlokoa da eta testu ez-estandarren ikertze-lerroan garatu da, euskarazko testu ez-estandarren normalizazioa izanik lanaren gai nagusiTestu estandarrekin alderatuta, testu ez-estandarrek ezaugarri bereziak dituzte maila lexikoan, morfologikoan edota fonologikoan, eta haien prozesaketa erronka berri bat da. Testu horiek, oro har, ezin dira ohiko moduan prozesatu hizkuntza prozesatzeko tresna gehienak (NLP, Natural Language Processing tresnak) hizkuntza estandarretan idatzitako testuak prozesatzeko garatu direlako, eta testu ez-estandarrekin erabiltzen direnean asko jaisten da haien errendimendua. Halako testuak prozesatzeko interesa, ordea, asko zabaldu da azken urteetan: liburutegi digitalak, humanitate digitalak, soziolinguistika konputazionala, iritzien analisia eta abar. Testu ez-estandarrak normalizatuz gero, aukera dago NLP tresnak aplikatzeko testu horietan eta horretarako funtsezkoa da prozesu hori ahalik eta modurik eraginkorrenean betetzea. Tesi-lan honetan ikasketa automatikoan oinarritzen diren metodoak proposatzen dira euskarazko testu ez-estandarretan normalizazioaren ataza ebazteko. Horrekin batera, metodoek lortzen dituzten emaitzak konparatzen dira beste ikerketa batzuek lortzen dituztenekin, horrela metodoen egokitasuna aztertzeko. Konparazio hori egiteko gaztelaniazko zein eslovenierazko corpusak erabili dira, beste zenbait ikerlariren lankidetza baliatuz.es
dc.language.isoeuses
dc.rightsinfo:eu-repo/semantics/openAccesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.titleAldaera linguistikoen normalizazioa inferentzia fonologikoa eta morfologikoa erabilizes
dc.typeinfo:eu-repo/semantics/doctoralThesises
dc.rights.holder(cc)2016 IZASKUN ETXEBERRIA UZTARROZ (cc by-nc-sa 4.0)
dc.identifier.studentID5437es
dc.identifier.projectID18641es
dc.departamentoesLenguajes y sistemas informáticoses_ES
dc.departamentoeuHizkuntza eta sistema informatikoakes_ES


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

(cc)2016 IZASKUN ETXEBERRIA UZTARROZ (cc by-nc-sa 4.0)
Except where otherwise noted, this item's license is described as (cc)2016 IZASKUN ETXEBERRIA UZTARROZ (cc by-nc-sa 4.0)