Aldaera linguistikoen normalizazioa inferentzia fonologikoa eta morfologikoa erabiliz

Etxeberria Uztarroz, Izaskun

dc.contributor.advisor	Alegría Loinaz, Iñaki
dc.contributor.advisor	Maritxalar Anglada, Montserrat
dc.contributor.author	Etxeberria Uztarroz, Izaskun
dc.contributor.other	Lenguajes y Sistemas Informáticos;;Hizkuntza eta Sistema Informatikoak	es
dc.date.accessioned	2016-11-08T07:37:27Z
dc.date.available	2016-11-08T07:37:27Z
dc.date.issued	2016-07-11
dc.date.submitted	2016-07-11
dc.identifier.uri	http://hdl.handle.net/10810/19492
dc.description	221 p.	es
dc.description.abstract	Tesi-lan hau hizkuntzaren azterketa eta prozesamenduaren arlokoa da eta testu ez-estandarren ikertze-lerroan garatu da, euskarazko testu ez-estandarren normalizazioa izanik lanaren gai nagusiTestu estandarrekin alderatuta, testu ez-estandarrek ezaugarri bereziak dituzte maila lexikoan, morfologikoan edota fonologikoan, eta haien prozesaketa erronka berri bat da. Testu horiek, oro har, ezin dira ohiko moduan prozesatu hizkuntza prozesatzeko tresna gehienak (NLP, Natural Language Processing tresnak) hizkuntza estandarretan idatzitako testuak prozesatzeko garatu direlako, eta testu ez-estandarrekin erabiltzen direnean asko jaisten da haien errendimendua. Halako testuak prozesatzeko interesa, ordea, asko zabaldu da azken urteetan: liburutegi digitalak, humanitate digitalak, soziolinguistika konputazionala, iritzien analisia eta abar. Testu ez-estandarrak normalizatuz gero, aukera dago NLP tresnak aplikatzeko testu horietan eta horretarako funtsezkoa da prozesu hori ahalik eta modurik eraginkorrenean betetzea. Tesi-lan honetan ikasketa automatikoan oinarritzen diren metodoak proposatzen dira euskarazko testu ez-estandarretan normalizazioaren ataza ebazteko. Horrekin batera, metodoek lortzen dituzten emaitzak konparatzen dira beste ikerketa batzuek lortzen dituztenekin, horrela metodoen egokitasuna aztertzeko. Konparazio hori egiteko gaztelaniazko zein eslovenierazko corpusak erabili dira, beste zenbait ikerlariren lankidetza baliatuz.	es
dc.language.iso	eus	es
dc.rights	info:eu-repo/semantics/openAccess	es
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/	*
dc.title	Aldaera linguistikoen normalizazioa inferentzia fonologikoa eta morfologikoa erabiliz	es
dc.type	info:eu-repo/semantics/doctoralThesis	es
dc.rights.holder	(cc)2016 IZASKUN ETXEBERRIA UZTARROZ (cc by-nc-sa 4.0)
dc.identifier.studentID	5437	es
dc.identifier.projectID	18641	es
dc.departamentoes	Lenguajes y sistemas informáticos	es_ES
dc.departamentoeu	Hizkuntza eta sistema informatikoak	es_ES