Show simple item record

dc.contributor.authorAranberri, Nora
dc.contributor.authorPascual, Jose A.
dc.date.accessioned2020-01-17T19:20:43Z
dc.date.available2020-01-17T19:20:43Z
dc.date.issued2018
dc.identifier.citationEkaia 34 : 335-352 (2018)
dc.identifier.issn0214-9001
dc.identifier.urihttp://hdl.handle.net/10810/38976
dc.description.abstractThe overall machine translation quality available for professional transla-tors working with the Spanish-Basque pair is rather poor, which is a deterrent for its adoption. This work investigates the plausibility of building a comprehensive recom-mendation system to speed up decision time between postediting or translation from scratch using the very limited training data available. First, we build a set of regression models that predict the postediting effort in terms of overall quality, time and edits. Secondly, we build classification models that recommend the most efficient editing ap-proach using postediting effort features on top of linguistic features. Results show high correlations between the predictions of the regression models and the expected HTER, time and edit number values. Similarly, the results for the classifiers show that they are able to predict with high accuracy whether it is more efficient to translate or to postedit a new segment.; Gaztelania-euskara bikotearekin lan egiten duten itzultzaileentzat eskuragarri dagoen itzulpen automatikoaren kalitatea nahiko baxua da, eremu profesionalean erabiltzea oztopatzen duena. Lan honek posteditatzea edo itzultzea, bietatik eragingarriagoa zein den erabakitzen laguntzeko gomendio-sistema bat eraikitzearen egingarritasuna ikertzen du, datu-multzo mugatu batekin ikasketa-algoritmoen jokaera aztertuz. Lehenengo, postedizio-esfortzua aurreikusten duten erregresio-ereduak eraiki ditugu kalitate orokorrean, denboran eta edizioetan oinarritzen direnak. Bigarrenik, edizio-metodo eraginkorrena gomendatzen duten sailkapen-ereduak eraiki ditugu oinarrizko ezaugarriei eta ezaugarri linguistikoei postedizio-esfortzuko ezaugarriak gehituta. Emaitzek korrelazio altuak erakusten dituzte erregresio-ereduek aurreikusitako HTERen, denboraren eta edizio kopuruaren eta errealen artean. Era berean, sailkatzaileen emaitzek erakusten dute doitasun altuz iragarri dezakegula itzultzea edo posteditatzea, bietatik zein den eraginkorragoa.
dc.language.isoeus
dc.publisherServicio Editorial de la Universidad del País Vasco/Euskal Herriko Unibertsitatearen Argitalpen Zerbitzua
dc.rightsinfo:eu-repo/semantics/openAccess
dc.titleIkasketa automatikoko tekniken erabilgarritasun azterketa euskararako postediziorako gomendio-sistema eraikitzeko
dc.typeinfo:eu-repo/semantics/article
dc.rights.holder© 2018, Servicio Editorial de la Universidad del País Vasco Euskal Herriko Unibertsitateko Argitalpen Zerbitzua
dc.identifier.doi10.1387/ekaia.19700 


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record