UPV-EHU ADDI
  • Back
    • English
    • español
    • Basque
  • Login
  • English 
    • English
    • español
    • Basque
  • FAQ
View Item 
  •   ADDI
  • INVESTIGACIÓN
  • Tesis de Master
  • Máster Universitario en Análisis y Procesamiento del Lenguaje
  • View Item
  •   ADDI
  • INVESTIGACIÓN
  • Tesis de Master
  • Máster Universitario en Análisis y Procesamiento del Lenguaje
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Study of a Metric for Measuring Gender Bias in BERT Language Models

Thumbnail
View/Open
MAL_Elvira_Gonzalez.pdf (1.506Mb)
Date
2023-06-30
Author
González Hernández, Elvira
Metadata
Show full item record
  Estadisticas en RECOLECTA
(LA Referencia)

URI
http://hdl.handle.net/10810/61835
Abstract
[EN] Since the creation of language models such as BERT, they are being deployed widely as services on platforms to serve millions of users. With their increasing popularity, the fairness of NLP systems and algorithms is a subject of great interest nowadays given the harms an unethical system can cause. That is why researchers have been interested in the development of techniques for detection and mitigation of bias. In this work, a previously proposed metric for measuring gender bias by studying associations between gender-denoting referents and names of professions will be analysed. The accuracy of previous results will be questioned, and a deeper analysis of the metric will demonstrate that the metric has some flaws and limitations in the way it represents gender bias. The experiments will be carried out for three languages, English, Basque and Spanish, and its corresponding monolingual BERT models: BERT base, BERTeus and BETO. The fact that the three languages are very different linguistically, especially regarding grammatical gender, together with a thorough analysis of the metric will reveal some interesting conclusions about the metric's limitations.
 
[ES] Desde su creación, los modelos del lenguaje BERT están siendo implementados en multitud de plataformas que dan servicio a millones de usuarios. Debido a su creciente popularidad, se empezó a dar importancia al hecho de crear sistemas éticos dentro del campo del procesamiento del lenguaje natural, sobre todo teniendo en cuenta los perjuicios que un sistema que no sea justo e imparcial puede producir en algunos grupos de la sociedad. Por este motivo, se está investigando cada vez más sobre técnicas para la detección y reducción del sesgo de género. En este trabajo se va a analizar una métrica para la medición del sesgo de género estudiando la asociación entre referentes con marca de género y profesiones. Se cuestionarán los resultados obtenidos con la misma métrica en trabajos anteriores y, llevando a cabo un análisis más exhaustivo se examinarán las limitaciones que tiene la métrica. Los experimentos se llevarán a cabo en tres idiomas, inglés, euskera y español; en los tres modelos BERT monolingües correspondientes a cada uno de ellos: BERT base, BERTeus y BETO. La variedad lingüística de los tres idiomas en cuanto al género gramatical, junto con el análisis más detallado de la métrica ayudará a obtener interesantes conclusiones sobre las limitaciones de la métrica.
 
Collections
  • Máster Universitario en Análisis y Procesamiento del Lenguaje

DSpace 6.4 software copyright © -2023  DuraSpace
OpenAIRE
EHU Bilbioteka
 

 

Browse

All of ADDICommunities & CollectionsBy Issue DateAuthorsTitlesDepartamentos (cas.)Departamentos (eus.)SubjectsThis CollectionBy Issue DateAuthorsTitlesDepartamentos (cas.)Departamentos (eus.)Subjects

My Account

Login

Statistics

View Usage Statistics

DSpace 6.4 software copyright © -2023  DuraSpace
OpenAIRE
EHU Bilbioteka