Gender Bias in Contextualized Word Embeddings
publication

Gender Bias in Contextualized Word Embeddings

Jieyu Zhao, Tianlu Wang, Mark Yatskar, Ryan Cotterell, Vicente Ordonez, Kai-Wei Chang.
North American Chapter of the Association for Computational Linguistics. NAACL 2019. short. Minneapolis, Minnesota. June 2019.
Mesa de notícias do laboratório

Resumo do comunicado de imprensa

Esta seção foi escrita intencionalmente em tom de comunicado de imprensa, em estilo jornalístico, para o público geral.

Pesquisadores da UCLA, da University of Virginia, do Allen Institute for Artificial Intelligence e da University of Cambridge descobriram que o ELMo, um sistema amplamente utilizado para gerar representações de palavras sensíveis ao contexto no processamento de linguagem natural, codifica um viés de gênero significativo que se propaga para aplicações práticas. A equipe atribuiu o problema em parte a dados de treinamento enviesados: no corpus One Billion Word Benchmark usado para treinar o ELMo, pronomes masculinos aparecem cerca de três vezes mais frequentemente do que pronomes femininos, e pronomes masculinos coocorrem com mais frequência com termos ocupacionais, independentemente de essas profissões serem tradicionalmente masculinas ou femininas. Usando análise de componentes principais, os pesquisadores mostraram que a geometria interna do ELMo na verdade captura o gênero ao longo de duas dimensões distintas — uma ligada ao contexto circundante, outra ligada à própria palavra — e que um classificador consegue prever o gênero de uma entidade masculina a partir de uma palavra de ocupação com cerca de 14 pontos percentuais a mais de precisão do que o de uma entidade feminina, um sinal de que o modelo trata os dois gêneros de forma desigual. Quando um sistema de resolução de correferência de ponta construído sobre o ELMo foi testado no WinoBias, um conjunto de dados diagnóstico projetado para sondar estereótipos de gênero ocupacionais, ele apresentou uma diferença de quase 30 pontos percentuais entre sua precisão em exemplos estereotipicamente de gênero versus contraestereotípicos — substancialmente pior do que um sistema comparável usando os embeddings GloVe mais antigos e não contextualizados. A equipe testou dois remédios: aumentar os dados de treinamento trocando palavras com marcação de gênero para criar exemplos balanceados eliminou em grande parte o viés, enquanto uma abordagem mais simples, em tempo de teste, de calcular a média de embeddings de frases com gênero trocado funcionou apenas parcialmente. As descobertas são importantes porque embeddings contextualizados como ELMo e BERT são cada vez mais a espinha dorsal de sistemas de PLN em produção, o que significa que vieses não examinados nesses componentes fundamentais podem se propagar silenciosamente para ferramentas do mundo real.

resumo

Neste artigo, quantificamos, analisamos e mitigamos o viés de gênero exibido nos vetores de palavras contextualizados do ELMo. Primeiro, realizamos diversas análises intrínsecas e constatamos que (1) os dados de treinamento do ELMo contêm significativamente mais entidades masculinas do que femininas, (2) os embeddings treinados do ELMo codificam sistematicamente informações de gênero e (3) o ELMo codifica de forma desigual informações de gênero sobre entidades masculinas e femininas. Em seguida, mostramos que um sistema de correferência de ponta que depende do ELMo herda seu viés e demonstra viés significativo no corpus de sondagem WinoBias. Por fim, exploramos dois métodos para mitigar esse viés de gênero e mostramos que o viés demonstrado no WinoBias pode ser eliminado.

citação

@inproceedings{zhao2019gender,
  title = {Gender Bias in Contextualized Word Embeddings},
  author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Cotterell, Ryan and Ordonez, Vicente and Chang, Kai-Wei},
  year = {2019},
  booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2019},
  url = {https://arxiv.org/abs/1904.03310},
}