관리 메뉴

고려대학교 대학원신문

인터넷은 어떻게 젠더 편향을 강화하는가? 본문

8면/과학칼럼

인터넷은 어떻게 젠더 편향을 강화하는가?

Jen25 2024. 4. 8. 15:28

인터넷은 어떻게 젠더 편향을 강화하는가?

 

심혜린 과학칼럼니스트

 

무의식적 편견은 해결하기 가장 어려운 것 중 하나다.” 전 미국 연방대법원 대법관인 긴즈버그(Ruth Bader Ginsburg)가 한 인터뷰에서 했던 말이다. 그렇다면 무엇이 우리의 무의식적 편견을 형성할 수 있을까? 어쩌면 가장 경계해야 하는 것은 커서가 깜박이고 있는 화면 속 검색창일지도 모른다.

검색 알고리즘이 사용자의 편견을 강화할 수 있다는 주장은 오래전부터 제기되어왔다. 지난 2022년 국제학술지 PNAS에 게재된 연구 결과 역시 이 주장을 뒷받침한다. 분석 결과에 따르면 알고리즘에 의한 검색 결과에는 각국의 성 불평등 상황이 반영되어 있었다. 연구팀은 58개 국가의 구글 서버에서 각국의 언어로 사람을 검색한 뒤 나타나는 이미지 속 인물의 성별을 분석했다. 검색 단어로 사람이 선택된 이유는 이 단어가 성 중립적인 단어이며, 성별화된 언어에서도 단일 형태로 사용되기 때문이다. 예를 들어 스페인어에서 의사는 성별에 따라 ‘el doctor(남성)’, ‘la doctora(여성)’로 형태가 달라지는 반면, ‘사람은 성별과 관계없이 ‘la persona’를 사용한다. 연구팀은 VPN(Virtual Private Network, 가상 사설망)을 이용해 각 나라의 구글 서버에 접속해 연구에 필요한 데이터를 얻었다고 밝혔다. 구글 검색 시 나타나는 상위 100개의 이미지가 분석 대상으로 선정되었으며, 이미지 속 인물들의 성별 판정은 이 연구의 목적을 알지 못하는 실험 참여자들이 수행했다.

각국의 젠더 불평등 현황을 파악하기 위해 연구팀은 글로벌 젠더 격차 지수(Global Gender Gap Index, GGGI)라는 척도를 사용했다. GGGI는 경제적 참여 및 기회, 교육적 성취, 보건 및 생존, 정치적 권한 등의 가치에 대한 성별 간 격차를 나타내는 척도로, 1에 가까운 값을 가질수록 젠더 격차가 적음을 의미한다. 세계경제포럼(WEF)에서는 매년 이를 바탕으로 세계 젠더 격차 보고서를 발행하며, 지난해 6월 발표된 보고서에서 한국의 GGGI0.680으로 보고서에 포함된 146개 국가 중 105위를 기록했다. 연구팀은 앞서 언급한 이미지 검색을 바탕으로 계산한 사람검색 이미지 속 남성 비율과 2020년 발표된 GGGI 값의 상관관계를 분석했다. 이를 통해 연구팀은 이미지 속 남성 비율과 GGGI 값 사이에 선형적인 상관관계가 있음을 확인했다. , 젠더 격차가 큰 국가일수록 사람검색 시 남성 이미지가 등장하는 비율이 높아진다는 것이다. 예를 들어 성별 격차가 큰 헝가리나 터키에서는 검색 결과 속 남성의 비율이 약 90%에 달했지만, 성별 격차가 작은 아이슬란드와 핀란드에서는 남성과 여성의 비율이 거의 유사했다.

다음으로 연구팀은 검색 결과가 검색자의 인식에 미치는 영향을 분석했다. 여성 약 60%, 남성 약 39%, 그리고 1% 이내의 논바이너리로 구성된 미국인 130명이 실험에 참여했다. 실험 참가자들의 사전 지식이 미치는 영향을 최소화하기 위해 선구상(chandler), 포목상(draper), 가발 제조인(peruker), 보석 세공사(lapidary)라는 생소한 직업군 4개가 선정되었다. 연구팀은 각 직업에 대하여 선구상이란? 선구상이라는 직업에 적합한 연령대는? (남성과 여성 중) 선구상일 것 같은 사람은? 등의 질문을 통해 실험 참가자들의 사전 인식을 조사했다. 이후 실험 참가자들은 각 직업에 대한 구글 검색 결과라는 정보와 함께 이미지를 제공받았다. 성 불평등이 심한 국가의 성별 비율이 반영된 이미지와 그렇지 않은 국가에서의 성별 비율이 반영된 이미지 중 하나가 각 참가자에게 무작위로 배정되었다. 이미지 확인 후 실험 참가자들은 앞서 진행한 직업별 인식 설문을 다시 진행하였고, 마지막으로 남성과 여성으로 구성된 두 지원자 사진을 보고 각 직업에서 누구를 고용할 것인지 택했다.

사전 응답 내용과 구글 검색 결과 이미지 확인 후 응답 내용을 비교해 보았을 때, 이미지 검색 결과가 실험 참가자들의 인식 및 고용 결정에 영향을 미친다는 사실이 확인되었다. “두 사람(남성과 여성) 중 더 포목상일 것 같은 사람은?”과 같은 질문에 대하여, 이미지 검색 결과가 남성으로 편향되어 있는 이미지에 노출된 실험 참가자들의 사후 응답 결과에서는 사전 응답 결과보다 여성을 선택하는 비율이 낮아졌으며, 성별 편향이 적은 이미지에 노출된 실험자들의 사후 응답 결과에서는 사전 응답 결과보다 여성을 선택하는 비율이 높아졌다. 두 그룹의 사전 응답 결과는 여성을 선택한 확률이 약 0.3~0.4 정도로 유사한 수준이었다. 고용 결정에 대한 문항에서도 비슷한 결과가 관찰되었다. 불평등이 심한 이미지에 노출된 실험 참가자들이 여성을 고용한다고 응답한 비율은 0.4 미만이었던 데 비해 불평등이 덜한 이미지에 노출된 실험 참가자들의 응답에서는 0.6 이상이었다. 이러한 결과를 바탕으로 연구팀은 사회적 불평등 관계가 인터넷 검색 알고리즘에 따른 검색 결과에 반영되며, 이 검색 결과가 다시 사용자의 인식 속 사회적 불평등을 강화하는 쪽으로 기여한다고 주장했다.

한편, 지난달 네이처 지에도 온라인 이미지가 성별에 대한 편견을 더욱 증폭시킨다는 연구 결과가 발표되었다. 특히 연구팀은 텍스트와 이미지를 비교했을 때, 이미지가 텍스트 대비 젠더 편향(gender bias)에 미치는 영향력이 더 크다고 주장했다. 텍스트와 이미지는 여러 방면에서 서로 다른 특성을 가진다. 특히 텍스트는 성 중립적인 단어와 표현을 사용함으로써 젠더 편향을 줄일 수 있다는 점에서 이미지와 큰 차이를 보인다. 예를 들어, ‘요리사가 주방에서 음식을 손질한다라는 문장은 성별 정보를 내포하지 않지만, 주방에서 일하는 요리사에 대한 이미지에는 성별 정보가 드러난다. 연구팀은 이러한 차이로 인해 온라인 이미지가 인터넷 사용자들의 성별에 대한 편견을 더욱 강화할 것으로 추측했으며, 이를 확인하기 위해 약 3,500여 개의 사회적 범주(social category)에 대한 데이터 분석을 진행했다.

온라인 텍스트에 대한 분석을 위해 단어를 벡터값으로 수치화해 나타내는 단어 임베딩(word embedding) 모델이 사용되었다. 단어 임베딩 과정을 거치면 유사한 의미를 가지거나 자주 함께 쓰이는 단어일수록 벡터 공간상에서 가깝게 존재한다. 연구팀은 이를 이용해 ‘woman’, ‘her’, ‘she’, ‘female’, ‘girl’ 등의 단어로 구성된 여성 클러스터와 ‘man’, ‘his’, ‘he’, ‘male’, ‘boy’ 등의 단어로 구성된 남성 클러스터를 구축한 뒤, 각 사회적 범주와 여성 및 남성 클러스터 사이의 거리를 계산함으로써 젠더 차원에서 각 사회적 범주가 어디에 위치하는지를 나타내었다. 예를 들어 어떤 단어가 여성이라는 단어와 자주 함께 쓰인다면 여성 클러스터와의 거리가 가깝고, 남성이라는 단어와 함께 쓰이는 경우가 많다면 남성 클러스터와의 거리가 가까워지는 식이다.

 

 

 

온라인 이미지 분석에는 약 6,000여 명의 실험 참가자가 참여했다. 아마존의 크라우드소싱 사이트인 MTurk을 이용해 참가자를 모집했으며, 실험 참가자들은 각 사회적 범주를 구글에 검색했을 때 등장하는 상위 100개의 이미지 속 인물들을 여성 남성, 논바이너리로 구분했다. 연구팀은 이 연구의 목적이 온라인 이미지가 인터넷 사용자에게 미치는 영향을 파악하는 것이므로 이미지 속 인물들이 가지는 실제 자기 정체성이 아닌 인터넷 사용자들이 인지하는 성별에 초점을 맞추었다고 밝혔다. 이와 같은 방식으로 이미지와 텍스트를 각각 분석한 뒤, 연구팀은 두 결과를 비교하기 위해 이미지와 텍스트에서 얻어진 데이터의 젠더 편향을 1부터 1 사이의 값으로 정규화해 표현했다. 연구팀이 사용한 정규화 방식에서는 어떤 데이터가 오로지 여성으로만 구성되어 있으면 1, 오로지 남성으로만 구성되어 있으면 +1, 두 성별이 완벽하게 균형을 이루고 있으면 0의 값을 가진다. 각 사회적 범주에 대해 정규화를 거친 결과를 도식화했을 때, 이미지가 텍스트 대비 양 끝단으로 편향되어 분포함이 확인되었다 (그림1). 또한, 연구팀은 400여 명을 대상으로 한 추가 실험을 통해 이미지 검색 결과가 인터넷 사용자들에게 직·간접적인 방향 모두에서 텍스트 대비 편견을 크게 강화함을 확인했다.

누구나 손쉽게 검색을 통해 정보에 접근할 수 있는 시대다. 넘쳐나는 정보의 홍수 속에서 우리도 모르는 새 편견과 편향의 흐름에 휩쓸려버리지 않기 위해, 검색 알고리즘을 통해 각종 사회적 편견이 전파되고 재확산되는 현상을 주목하고 경계할 필요가 있지 않을까.

 

[그림 설명]

온라인 이미지()와 텍스트() 검색 결과에서의 성별 연관성

(출처: Guilbeault, D. et al. Nature 626, 10491055 (2024))

 

[참고 문헌]

Vlasceanu, Madalina, and David M. Amodio. Proceedings of the National Academy of Sciences 119.29 (2022): e2204529119.

Hofstra, B., & Mulders, A. M. Nature 626, 960-961 (2024)

Guilbeault, D. et al. Nature 626, 10491055 (2024)