ⓒ스마일게이트 AI센터
ⓒ스마일게이트 AI센터

- “앞으로 혐오 표현 감지 기술 고도화 계획” 밝혀  

[SRT(에스알 타임스) 이수일 기자] 스마일게이트 AI센터는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 악플 및 혐오 발언 데이터셋을 이달 중 깃허브 페이지를 통해 공개한다고 20일 밝혔다.

스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 감지·대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다.

스마일게이트 AI 센터에 따르면 악플 및 혐오 발언 데이터는 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트 등의 게시글을 대상으로 수집됐다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 55만여개의 데이터를 기반으로 1만개의 데이터셋을 구축했다.

데이터셋 구축 과정에서 ▲여성·가족 ▲성소수자 ▲남성 ▲인종·국적 ▲연령 ▲지역 ▲종교 ▲기타혐오 등 8개의 대상으로 범주화 했다. 혐오 발언 분류를 위한 기준 모델을 공개했으며, 이를 통해 혐오 발언 추출이 가능하다.

스마일게이트 AI 센터는 악플 및 혐오 발언 데이터셋이 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇 등에서 대상을 둘러싼 혐오 발언 여부를 파악할 수 있다고 봤다. 또한 지속적인 연구개발(R&D)을 통해 확보한 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다. 

한우진 스마일게이트 AI 센터 센터장은 “앞으로 그 동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도하겠다”고 말했다.

저작권자 © SR타임스 무단전재 및 재배포 금지