네이버 LLM 하이퍼클로바X AI 플랫폼 전략 해외서 통할까

2024-04-23     선호균 기자

[SRT(에스알 타임스) 선호균 기자] 네이버 초거대언어모델(LLM) 하이퍼클로바X가 해외에서 두각을 나타낼 지 관심이 쏠린다.

23일 업계에 따르면 네이버는 지난 11~12일 이틀간 ‘생성형 AI 레드팀 챌린지’에 대표 파트너사로 참여했다. 이 행사는 과학기술정보통신부가 주최하고 한국정보통신기술협회(TTA)와 초거대AI추진협의회가 주관했다. 

네이버는 생성형AI 레드팀 챌린지가 최근 급격히 성장하는 LLM의 안전성, 신뢰성, 보안을 강화하기 위한 방법을 모색하고자 진행하는 행사라고 설명했다. 

행사에서는 네이버가 참가자들에게 하이퍼클로바X를 제공하고, 우수한 질문과 취약점을 잘 찾아낸 참가자에게 네이버가 시상하는 방식으로 진행됐다. 

참가자들은 인공지능(AI) 윤리와 관련한 질문을 이어갔고, 이를 통해 발견된 하이퍼클로바X의 취약점은 데이터 모델의 안전성 강화에 활용될 예정이다. 

네이버가 만든 LLM 하이퍼클로바X는 소버린 AI로 자국 언어 중심으로 만들어진 AI다. 하이퍼클로바X는 한국어와 영어 중심의 AI로 한국어 이용자를 대상으로 한다. 

네이버클라우드에 따르면 하이퍼클로바X는 한국판 AI 성능 평가 체계인 KMMLU에서 오픈AI와 구글이 만든 생성형 AI보다 높은 점수를 기록했다. 

KMMLU는 국내 대표적인 오픈소스 언어모델 연구팀 ‘해례(HAE-RAE)’가 이끈 AI 성능 평가 지표 구축 프로젝트다. 인문학, 사회학, 과학·기술 등 45개 분야에서 전문가 수준의 지식을 묻는 3만5,030개 문항으로 이뤄져 있다.

수학적 추론 능력과 같이 전세계 공통적으로 적용 가능한 광범위한 지식을 묻는 문항 비중이 80%다. 나머지 20%는 한반도 지리와 국내법 등 한국 특화 문제 해결 능력을 평가하기 위한 문항으로 구성된다. 

네이버는 KMMLU가 AI의 보편적 능력과 로컬 지식을 고르게 측정함으로써 한국 사용자에게 유용한 AI를 종합적으로 판단할 수 있다. 특히 KMMLU는 한국어 원본의 시험 문제들로 이뤄져 국내외 AI의 한국어 이해 역량을 평가할 수 있다. 

물론 이 방식은 하이퍼클로바X의 영어 성능 평가에도 적용돼 테크니컬 리포트로 발간됐다. 리포트에서는 하이퍼클로바X의 영어 능력이 GPT 3.5~4 정도의 수준인 것으로 파악했다. 즉 한국어와 영어 모두 학습한 모델이라는 것이다. 

하이퍼클로바X는 다국어 지원이 충분히 가능하지만 가장 성능이 좋은 언어는 한국어와 영어다. 이는 글로벌 빅테크 기업들이 한국어에 크게 관심을 두지 않아서다. 한글 이용자를 대상으로 한국어 중심의 AI를 만들자는 게 하이퍼클로바X의 탄생 배경이다. 

네이버 관계자는 “AI를 만들어 본 기업이 많지 않기 때문에 자사는 하이퍼클로바X를 그대로 해외로 가져가 아시아권 여러 언어와 영어를 학습시켜 해당 국가 중심의 AI 구축이 가능해 해외에서 AI 플랫폼 서비스를 할 수 있다”고 전망했다.

▲초거대언어모델(LLM) 하이퍼클로바X 로고. ⓒ네이버