본문 바로가기
세상 잡학/IT

네이버 인공지능, 구글·오픈AI ‘압도’

by 코토 잡학 2024. 2. 29.

‘생성형 인공지능’(Generative AI)을 개발한 네이버가 한국에 대한

 

이해도 측면에서 세계적인 AI 개발 기업인 오픈AI와 구글을 능가하는

 

수준이라는 연구 단체의 평가를 받았다는 소식이 전해졌습니다.

 

국내에서 활동하는 오픈소스 언어모델 연구팀 ‘해례’(HAE-RAE)는

 

최근 한국어에 특화된 인공지능(AI) 성능 평가 체계인

 

‘KMMLU’(Measuring Massive Multitask Language Understanding in Korean)를

 

개발하였습니다.

 

이 체계를 통해 한국어를 이해하고 처리하는 인공지능의

 

성능을 정량적으로 측정할 수 있게 되었습니다.

 

이번에 공개된 결과에 따르면, 네이버가 개발한 AI 모델이

 

오픈AI와 구글의 모델들보다 높은 점수를 기록했습니다.

 

이는 네이버의 AI 기술이 한국어 이해능력 면에서 세계적인 수준에

 

도달했음을 입증하는 결과로, 네이버클라우드는 이 연구 논문의 결과를 인용하여 27일 공식 발표하였습니다.

 

네이버 인공지능

구글·오픈AI ‘압도’

 

1.  네이버의 하이퍼클로바X

▲오픈AI의 챗GPT, ▲구글의 바드, ▲네이버의 클로바X 등의

 

대화형 AI 서비스는 초대규모 AI(Hyperscale AI) 혹은

 

대형언어모델(LLM·Large language model)라는 기반인프라를 통해 가동되며,

 

이들 서비스는 각각의 AI 기술을 활용하여 사용자와의 대화를 가능하게 한다.

 

이러한 서비스들은 구글이 도입한 ‘SGE’(Search Generative Experience)나

 

네이버의 큐:(CUE:)와 같은 ‘생성형 AI 검색’ 기술도 포함합니다.

 

이러한 기술을 이해하는 방법 중 하나는 네이버가 ‘하이퍼클로바X’라는

 

초대규모 AI 모델을 통해 클로바X와 큐:와 같은 서비스를 제공하는 구조를 보는 것이다.

 

이런 방식은 오픈AI와 구글도 동일하게 적용하고 있다.

 

AI 분야의 주요 연구기관 중 하나인 해례는 KMMLU라는 도구를 통해

 

각 기업의 초대규모 AI 모델의 성능을 측정하고 비교했다.

 

이 평가에서는 네이버의 하이퍼클로바X, 오픈AI의 GPT-3.5 터보(Turbo), GPT-4,

 

그리고 구글의 제미나이-프로(Gemini-Pro)등의 AI 모델의 성능을 평가하였으며,

 

그 결과를 최근의 학술 논문으로 발표하였다.

 

해례의 이번 평가에서 네이버의 하이퍼클로바X는 오픈AI의 GPT-3.5-Turbo와

 

구글의 Gemini-Pro보다 높은 점수를 받았다.

 

특히 한국 특화 지식에 관한 평가 기준에서는 오픈AI의 GPT-4보다도 높은 점수를 받았다.

 

이러한 결과에 대해 네이버 측은

 

“일반 지식과 한국 특화 지식을 종합한 전반적인 성능이

 

글로벌 빅테크의 AI와 경쟁할 수 있는 수준임을 확인하였다”

 

“국가적으로 다르지만 정보 중요성이 큰 교육·법률 등의 산업 분야에서

 

하이퍼클로바X가 가장 유용할 수 있음을 보였다”

 

고 밝혔다.

 

KMMLU는 인문학, 사회학, 과학기술 등 다양한 45개 분야에서 전문가

 

수준의 지식을 검증하는 3만5030개의 문항으로 구성되어 있다.

 

이중에서 수학적 추론 능력과 같이 세계 공통으로 적용할 수 있는

 

‘광범위한 지식을 묻는 문항’이 약 80%를 차지하며, 지리·법률 등

 

한국 특화 문제 해결 능력을 평가하기 위한 문항은 20% 정도를 차지한다.

 

이러한 구성은 AI의 보편적 능력과 한국 맞춤형 지식을 고르게 측정할 수 있는 평가지표라는 평가를 받고 있다.

 

2. MMLU

빅테크 기업들, 특히 오픈AI와 구글등이 자사 AI 성능을 확인하는데

 

주로 사용하는 지표인 ‘MMLU’는 한국어로 번역해 적용하더라도 그 완전한 적합성이 미흡하다.

 

이는 MMLU가 주로 ▲문항 부정확성 ▲영어권 국가만의 문화적 맥락 등을 반영하고 있기 때문이다.

 

이러한 문제를 해결하고자 한국 특화 AI 모델의 성능을 정확하게

 

평가하기 위해서는 기존의 MMLU를 대체할 새로운 지표가 필요하다.

 

이에, 해례는 KMMLU라는 새로운 성능 평가 지표를 마련하였다.

 

KMMLU는 한국어 원본의 시험 문제들로 구성되어 있어 국내 및 외국 AI의

 

한국어 이해 역량을 보다 정확하게 평가할 수 있다.

 

네이버클라우드는 이러한 KMMLU를 통해 입증된 하이퍼클로바X의

 

성능 경쟁력을 바탕으로 ‘소버린(Sovereign·자주적인) AI’ 솔루션을 마련할 계획이다.

 

이는 한국의 문화적 맥락을 이해하고, 보안과 성능을 모두 갖춘 모델이라는 점에서 중요하다.

 

이를 통해 네이버클라우드는 한국의 AI 기술이 세계적 수준에 도달할 수 있음을 입증하였다.

 

뿐만 아니라, 네이버클라우드는 2023년 10월에 하이퍼클로바X를 사용하는 사내망을 폐쇄하고,

 

데이터 유출을 방지할 수 있는 하이브리드 클라우드 서비스

 

‘뉴로클라우드 포 하이퍼클로바X’(Neurocloud for HyperCLOVA X)를 기업 간 거래(B2B) 상품으로 출시하였다.

 

이렇게 하여 네이버클라우드는 기업들이 보다 안전하게 AI 기술을 활용할 수 있도록 지원하고 있다.

 

성낙호 네이버클라우드 하이퍼스케일(Hyperscale) AI 기술 총괄은

 

“하이퍼클로바X는 세계 공통의 보편 지식에 한국 특화 문제 해결 능력을 더한 소버린 AI로,

 

우수한 성능과 강력한 보안을 갖춘 솔루션을 제공하며, 국내 산업계 전반에서 도입이 이뤄지고 있다”

 

“자국어 중심 AI에 대한 전세계적 수요가 증가하고 있는 만큼,

 

한국에서 확인한 소버린 AI의 경쟁력을 바탕으로 향후 글로벌 시장 진출에도 속도를 낼 것”

 

이라고 전망했다.