본문 바로가기
세상 잡학/IT

구글이 내놓은 '초인공지능' 구분 기준

by 코토 잡학 2023. 11. 22.

구글이 인공일반지능(AGI)인지를 측정하는 기준을 내놓았다.

 

의식이나 이해와 같은 추상적 개념보다 실제적인 능력을 기준으로 삼아야 한다는 내용이다.

 

그리고 0~6 레벨 중 '레벨 2'를 넘는 현존 AI 모델은 없다는 결론을 내렸다.

 

 

구글의 초인공지능 구분 기준

구글 딥마인드 연구진의 성과

1. AGI의 정의

 

벤처비트는 최근 구글 딥마인드 연구진이 성능과 일반성, 자율성 수준 등을

기준으로 AGI 여부를 구분할 수 있는 프레임 워크를 공개했다.

 

연구진은 가장 먼저 AGI의 정의에 집중했다.

 

이를 설명하기 위해 가장 흔하게 사용하는

 

●튜링 테스트

● 커피 테스트

● 대학 시험

● 취업 시험

● 이케아 테스트

 

연구진은 더 포괄적인 프레임워크를 제공하기위해 6가지 기준을 제안했다.

 

● AGI의 측정은 인간과 같은 이해, 의식, 감각과 같은 특성보다 '능력'에 초점을 맞춰야 한다.

 

● AGI 측정은 일반성과 성능을 모두 고려해야 한다.

즉  AGI 시스템은 광범위한 작업을 수행할 수 있을 뿐만 아니라 실행 면에서도 뛰어나야 한다.

 

● AGI에는 인지 및 메타인지 작업이 필요하지만, 구체화 및 물리적 작업이

AGI의 전제 조건으로 간주해는 안 된다 등이 담겼다.

 

● 법적, 사회적 고려 사항은 물론 잠재적인 윤리적 및 안전 문제와 같은

비기술적 장애물로 능력 발휘를 저하하는 것을

막기 위해 배포를 고려하지 않은 능력치를 측정해야 한다.

 

● AGI 지표는 사람들이 가치 있게 여기는 실제 작업,

즉 '생태학적으로 타당한' 작업 수행에 초점을 맞춰야 한다.

 

● 이를 통해 정해진 AGI의 수준을 정하는 것은 최종 결론이 아닌,

다양한 수준으로 확대하는 '과정'으로 이해해야 한다는 것이다.

 

2. 오픈AI 챗GPT의 레벨은?

 

연구진은 AI를 '레벨 0(AI가 아닌 상태)'부터

'레벨 5(인간 능력을 모두 넘는 초인공지능)'까지 6단계로 구분했습니다.

 

이는 AI의 다양한 발전 가능성을 나타내는 중요한 지표입니다.

 

'좁은 의미의 사례'는 특정 작업에 뛰어난 성능을 보이는 AI의 예시이고,

'범용적인 예'는 다양한 작업에서 전반적으로 뛰어난 능력을 갖춘 AI를 의미합니다.

 

하지만, 현재로서는 모든 조건을 충족하는 레벨 5 모델,

즉 AGI 또는 ASI(초인공지능)은 아직 존재하지 않습니다.

 

이는 AI 기술의 한계와 아직 해결되지 않은 과제를 보여주는 것입니다.

 

AI 연구는 계속해서 진행되고 있으며, 앞으로 더 많은 발전이 기대됩니다.

 

특정 부분에서 AGI의 요건을 충족하는 모델로는

 

▲ 단백질 생성 AI인 '알파폴드'

▲알파고의 후속 모델로 바둑은 물론 체스와 일본 장기(쇼기)까지 학습한 '알파제로'

▲컴퓨터 체스대회를 휩쓴 세계에서 가장 강력한 체스 엔진 '스톡피시' 등을 예로 들었다.

 

또한, 현재 최고 성능을 보이는 대형언어모델(LLM)인 '챗GPT', '바드', '라마 2'

등은 레벨 1로 분류되며, 이는 '능숙하지 않은 인간과 비슷하거나 조금 나은 수준'을 의미합니다.

 

다음 단계인 레벨 2 '능숙한(Competent)'에 해당하는

언어모델은 아직 존재하지 않는 것으로 정의되었습니다.

 

이는 레벨 1과 비교하여 더 높은 수준의 언어 이해와 처리 능력을 갖춘 모델을 의미합니다.

 

 

마무리

 

연구원들은 매트릭스가 실제 수준과 일치하지 않을 수 있다고 지적했다.

 

현재 프롬프트 스킬로는 성능을 얻기 어렵기 때문에

이론적인 수준보다 낮은 수준이 나올 수 있다고 설명했다.

 

딥마인드는 AGI 벤치마크가 유용한 기준이지만,

모든 과정을 포함하는 것은 불가능하다고 인정했다.

 

따라서, 새로운 작업을 추가하고 합의를 위한 프레임워크를 포함해야 한다고 강조했다.

 

또한, 딥마인드는 AI가 인간 작업을 보조하는 낮은 자율성 수준에서도

인간의 숙련도를 떨어뜨리고 현 산업 구조를 붕괴할 위험이 있다고 지적했다.

 

자율성이 증가하면 콘텐츠 조작, 광범위한 사회적 혼란 등

심각한 피해를 초래할 수 있다고 밝혔다.

 

벤처비트는 딥마인드의 프레임워크에도 AI를 비난하는 요소와 자체적인 단점이 있다고 언급했다.

 

이는 AGI 개발 과정에서 진전을 측정하기 위한 포괄적인 가이드라인이라는 의미가 있다고 평가했다.