챗GPT로 승부수 둔 OpenAI vs 반격에 나선 Google... AI시대 승자는 누구?

바드, GPT3.5, GPT4에게 “오늘 서울 날씨 어때?” 물었더니
KDI 경제정보센터 자료연구팀 ‘초거대 AI기술 동향’ 소개

바로 ‘챗GPT’가 그 주인공이다. 블록체인, 메타버스, NFT 열풍을 거쳐 단순히 다음 차례로 넘어온 걸까? 구글 검색 트렌드에서는 2022년 초 정점을 찍은 NFT 검색량은 감소하고, 작년 말부터 챗GPT가 빠르게 치고 올라왔다. 사진=오픈AI

올해는 ‘AI 격전의 해’가 될 전망이다. 생성 AI 시장을 선점한 OpenAI는 과연 시장 지배자가 될 것인가. KDI 경제정보센터 자료연구팀이 ‘e경제정보리뷰’ 코너를 통해 공개한 ‘글로벌 AI기술 동향’을 요약·소개한다.

2022년 말, 전(全) 세계를 뒤흔들 새로운 게임 체인저가 등장했다. 바로 ‘챗GPT’가 그 주인공이다. 블록체인, 메타버스, NFT 열풍을 거쳐 단순히 다음 차례로 넘어온 걸까? 구글 검색 트렌드에서는 2022년 초 정점을 찍은 NFT 검색량은 감소하고, 작년 말부터 챗GPT가 빠르게 치고 올라왔다.

챗GPT는 대규모 언어 모델(Large Language Model, LLM) 기반의 생성 인공지능(Generative AI) 인터페이스에 속한다. 간단히 말해 인간의 뇌 구조를 모방한 인공신경망이 다량의 데이터를 학습해 마치 사람처럼 응답하는 챗봇이라고 할 수 있겠다.

이들은 단순히 정해진 일정 범위 내에서 응답하던 수준에서 벗어나 일반 검색 기능을 제공하는 건 물론이고 학교 과제, 자기소개서, 업무 보고서를 의도에 맞게 작성하고, 심지어 요청에 따라 이미지나 동영상을 생성하기도 한다.

소위 ‘초거대 AI’로 불리는 인공지능에 대한 정의를 찾아보면, ‘사전 훈련 언어 모델(Pre-trained Language Model, PLM)’, ‘대규모 언어 모델(Large Language Model, LLM)’, ‘파운데이션 모델(Foundation Model)’, ‘생성 AI(Generative AI)’ 등의 용어가 통상적으로 등장한다. 물론 국내외 쓰임새가 다르고, 개념적으로 혼재돼 있어 이들 간의 관계를 명확히 설명하기에는 한계가 있다.

그럼에도 하나의 중론은 자연어 처리(Natural Language Processing, NLP) 분야의 언어 모델(Language Model)이 기술적 진보에 따라 대규모화되며, 그 개념과 범위가 확장됐다는 점이다. 어릴 적 독서를 많이 한 친구가 독해나 작문 역량도 뛰어나듯이, 대규모 언어 모델은 약간의 추가 학습(transfer learning)을 거치면 질문 응답, 번역, 정보 요약 등 다양한 일(task)을 수행하는 독특한 능력이 발현됐다.

초거대 AI를 둘러싼 쟁탈전은 이미 시작되었다. 초거대 AI 개발은 방대한 데이터와 고성능 컴퓨팅 파워가 필수인 만큼, 이를 감당할 수 있는 빅테크 기업을 중심으로 이뤄져 왔다. 초거대 AI 경쟁이 본격화된 시점은, 2020년 OpenAI가 1750억 개에 달하는 매개변수를 가진 GPT-3를 선보이면서다. GPT-3의 등장으로 매개변수가 많을수록 성능이 뛰어나다는 통념이 자리 잡으며, 점차 크기 경쟁에 불이 붙게 됐다. 2021년 구글의 Switch-C는 1.6T, 중국 베이징 AI 아카데미(BAAI)의 Wu Dao 2.0은 무려 1.75T에 달한다.

OpenAI의 야심작이라고도 할 수 있는 챗GPT는 앞선 초거대 언어 모델인 GPT-3.5와 GPT-4를 기반으로 탄생한 대화형 생성 AI 챗봇이다. ‘바드(Bard)’는 구글이 챗GPT의 대항마로 내세운 생성 AI 챗봇이다. 대규모 언어 모델 람다(LaMDA)를 기반으로 탄생한 바드는 2023년 3월 베타 버전으로 공개된 후 같은 해 5월 세 가지 언어(영어, 한국어, 일본어)로 이용할 수 있는 안정화 버전으로 전 세계 180개국에 전격 출시됐다. 자료=KDI 경제정보센터 자료연구팀

그렇다면 기업들이 초거대 AI에 주목하는 이유는 무엇일까? 바로 산업 전반에 걸친 ‘범용성’이다.

GPT-3.5를 챗봇으로 구현한 챗GPT만 하더라도 검색엔진 시장의 게임 체인저로 거론되는 등 상당한 사회적 파장을 몰고 왔다. 특히, AI 챗봇은 초거대 AI가 맞붙은 첫 격전장인 만큼 시사하는 바가 크다. 현재 OpenAI의 ‘챗GPT’와 구글의 ‘바드(Bard)’가 AI 최전선에서 힘겨루기를 하고 있고, 이에 질 수 없는 중국의 바이두, 한국의 네이버 등에서도 관련 서비스 출시를 예고한 상황이다.

챗GPT를 개발한 OpenAI는 2015년 12월, 샘 알트먼(Sam Altman), 일론 머크스(Elon Musk), 피터 틸(Peter Thiel) 등이 공동으로 설립한 미국의 AI 연구소다. OpenAI는 GPT-1을 시작으로 GPT-2, GPT-3, DALL·E, 챗GPT, 최근에는 GPT-4까지 연이어 선보이며 그 위세를 이어가고 있다.

2019년 3월에는 자회사 OpenAI LP를 출범하며 한 차례 구조적 변화를 꾀하기도 했다. 투자자가 투자금의 100배 이상을 벌지 못하도록 제한하는 수익 제한 기업에 해당했지만, 연구소의 초기 설립 목적과 달리 기술 사업화로 나아가려는 시도로 풀이되면서 AI 생태계에 적잖은 파동이 일었다. 여기서 마이크로소프트(MS)와 맺은 독점적 파트너십은 논란을 더 키웠다. 실제로 2023년 3월, OpenAI·MS 연합군은 검색엔진 빙(Bing)에 GPT-4 급 모델을 탑재한 챗봇 서비스를 출시하며 구글 추격에 나섰다.

GPT-1에서 GPT-3에 이르기까지 OpenAI 언어 모델의 가장 큰 변화는 파라미터 수와 학습 규모가 대폭 증가했다는 점이다. GPT-1은 1억 1,700만 개, GPT-2는 15억 개, GPT-3는 1,750억 개로, 이는 전(前) 버전 대비 각각 12.8배, 117배 상승한 수치다. 더욱이 570GB에 달하는 웹 데이터를 학습한 GPT-3부터는 모델을 재훈련하지 않아도 몇 가지 예시만 주면 번역과 요약, 글쓰기 등의 작업에 우수한 성과를 내기 시작했다. 이를 인컨텍스트 러닝(In-context learning)이라고 하는데, 모델의 규모가 클수록 예시를 잘 활용하는 특성이 나타났다. 특히 퓨샷 러닝(Few-shot learning)에서 그 성능이 두드러졌다.

한계도 있다. 인간이 관여하지 않은 GPT-3는 인터넷에 떠도는 가짜 뉴스와 편견들을 받아들여 허위 정보를 생산하곤 했다. 이에 OpenAI는 ①사람이 작성한 질문-답변 꾸러미로 GPT-3를 훈련시키고, ②GPT-3가 생성한 응답에 순위를 매긴 후, ③그 피드백을 다시 훈련에 활용함으로써 모델의 성능을 향상시켰다. 이 과정을 인간의 피드백을 반영한 강화학습(RLHF, Reinforcement Learning from Human Feedback)이라고 하며, 이로써 탄생한 것이 챗GPT(GPT-3.5)다.

OpenAI의 야심작이라고도 할 수 있는 챗GPT는 앞선 초거대 언어 모델인 GPT-3.5와 GPT-4를 기반으로 탄생한 대화형 생성 AI 챗봇이다. GPT-3.5는 무료, GPT-4는 유료로 제공된다는 점도 다르지만, 두 버전의 가장 큰 차이는 이미지 인식 여부에 있다.

GPT-4는 현재 ‘플러그인’과 ‘웹브라우징’이라는 두 날개를 달고 더욱 높이 비상하고 있다. 애드인(add-in)으로도 불리는 ‘플러그인(plugin)’은 간편히 설치하고 사용하는 소프트웨어를 의미한다. 게임 캐릭터가 장착한 장비 아이템을 떠올리면 쉽다. 옵션이 다른 아이템을 때때로 바꿔 끼우듯이 GPT 또한 다른 기능들을 제공하는 플러그인을 장착해 능력치를 극대화할 수 있다.

혹자는 챗GPT를 아이폰, 플러그인을 iOS 앱스토어에 버금가는 새로운 생태계의 탄생으로 보기도 한다. ‘플랫폼 위의 플랫폼’이라는 말이 나올 정도로 챗GPT가 여러 플랫폼 기능들을 흡수하며 하나의 거대한 플랫폼으로 거듭나고 있다.

구글은 명실상부 AI 분야 세계 최고 수준의 기업으로, 챗GPT의 선조 격인 트랜스포머(Transformer) 알고리즘을 탄생시킨 곳이기도 하다. 1위 자리를 굳건히 지켜오던 구글이 어쩌다 생성 AI 시장에서 OpenAI에 주도권을 내어 주게 된 걸까?

월스트리트저널(WSJ)은 구글이 챗GPT와 유사한 AI 챗봇을 먼저 개발하고도 출시를 머뭇거리다 때를 놓쳤다고 진단했다. AI 챗봇 미나(Meena)가 그 예다. 2020년 개발된 미나는 회사 내부의 공정성·안정성 기준을 충족하지 못해 출시가 한 차례 무산된 바 있다. 이후 미나 연구팀은 ‘람다(LaMDA)’로 프로젝트명을 바꾸고 연구개발을 지속해 왔으나 람다 또한 비슷한 이유로 대중에 공개되지 못했다. 이처럼 구글은 편향성과 오류를 가진 완벽하지 않은 AI가 회사의 평판과 사회에 미칠 파급력을 크게 우려해 왔다.

이러한 구글의 행보는 챗GPT가 등장한 2022년을 기점으로 크게 바뀌게 된다. 완벽한 기술과 신뢰성 확보 대신 속도전을 택한 것이다. 그 일환으로 2023년 4월, 구글은 내부 AI 연구팀인 ‘구글 브레인’과 알파벳 자회사인 ‘딥마인드’를 구글 직속 ‘구글 딥마인드’로 통합했다. 이는 회사 안에서 라이벌 관계였던 두 부서를 하나로 편성해 생성 AI 경쟁에 본격적으로 참전하겠다는 선전포고와도 같다. 같은 해 5월에는 AI 챗봇 ‘바드(Bard)’를 180개국에 공개한 데 이어 AI 챗봇 ‘스패로우(Sparrow)’, 검색 엔진과 챗봇 기능을 통합한 ‘SGE(Search Generative Experience)’ 서비스 출시도 예고하면서 역습에 나섰다.

‘바드(Bard)’는 구글이 챗GPT의 대항마로 내세운 생성 AI 챗봇이다. 대규모 언어 모델 람다(LaMDA)를 기반으로 탄생한 바드는 2023년 3월 베타 버전으로 공개된 후 같은 해 5월 세 가지 언어(영어, 한국어, 일본어)로 이용할 수 있는 안정화 버전으로 전 세계 180개국에 전격 출시됐다. 바드의 가장 큰 특성은 실시간 정보를 제공할 수 있다는 데 있다.

바드와 GPT-3.5(무료), GPT-4(유료) 각각에 “오늘 서울 날씨 어때?”를 물어봤다. 바드 및 GPT-4는 날씨에 대해 응답했으나, GPT-3.5는 실시간 정보를 얻을 수 없는 한계점을 설명할 뿐 적절한 정보를 내놓진 못했다. GPT-4의 경우에도 유료 구독과 함께 웹브라우징 기능을 적용해야 실시간 정보를 얻을 수 있는 반면 바드는 이 모든 정보가 무료로 제공된다는 점에서 큰 차이가 있다.

OpenAI(·MS)와 구글의 양강 구도는 점차 국가 간 기술 패권 전선으로 확대되고 있다. 각종 언론과 보고서에서 미국, 중국, 이스라엘, 그리고 우리나라를 초거대 AI 보유국으로 꼽고 있는 이유다. 메타, 바이두, 알리바바, AI21 labs(이스라엘) 등 각국의 기업들이 초거대 AI 관련 서비스를 앞다퉈 출시하고 있는 만큼 주도권 다툼은 한층 치열해질 전망이다.

실제로 챗GPT나 바드 외에도 메타의 ‘블렌더봇 3’, 구글 딥마인드의 ‘스패로우’, 바이두의 ‘어니봇’ 등이 현재 데모 버전으로 공개됐거나 출시가 예정돼 있다. 이 글에서는 언어모델과 텍스트 기반의 AI 챗봇을 주로 다뤘지만 텍스트뿐만 아니라 이미지, 음성, 영상 등 다양한 분야별 생성 AI도 활발히 개발되고 있다.

국내에서는 현재 네이버(하이퍼클로바), 카카오(코GPT), SKT(에이닷), KT(믿음), LG(엑사원) 등의 빅테크 기업들이 생성 AI 전쟁에 참전해 있다. 최근 보도에 따르면, 네이버는 오션(OCEAN) 기반의 검색 챗봇 ‘큐:(Cue:)’와 ‘하이퍼클로바X’ 라는 차세대 모델을 출시할 계획이다. 카카오도 한국어 특화 언어 모델 ‘코GPT 2.0’과 챗봇 ‘코챗GPT(가칭)’를 선보일 예정이라고 한다. 다만, GPT-4의 한국어 수준(77%)이 크게 늘고, 구글 바드가 한국어를 정식 서비스 언어로 지원하면서 한국어 특화 전략을 취한 국내 기업들의 입지가 흔들릴 수 있다는 관측도 나오는 상황이다.

우리는 현재 챗GPT가 주도하는 거대한 변화의 파도에 올라타 있다. 가트너(Gartner)의 하이프 사이클에 따르면, 기술의 성장 주기는 ‘①기술 출현’, ‘②기대 정점’, ‘③환상 소멸’, ‘④기술 성숙’, ‘⑤안정기’의 다섯 단계로 이뤄진다. 아무리 뛰어난 기술이라도 정점을 지나 거품이 걷히는 단계가 오듯이, 초거대 AI와 생성 AI 또한 예외가 아니다. 기술적 결함(할루시네이션주10))과 차별적이고 편향된 텍스트 생성, 악의적 사용 등의 문제가 여전히 해결해야 할 과제로 남아있다. 기술이 성숙 단계로 진입할 수 있도록 모델 자체의 개선(편향 감소, 투명성 제고 등)과 함께 활용 가이드라인, 데이터 보호, 사회적 공정성 등의 이슈를 다루는 공개적인 토론과 합의 과정이 중요한 시점이다. [자료=KDI 경제정보센터 자료연구팀, 정리=백두원 마켓뉴스 기자]

백두원 기자 다른기사 보기