Scale AI, 알렉산드르 왕 인터뷰 (25.01.24)

MinasAnor 2025. 1. 24. 14:55

진행자 - 쇼에 처음으로 모십니다. 스케일 AI(Scale AI)의 창업자이자 CEO인 알렉산더 왕입니다. 이 회사는 기업들이 AI 툴을 학습시키는 데 필요한 정확하게 라벨링된 데이터를 제공합니다. 그리고 2022년에는 세계에서 가장 어린 자수성가 억만장자가 되었습니다. 정말 대단하죠.

알렉산드르 - 초대해 주셔서 감사합니다.

진행자 - 우선 카메라 꺼진 상태에서 조금 얘기했던 주제, 즉 미국과 중국의 AI 격차에 대해 바로 들어가고 싶습니다. 이와 관련해 상당히 놀라운 통계를 갖고 계신다고 들었는데, 그걸 보면 시청자들이 솔직히 좀 겁을 먹을 수도 있을 것 같아요.

알렉산드르 - 네, 우선 미국과 중국 사이의 AI 경쟁, 그리고 AI 전쟁은 오늘날 가장 중요한 이슈 중 하나라고 생각합니다. 저희는 화요일자 워싱턴포스트에 전면 광고를 실어서 “미국이 AI 전쟁에서 이겨야 한다”라고 주장했습니다. 그래서 미국과 중국 사이의 이 AI 경쟁은 매우 중요합니다. 오늘 저희는 Humanity's Last Exam(인류의 마지막 시험)이라는 새로운 AI 모델 평가, 즉 벤치마크를 발표했는데요. 수학, 물리, 생물학, 화학 교수님들께 최근 연구와 관련된, 상상할 수 있는 가장 어려운 질문들을 제공받아서 모델들이 이 시험을 보게 했습니다. 이 시험에서 그 어떤 모델도 10% 이상의 점수를 내지 못했습니다. 그럼에도 불구하고, 저희가 발견한 사실은 중국의 대표적인 AI 연구소인 DeepSeek의 모델이 가장 뛰어나거나, 미국의 최고 모델들(o1)과 거의 동등한 수준이라는 것입니다.

(실제로 DeepSeek 모델은 o1보다 다소 높은 성적을 보였다. xAI 안전이사 댄 헨드릭스가 담당한 벤치마크라 객관성이 보장되었음에도 불구하고 말이다. 다만, DeepSeek R1은 멀티모달이 아니었기 때문에 텍스트 문제로만 나온 결과로, 100% 동등한 조건은 아니었으며, 멀티모달에서 어처구니없는 실수들이 나오는 현 시점 기준, 다소 유리한 조건임은 감안해야한다.)

진행자 - 그렇군요, 그러니까 지금까지 우리는 중국이 AI 분야에서 미국을 따라오기에는 아직 멀었다고 생각해 왔잖아요. 그중 중요한 이유가, 미국은 NVIDIA GPU 같은 칩에 접근할 수 있는데 반해 중국은 그렇지 못하다고들 했으니까요. 그런데 이번 주 내내, 중국 AI 업계 사람들로부터 “우리는 정말 얼마 안 남았다. 게다가 한 손을 등 뒤에 묶고 싸우는 상황인데도 우리 알고리즘이 더 낫다. 우리는 결국 이걸 미국보다 더 잘 해낼 거고, 더 에너지 효율적으로도 만들어낼 거다. 왜냐하면 우리는 그렇게 강력한 칩이 필요 없으니까”라는 얘기를 듣고 있습니다. 그들이 옳았던 건가요?

알렉산드르 - 두 가지 측면이 있습니다. 첫째, 지금까지 미국이 앞서 있었다는 건 사실입니다. 이미 지난 10년 동안은 계속 그랬죠. 그런데 최근에 있었던 일이, 바로 한 달 전 크리스마스에 DeepSeek이 모델을 발표했다는 겁니다. 사실 저는 이것이 상징적이라고 생각합니다. 중국의 연구소가 크리스마스라는 날을 골라, 나머지 모두가 휴일을 즐기는 동안 엄청난 파급력을 가진 모델을 발표했으니까요. 그리고 상당한 화제를 모았죠. 이어서 DeepSeek R1이라는 추론 모델을 내놓았는데, 이게 저희가 평가해 본 결과 리더보드 1위를 차지했습니다. 그러니까 사실이 “그렇기도 하고 아니기도 한” 상태입니다. 예를 들어, 중국 연구소들은 사람들이 생각하는 것보다 더 많은 H100을 갖고 있는데…

진행자 - 그게 바로 NVIDIA의 최고성능 칩, 원래라면 중국이 확보하면 안 되는 칩이죠?

알렉산드르 - 맞습니다. 제가 알기로 DeepSeek이 약 5만 개의 H100을 갖고 있는 것으로 알고 있고, 이건 물론 미국의 수출 통제에 위배되므로 그들이 공개적으로 말할 수 없는 부분이죠. 그래서 생각보다 칩을 많이 확보한 건 사실이라고 봅니다. 하지만 동시에 향후에는 미국의 칩 수출 통제 때문에 제한을 받을 수밖에 없을 겁니다.

진행자 - 여러분은 사실 모든 업체와 함께 일하시잖아요. 그래서 이것이 공정한 질문인지 모르겠지만, 이런 대형 언어 모델들을 순위를 매긴다면 누가 최종적으로 우승할 것 같나요? 아니면 이 모델들이 워낙 비슷해서 결국 상품화(commoditized)되어 버리는 걸까요?

알렉산드르 - 지금 우리가 보는 흥미로운 점은, 저희가 실제로 이런 평가를 전문적으로 하고 있다는 겁니다. 저희는 SEAL 평가, 안전성(safety) 평가, Alignment Labs 평가 등을 진행해서 여러 가지 차원을 측정하죠. 수학적 능력, 코딩 능력, 다국어 능력, 추론 능력 등 다양한 측면을 보며, 도구 사용 능력이나 에이전트 기능 같은 것들도 평가합니다. 그 결과, 모델마다 잘하는 분야가 다릅니다. 그래서 모든 모델을 명확히 서열화하기는 어렵죠. 예를 들어, OpenAI 모델은 추론에 매우 뛰어난 반면, Anthropic 모델은 코딩에 뛰어날 수 있거든요. 이렇게 모델들이 저마다 장점이 다르죠. 그렇지만 전반적으로 보면 경쟁이 줄어드는 게 아니라 오히려 점점 치열해지고 있다는 게 저희가 내린 결론입니다.

진행자 - 여기서 만나는 비즈니스 리더들 얘기를 들어보면, 다들 OpenAI를 써보기도 하고, Anthropic 모델인 Claude도 써보고, 구글의 Gemini도 써보고, 그다음에 Llama 같은 걸로도 넘어가 본다고 해요. 오픈소스 버전을 찾아서 다른 모델들과 비슷한 수준을 구현해 보려고 하는 거죠. 가격 차이가 있으니 말이에요. 앞으로도 이런 식이 계속될 거라고 보시나요?

알렉산드르 - 글쎄요, 리눅스 세계와 비슷한 측면이 확실히 있다고 봅니다. 결국, 여러분이 해결하고자 하는 과제에 필요한 능력과 지능의 수준이 어느 정도냐에 달려 있죠. 제 생각에는 결국, 저희가 OpenAI, 구글 딥마인드, 메타 같은 주요 연구소들과 협력해 왔던 것처럼, 업계가 계속해서 한계를 밀어붙이고 첨단을 개척해 나갈 거라고 봅니다. 이미 공개된 데이터를 거의 다 소진해 가는 상황이니, 어떻게 새로운 데이터를 생성해서 진보를 이어 나갈 것인가 하는 문제도 있죠. 저희가 믿는 바는, 고도화된 능력이 나타나면 굉장히 놀라운 활용이 가능해질 거고, 사람들은 그 향상된 기능을 위해 기꺼이 비용을 지불할 거라는 겁니다. 반면 단순한 용도에는 오픈소스나 좀 더 기본적인 모델들이 쓰일 거예요.

(*여기서 스타게이트 프로젝트 이야기가 나온다.)

진행자 - 오늘 오전 내내, Stargate라는 프로젝트 얘기와 더불어, 트위터에서 샘 올트먼과 일론 머스크가 “1000억 달러냐 5000억 달러냐”를 두고 설전을 벌이는 이야기를 했습니다. 사티아 나델라는 어제 이 자리에 앉아서 “나는 800억 달러만 투자한다”라고 했고, 트위터에 글을 올리기도 했죠. 이 상황을 어떻게 보시나요? 다들 트위터(지금은 X)에서 온갖 얘기를 쏟아내고 있는데 말이에요.

알렉산드르 - 뭐, Stargate라는 특정 프로그램의 존재 여부와 상관없이 확실한 건, 미국이 앞으로 엄청난 양의 계산 자원과 인프라를 필요로 하리라는 점입니다. 사실 저희가 트럼프 행정부에 보냈던 서한에도, 미국이 어떻게 AI 선도국 자리를 지킬 수 있을지에 대한 제안 중 하나로 “인프라” 문제를 강조했어요. AI 붐을 뒷받침하려면 미국의 에너지를 대폭 개방해야 한다는 겁니다. 지금 실제로 그렇게 흘러가고 있죠. Stargate 프로그램과는 별개로, 대부분의 AI 기업들이나 주요 클라우드 회사들이 엄청난 규모의 데이터센터 건설을 추진하려고 하고 있습니다.

(*알렉산드르의 관측대로 조만간 스타게이트를 잇는 초대형 인프라 건설 소식들이 잇다를 것으로 예상된다.)

진행자 - 그래서 기업들이 이렇게 앞다투어 첨단 모델을 만들고 있는 상황을 보면서 드는 생각이, 결국 우리가 5~7개 회사가 동시에 프런티어 모델을 만들 필요가 있느냐는 거예요. 예를 들어, 만약 리나 칸이 FTC(연방거래위원회)를 이끌고 있지 않았다면, 아마존이 이미 Anthropic을 인수했을 수도 있고, 마이크로소프트가 OpenAI를 인수했을 수도 있고, 이런 식으로 합종연횡이 이루어졌을 수도 있잖아요. 그러면 지금처럼 이렇게 모두가 경쟁하는 상황이 아닐 수도 있고요. 혹은 경쟁이 좋다고 보실 수도 있겠지만, 장기적으로 이런 모델이 이렇게 많이 존재하는 게 가능할까요?

알렉산드르 - 제 생각에는, 이 시장이 어쩌면 역사상 가장 큰 시장—혹은 가장 큰 산업—이 될 수도 있다고 봅니다. 지금 LLM(대형 언어 모델) 기반 매출이 대략 100억에서 200억 달러 규모라고 치면, 만약 우리가 진짜로 초지능(Superintelligence)이나 AGI(범용 인공지능) 쪽으로 가고 있다고 믿는다면, 이 시장이 1조 달러 이상의 매출로 성장할 것이라고 예상할 수 있습니다. 즉 100억 달러에서 1조 달러로 성장할 수 있는 시장인 거죠. 그리고 그게 몇 년이나 걸릴지는 모르지만, 저는 시간이 그렇게 오래 걸리지 않을 거라고 봅니다. 개인적으로는 2~4년 정도라고 생각해요.

(*현 100억달러 규모에서 100배 커진 1조달러 매출로 커지는데 2~4년밖에 걸리지 않는다는 이야기는 대단히 파격적인 이야기다.)

진행자 - AGI까지 2~4년이라니요. 그럼 AGI를 어떻게 정의하시는지 궁금하네요.

알렉산드르 - 음, 정의가 여러 가지가 있을 수 있죠. 제가 믿는 정의는, 우리처럼 컴퓨터를 사용할 수 있고, 컴퓨터가 할 수 있는 모든 도구를 활용할 수 있으며, 사실상 원격 근무자(remote worker)의 역할을 완벽히 수행할 수 있는 강력한 AI 시스템을 의미합니다.