본문 바로가기

AI 인터뷰 및 최신 동향

OpenAI 무라티, 카라 스위셔 인터뷰(2024.07.10)

 

OpenAI의 무라티가 좁스홉킨스 대학 블룸버그 센터에서 카라 스위셔와 인터뷰를 가졌다.

 

카라 : OpenAI가 넷스케이프(Netscape, 초창기 인기있던 웹 브라우저)처럼 처음에만 반짝하고 선두자리를 빼앗기진 않을까? 최근 애플과의 파트너십 발표를 하셨는데 관련해서 구체적인 내용을 알려주시라. 애플기기에서 사용된 데이터를 모델 훈련에 사용할 수 있나?

 

무라티 : 아니다, 현재 ChatGPT에서조차 우리는 고객들이 명시적으로 훈련에 사용해도 된다는 허락을 하지 않으면 모델 훈련에 사용할 수 없다. 애플은 프라이버시를 매우 중요시하는 기업이다. 이는 OpenAI의 미션과도 일치한다. 사람들이 우리의 기술을 신뢰하고 '통제할 수 있는' 기술로 바라보길 원한다. 따라서 저희와 애플 간의 파트너십은 어찌보면 자연스러운 현상일 수 있겠다.

 

카라 : 그럼 이런 대화가 어떻게 시작됐었나? 샘이랑 팀쿡이 만난 것 말이다

 

무라티 : 언제부터 이런 논의가 시작됐는지는 잘 기억이 나지 않는다. 꽤 오랫동안 진행된 논의였다.

 

카라 : 그럼 애플 말고도 또 이런 파트너십을 맺으려는 기업이 있나? 마이크로소프트는 잘 알려진 것이니 제외하고

 

 

이 질문에 몇 초간 무라티는 뜸을 들이고 멋적은 웃음을 지었다. OpenAI와 물밑 접촉을 하는 기업들이 있는 것으로 보인다.

 

카라의 팟 캐스트에는 매 에피소드마다 해당 도메인의 전문가를 초빙해 몇 가지 질문을 던진다.

이번에는 논문 인용수만 20만회를 넘는 페이페이 리의 질문을 받았다

 

 

페이페이 리 : 데이터에 대한 질문을 드리고 싶다. 단순히 어마어마한 '양'의 데이터를 모델에 먹일수록 더 성능이 좋아졌나, 아니면 큐레이팅을 통해 각각의 데이터의 '질'을 높이는 것이 더 유효했나.

 

무라티 : 많은 사람들이 오해하는 것이 있다. AI 모델의 개발자들은 AI가 특정 기능을 수행하도록 미리 프로그래밍을 하는 것이 아니다. 많은 양의 데이터를 모델이 섭취하게 하면, 놀랍게도 패턴을 익히게 되면서 모델은 '지능'이 생겨난다. 글을 쓰고 코딩, 수학을 하며 정보를 요약할 줄 알게 된다. 우리는 왜 이런 일이 발생하는지 아직 정확히 모른다.(주 : Anthropic CEO 다리오 아모데이 역시 이부분을 전체의 3%만 알고 있다고 설명했다. 최전선의 전문가들이 3%를 말할 때, 딥러닝을 단순히 통계머신이다 식으로 판정하고 생각을 멈추는 것은 진실로부터 멀어지는 행동이다. 자세한 것은 다리오 아모데이 인터뷰를 참고하자.) 하지만 이것이 잘 작동한다는 것은 알고 있다. 딥러닝은 매우 강력하다. 사람들은 계속해서 이 작동원리를 묻는다. 투명성 문제로 이어지는 사안이기 때문이다. 때문에 대형언어모델이 어떻게 작동하는지 이해하는 것이 중요하다. 물론 페이페이 리 교수님께서 말씀하신 것처럼 데이터를 모델에게 유용하게 만들기 위해서는 많은 작업이 필요하다. 

 

카라 : 3월에 Sora를 발표하면서 저널리스트 조안나 스턴과의 인터뷰를 하셨죠. 조안나는 OpenAI가 유튜브, 인스타그램, 페이스북의 동영상을 Sora 훈련에 사용하셨냐고 물었다. 당신은 '모른다' 고 했다. 정말 '몰라요'?

 

무라티 : 제가 그 질문에 잘 대처하지 못했다. 다시 설명해드리겠다. 구체적인 훈련 데이터 출처를 밝힐 수는 없지만 데이터의 범주는 공개적으로 사용가능한 데이터, 라이선스 및 거래를 통해 얻은 데이터, 사용자로부터 얻은 데이터다. 더이상은 경쟁력을 유지하기 위해 밝힐 수 없는 영업비밀이다.

 

카라 : 애쉬튼 커처가 Sora의 베타 버전을 써봤는데 정말 놀랍다고 했다. 사람들이 상상한 장면을 그대로 재현하기 시작하면 영화의 기준도 훨씬 더 높아질거라고 하는데, 지금은 상당히 조잡하지만 그 말이 타당하다고 보시는가. 그리고 Sora의 공개 릴리스는 언제쯤으로 보나?

 

무라티 : 현재 Sora의 릴리스 일정은 정해져있지 않다. 지금은 레드팀, 일부 크리에이터들에게 접근권한을 줘 모델을 더 강력하게 만드는 법을 연구하고 있다. DALL-E 도 처음에는 크리에이터들과 함께 작업했다. 

 

카라 : 사람들의 창의성을 확장하는 것이 목적이다는 뜻인데, 그럼 Sora는 챗봇보다 더 위험한 것 아닌가? 스칼렛 요한슨 포르노 같은 것이 쉽게 만들어질 수 있지 않나.

 

무라티 : 그렇다. 동영상은 다양한 문제가 있다. 따라서 안전문제를 해결하고 가드레일을 설정해야한다. 우리는 보통 소규모 그룹에 먼저 공개해서 미리 발견하지 못한 엣지 케이스를 찾으려고 노력한다. 

 

 

26:35, 카라가 GPT-5에 대해 질문한다

 

카라 : GPT-5는 점진적인 개선 정도인가? 아니면 커다란 성능 도약이 있을 것인가?

 

무라티 : 아직 모른다. 하지만 다음 모델은 매우 유능할 것이고 3에서 4로의 도약과 같은 큰 발전을 기대한다. 

 

카라 : GPT-5에는 어떤 기능이 있나?

 

무라티 : 글쎄, 아직 잘 모른다. 지켜보자.

 

카라 : 2027년까지 AGI를 달성할 수 있나?

 

무라티 : 우리가 정의하는 AGI는 모든 영역에서 경제적으로 가치있는 일을 할 수 있는 시스템을 말한다. 벤치마크나 시험점수보다 중요한 것은 실제 세계에서의 영향이다. (잠시 뜸을 들이다) 앞으로 10년 내로 매우 고도로 발전된 AI를 볼 수 있을 것이다. 다들 말하는 '지능적인 시스템' 말이다.

 

 

카라 : 초정렬팀을 이끌던 일리야 수츠케버, Jan leike 가 퇴사하고 안전을 담당하던 초정렬팀은 해체되었다. 안전에 매우 관심이 많다고 하면서 이런 분열같은 모습을 보인 것에 대해 다들 비판의 목소리를 내고 있다. 어떻게 생각하시나?

 

무라티: 먼저 초정렬팀은 안전을 담당하는 것이 아니다. OpenAI에는 다양한 안전 팀이 존재한다. OpenAI에 대해 우려의 목소리가 많은 것은 우리가 선도적인 위치에 있기 때문이라 생각한다. 

 

카라 : AI 종말론자들, 기타 비판적인 사람들은 OpenAI가 내놓는 제품들에 대해 "그들은 돈만 원하고, 피해는 염려하지 않는다"고 비판한다. 안전은 뒷전이고 너무 제품에만 신경쓴다는 이야기들인데.

 

무라티 : 그건 너무 냉소적인 의견이다. 우리에겐 인류를 위한 AI를 개발한다는 사명을 믿고 깊이 생각하는 인재들이 굉장히 많다. 

 

카라: 마이크로소프트와의 관계는 어떤가? 기술적으로 그들은 OpenAI의 지분 49%를 가진 것이나 다름없어 보인다. 그들과 나중에 관계가 끊어진다면 문제가 생기나?

 

무라티 : OpenAI와 마이크로소프트는 훌륭한 파트너다. 가장 발전된 형태의 슈퍼컴퓨터를 구축하기 위해서 긴밀하게 협력하고 있다. 그것은 AI 모델을 구축하는데 매우 중요한 요소다.