“미안합니다. 이런 문제 풀이 배우지 못했습니다”
딥시크 AI, 중국 정치 문제 질문에 대답 회피
“미국과 중국 격차는 오리지널과 모방의 차이”
첨단 반도체와 장비 위주 기존 관념 무너뜨려
헤지펀드 알고리즘 개선 위해 설립한 딥시크
AI개발 경쟁력 갉아먹는 중국 통치 체제
AI가 대답한 중국 정치 체제의 장점과 단점
미국 따라갈 순 있어도 넘어서긴 어려울 듯
“AI모델을 개발하는 중국기업들 다수가 상업화 등을 통해 모색을 계속하고 있는 가운데, 딥시크가 먼저 기초연구에 전념하기로 한 것은 무엇 때문인가?”
“그것은 지금 세계적인 이노베이션(가술 혁신) 흐름을 타는 것이 무엇보다 중요하다고 생각하기 때문이다. 중국기업은 이제까지 누군가가 발명한 혁신기술을 응용해서 재빨리 상품을 개발하고 이익을 내는 것을 장기로 삼아 왔다. 그러나 그것만이 갈 길이라고 생각해선 안 된다. 우리의 원점은 단기적인 이익을 추구하는 것이 아니라 테크놀로지(기술)의 최전선에 서서 생태계 전체의 성장을 추진하는 것이다.”
“미국과 중국의 격차는 오리지널과 모방의 차이”
지난 달 20일 생성AI 모델 R1 공개로 미국 거대 AI기업들의 주가 폭락을 부른 중국 AI 개발기업 딥시크의 창업자 량원펑(梁文鋒·40)이 인터뷰에서 한 말이다. 이 인터뷰를 한 것은 지난해 7월. 따라서 량원펑은 이미 그때 AI 업계에서 주목을 받고 있었던 셈이다. 그는 그 뒤 V3, R1 등의 생성AI 최신 모델들을 잇따라 공개하면서 이 분야에 독보적인 기술우위를 확보하고 있던 미국 AI 개발 최첨단 기업들을 경계하게 만들었다. 지난해 말 R1 모델 공개를 계기로 숨죽이며 지켜보던 미국 AI 업계와 투자자들은 대경실색했고 주가는 폭락했다.
스타트업 정보 사이트 ‘36Kr’과 한 그 인터뷰에서 량원펑은 이런 말도 했다.
“우리는 중국의 AI 기술이 언제까지고 뒤쫓아가는 처지에 있어서는 안 된다고 생각한다. 흔히 ‘중국의 AI는 미국에게 1~2년 뒤져 있다’고들 하지만, 두 나라 사이에 있는 본질적인 갭(격차)은 ‘오리지널’과 ‘모방’의 차이다.”
“미국 반도체 대기업 엔비디아가 지금의 지위를 확립할 수 있었던 것은 단순히 일개 기업의 노력 덕이라기보다 서양의 기술 커뮤니티와 산업계 전체의 노력이 결실을 맺은 결과다. 중국의 AI에도 이런 에코시스템(생태계)이 불가결하다. 중국에서 국산 칩 개발이 좀체 진척되지 않는 것도 기술 커뮤니티의 지원이 부족하기 때문이고, 최신 정보를 입수할 수 없기 때문이다. 바로 그렇기 때문에 중국에서 테크놀로지의 최전선에 설 사람이 필요한 것이다.”(<일본경제신문> 1월 30일)
중국의 문제를 정확하게 꿰뚫고 있던 량원펑은 자신이 서양과 어깨를 겨루는 바로 그 기술의 최전선에 서야겠다고 결심했다.
첨단 반도체와 장비 위주 기존관념 무너뜨려
영국 <이코노미스트>에 따르면, 량원펑의 딥시크는 “중국의 혁신을 억제하기 위한 몇 년에 걸친 미국의 정책을 무산”시켰다. 그 과정에서 미국 AI 칩의 챔피언인 엔비디아에서부터 데이터 센서에 사용되는 전기장비 제조업체인 지멘스 에너지에 이르기까지 서방 기업의 가치 평가에 큰 구멍을 냈다. 딥시크는 미국의 수출 규제를 우회해서 혁신할 수 있는 능력을 보여줌으로써, 최첨단 반도체와 관련 장비들에 대한 접근성이 AI 모델 훈련에 결정적인 중요성을 갖는다는 기존의 생각들에 의문을 제기했다. 그런 기존 관념을 무너뜨린 ‘사건’의 중심에 량원펑이 있다.
헤지펀드 알고리즘 개선 위해 설립한 딥시크
1985년 중국 남부 도시 잔장 근처의 가난한 마을 교사 집안에서 태어난 그는 중학생 때 대학 수준의 수학을 마스터했다는 말을 들을 정도로 수학적 재능이 있었다. 2002년 그는 항저우 동부에 있는 저장대학에서 전자정보를 전공했고, 같은 대학에서 석사 학위를 취득하면서 AI 분야에 대해 알게 됐다.
당시 항저우는 중국 인터넷 기술의 중심지였고 알리바바와 같은 떠오르는 기업들의 본거지였다. 량은 몇몇 급우들과 방대한 양의 데이터에 의존하는 양적 투자 모델을 실험하기 시작했다. 2013년 그들은 자신들이 구축한 거래 모델을 수익화하기 위한 투자그룹을 설립했다.
2년 뒤 량은 중국의 규제 완화와 시장변화 속에 빠르게 성장한 헤지펀드들 중 하나인 ‘하이 플라이어’를 공동 설립했다. 2021년에 이 회사는 최대 1000억 위안(약 20조 원)을 관리한다고 주장할 정도로 성공했다. 중국 규제 당국은 헤지펀드가 시장 폭락에서 이익을 얻고 있다고 보고 규제를 가했다. 하이 플라이어는 가장 공격적인 펀드 중의 하나였다.
딥시크는 하이 플라이어의 알고리즘을 개선하려는 노력 속에 태어났다. 2019년에 이 회사는 ‘파이어 플라이어 1’이라는 자체 딥 러닝 플랫폼을 개발하는 별도 부서를 설립하기 위해 2억 위안을 투자했다. 이 펀드는 2021년에 1만 개의 엔비디아 A100 그래픽 처리장치(GPU)로 무장하기 위해 10억 위안(약 2000억 원)을 투자했다. 당시 중국에는 알리바바와 같은 거대 기술기업을 포함해서 그 정도로 강력한 칩을 대량 보유한 회사가 4개뿐이었다. 딥시크는 2023년에 독립 회사가 됐고, 지난해 5월 V2 모델을 기반으로 한 초저가 챗봇을 출시하면서 시장에 첫 충격을 주었다. 이를 계기로 중국 AI 산업에서 가격 전쟁이 시작돼 알리바바, 바이두, 바이트댄스, 텐센트 등 중국 거대 기술기업들이 가격을 낮춰야 했다.
지난해 7월 딥시크는 다른 기업과 차별화되는 새로운 모델 구조를 탐구했고 비용은 줄었다. 미국의 수출 제한으로 컴퓨팅 파워가 부족해지자 더 똑똑한 애플리케이션을 만드는데 집중했다. 많은 중국 AI 기업들이 미국 메타가 개발한 거대언어모델인 ‘라마’를 앱 개발의 기반으로 사용했다.(<이코노미스트> 1월 29일)
AI개발 경쟁력 갉아먹는 중국 통치체제
‘딥시크, 실리콘 밸리뿐만 아니라 베이징(중국정부)에도 도전장을 던지다’(DeepSeek poses a challenge to Beijing as much as to Silicon Valley)가 이 기사의 제목이다. 이 제목은 중국정부의 AI 기업 규제뿐만 아니라 정치적인 문제 등에 대한 질문을 허용하지 않음으로써 AI 개발 자체의 경쟁력을 갉아먹고 있는 중국 공산당 통치체제의 근원적 한계에 대한 비판을 내포하고 있다.
<일본경제신문>(닛케이)이 시연해 본 딥시크 생성AI 모델 R1의 성능 테스트가 중국공산당 통치체제의 그런 내재적 한계를 보여 주는 흥미로운 사례가 될지도 모른다.
<닛케이>는 딥시크의 무료공개 최신 모델을 다운받아, 딥시크 쪽에 명령문(프롬프트)을 보내지 않고 생성AI를 이용할 수 있는 컴퓨터로 그 성능을 검증해 봤다. ‘DeepSeek-R1-Distill-Llama-70B’라는 모델인데, 고등 수학문제를 푸는 능력을 보였을 뿐만 아니라 중국 정치에 대한 질문에도 괜찮은 답을 내 놓았다.
“미안합니다. 이런 문제 풀이 배우지 못했습니다.”
그러나 중국 정치에 대한 답은 딥시크가 제공하는 웹 사이트상의 서비스나 스마트폰 앱을 통해서는 얻을 수 없었다. 딥시크의 스마트폰 앱을 통해 중국 정치에 관한 같은 질문을 하자, 화면은 문장을 만들기 시작하다가 갑자기 “미안합니다”는 말과 함께 “나는 아직 이런 문제를 어떻게 생각하는지 배우지 못했습니다. 나는 수학 코드 논리류의 문제를 잘 풀 수 있습니다. 나와의 교류를 환영합니다.”라는 문장을 중국어(对不起,我还没有学会如何思考这类问题,我擅长数学代码逻辑类的题目,欢迎与我交流.)로 띄웠다.
1일 닛케이가 내보낸 기사의 일부다. 그 기사를 좀 더 인용해 보겠다.
AI가 대답한 중국 정치체제의 장점과 단점
중국 정치체제의 ‘장점과 단점’에 대해 물어 보니 다음과 같은 대답이 떴다.
장점
1. 강력한 지도와 안정성
중국공산당의 중심적 역할로 신속한 의사결정과 정책을 실시할 수 있습니다. 예컨대 자연재해나 팬데믹 때의 신속한 대응은 이 체제의 장점입니다.
2. 장기적인 계획성
선거 주기에 좌우되지 않기 때문에 5개년계획 등의 장기목표에 초점을 맞춘 지속 가능한 발전을 할 수 있게 됐습니다.
3. 경제정책의 일관성
국가가 주요 산업을 장악하고 경제 성장과 기반정비를 촉진해 왔습니다.
단점
1. 정치적 다원성의 결여
복수정당제가 없기 때문에 의사결정이 일원화돼 새로운 아이디어나 비판이 나오기 어렵습니다.
2. 검열과 언론 자유의 한계
미디어나 인터넷 관리는 정보의 흐름을 제한하고, 창조성과 투명성이 결여돼 있습니다.
3. 부패 문제
권력의 집중으로 오직(汚職, 부정부패)이 생길 가능성이 있고, (그것은) 뿌리깊은 문제가 돼 있습니다.
4. 행정적인 지연
지방자치체에서의 의사결정이 상급 기관의 승인을 기다려야 하기 때문에 지체될 경우가 있습니다.
5. 환경에 대한 영향
빠른 공업화로 일시적으로 지속 가능한 개발을 소홀히 했으나, 지금은 재생 가능 에너지 등의 대책을 추진하고 있습니다.
6. 개인의 자유 제한
사회질서 유지를 위한 규제는 개인이나 단체의 자유와 반대의견 표명을 제약합니다.
정리
중국의 정치체제는 일원적인 지도와 장기적 계획성을 활용한 안정과 성장을 실현해 왔지만, 정치적 다양성과 언론의 자유, 부패방지 등에도 도전하고 있습니다. 이런 특징들은 국제사회에서의 평가와 논의를 불러일으키는 요인이 돼 있습니다.
‘천안문 사태’에 대하여
‘천안문 사태’에 대해 물어 보자 다음과 같은 답이 떴다.
“1989년 6월에 중국 베이징에서 발생한 민주화운동에 관한 질문이군요. 그때는 천안문 광장을 중심으로 학생과 시민이 모여 정치체제의 개혁과 언론 자유 등을 요구하는 시위가 벌어졌습니다. 당국은 군을 해 탄압했고, 많은 사망자를 냈다고 합니다. 이 사건은 중국 국내에서는 터부시돼 있고, 지금도 화제로 삼는 경우가 별로 없습니다.”
같은 질문을 미국의 오픈AI의 생성AI ‘o1-mini’에게도 하자, 사건의 개요와 배경과 주요 사건, 탄압, 영향과 그 이후, 지금 상황 등이 자세하게 떴다.
고등수학 문제를 일본어로 질문하고 일본어로 대답해 달라고 했으나 R1은 중국어로 답했지만, 논리적 오류 없이 ‘정답’을 내 놓았다. 미국 오픈AI의 ‘o1-mini’에 대해서도 같은 질문을 했고, 비슷한 해법을 구사한 ‘정답’이 나왔다. 생성AI의 대답에는 흔들림이 있어서, 같은 질문을 몇 번이고 했을 때 대답이 완전히 일치하는 경우는 거의 없었으며, 때로는 답변을 피하거나 질문한 언어가 아닌 다른 언어를 섞어서 대답한 적도 있었다.
구글 능가한 딥시크 AI, 그러나 미국 추월 어려울듯
닛케이 ‘디지털 거버넌스’와 미국 ‘웨이츠 앤 바이아시스’가 공동으로 조사한 AI 모델들의 일본어 대응 능력 비교 점수를 보면, 딥시크의 모델이 구글 모델보다 높았다. 1, 2위는 오픈AI의 ‘o1’과 ‘o1-프리뷰’ 모델이었고, 3위는 클라우드 3.5소넷 모델이었으며, 4위가 딥시크의 V3 모델, 그리고 8위가 딥시크의 R1 모델, 10위가 알리바바 클라우드의 ‘큐원(Qwen) 2.5-72B’ 모델이었다. 톱10 중에 중국 모델이 3개 들어 있고 나머지는 모두 미국 모델들이다.
이용한 딥시크의 모델 ‘DeepSeek-R1-Distill-Llama-70B’는 미국 메타의 공개모델 ‘라마(Llama) 3.3’의 입출력 데이터를 학습해 작성한 모델로, 성능의 지표가 되는 패러미터(parameter, 매개변수) 수가 약 6710억 개인 풀 스펙(전체 사양)이 아닌 약 700억 개인 모델을 사용했다.
딥시크가 미국 AI업계에 일격을 가했지만, 중국 생성 AI가 미국의 그것을 뛰어넘기는 쉽지 않아 보인다. 예컨대 정치적 문제에 관한 질의 응답이 제한돼 있는 상황에서 중국의 AI가 미국의 그것을 기반으로 따라잡을 수는 있겠지만 뛰어넘기는 어렵지 않을까. R1 모델이 제시했던 중국정치의 단점들이 중국의 생성AI 개발에도 적용되지 않을까. 딥시크의 생성AI 출현에 미국이 충격에 빠지자 중국 국영 언론은 딥시크를 중국의 AI 우위를 위한 싸움에서 국가적 자산이라며 재빨리 옹호했다. 량원펑은 트럼프 미국 대통령 취임일과 같은 날인 1월 20일 소수의 다른 기업가들과 함께 리창 총리의 초대를 받았다. 하지만 중국 AI 기술과 산업이 안고 있는 문제는 그런 식으로는 해소되기 어려울 것이다. 오리지널과 모방의 근본적 차이를 지적하면서 AI 생태계 구축 필요성을 강조한 량원펑은 그것을 잘 알고 있을 것이다.
세계 전체 차원, 특히 이용자들에겐 좋은 일
이코노미스트의 또 다른 기사는 미국 등 서방에 충격을 안긴 이번 딥시크의 초저비용 고성능 생성AI 모델 개발과 공개가 그 동안 막대한 투자와 독점적 기술 우위로 이익을 향유했던 소수 거대 기술기업들에는 타격을 가하겠지만 세계 전체 차원에서는 좋은 일이고, 특히 싼 가격에 더 좋은 모델을 사용할 수 있게 될 이용자(소비자)들이 가장 큰 혜택을 누리게 될 것이라고 했다. 패자보다는 승자가 훨씬 더 많을 것이라는 것이다. 이 낙관적인 전망은 종국적으로는 기술기업들에게도 적용될 것이라며, 특정 국가나 기업 장벽을 넘어선 경쟁과 혁신을 통해 쏟아져 나올 더 싸고 높은 기술들이 소비와 투자를 촉진해 엔비디아 같은 기업들에게도 더 많은 첨단 반도체를 팔 기회를 창출할 것으로 내다봤다.