https://www.youtube.com/watch?v=cE5LbwLeAiY
DeepSeek R1: 충격적 저비용? 실제 비용과 구글의 대안 모델 분석
최근 AI 업계에서 가장 큰 화제를 불러일으킨 모델 중 하나가 바로 DeepSeek(DeepSeek) R1이다. 많은 언론과 전문가들이 이 모델의 '저비용' 학습 방식에 주목했지만, 실제 비용이 과연 저렴한 것인지에 대한 논란도 커지고 있다. 특히, 구글이 더욱 저렴한 AI 모델을 내놓으면서 DeepSeek R1과 비교되는 상황이 벌어지고 있다. 이번 블로그에서는 DeepSeek R1의 실제 비용을 분석하고, 구글의 대안 모델과 비교해 본다.
DeepSeek R1의 학습 비용 논란
DeepSeek R1은 기존의 AI 모델보다 훨씬 낮은 비용으로 훈련되었다는 점을 강조하고 있다. DeepSeek 측에서는 학습 비용이 557만 달러(약 74억 원) 정도 들었다고 발표했지만, 이 수치는 모델을 개발하는 과정에서 발생한 모든 비용을 반영한 것은 아니다.
논문의 세부 내용을 살펴보면, 이 비용은 최종적으로 한 번의 학습 과정만을 기준으로 계산한 것이다. 즉, 초기 개발 및 데이터 생성, 강화 학습 과정에서 발생한 여러 비용은 포함되지 않았다. 이는 마치 웨이트 트레이닝을 할 때, 여러 세트와 다양한 운동을 거쳐 몸을 단련하는 과정은 무시한 채, 단 한 번의 벤치프레스 비용만 계산한 것과 같다.
게다가 DeepSeek R1은 엔비디아의 H800 GPU를 사용해 학습되었으며, 206,660 GPU 시간(GPU-hour)을 사용했다. 하지만 이 과정에서도 모델을 최적화하고 검증하는 데 들어간 추가적인 비용이 빠져 있다는 점을 감안하면, 실제 비용은 훨씬 더 높을 가능성이 크다.
구글 제미나이(Gemini) 모델과의 비교
이러한 논란 속에서 구글은 더욱 저렴한 모델을 내놓으며 DeepSeek R1과의 경쟁에 나섰다. 대표적으로 제미나이(Gemini) 2.0 플래시(Flash) 모델이 있다. 이 모델은 빠른 추론 속도를 제공하면서도 비용이 매우 저렴하게 책정되었다.
AI API 비용을 비교해 보면, DeepSeek R1은 100만 토큰당 약 2달러로 계산되지만, 제미나이 2.0 플래시는 이보다 더 저렴한 가격을 책정하고 있다. 특히, 제미나이 2.0 플래시는 단순히 비용이 저렴할 뿐만 아니라 성능 면에서도 경쟁력을 갖추고 있어 주목할 만하다.
게다가 구글의 AI 생태계는 이미 견고하게 자리 잡고 있어, 개발자들이 쉽게 활용할 수 있다는 점에서도 강점이 있다. 따라서 단순히 비용 측면에서뿐만 아니라 실제 활용성과 확장성 면에서도 DeepSeek R1보다 유리한 측면이 많다.
강화 학습(RLHF)의 비용 증가 문제
DeepSeek R1이 강조하는 또 다른 기술적 특징은 강화 학습(RLHF, Reinforcement Learning from Human Feedback) 기반의 모델 개선이다. 이는 AI가 사람이 생성한 데이터를 학습하는 기존 방식과 달리, AI가 직접 데이터를 생성하고 이를 다시 학습하는 방식을 의미한다.
그러나 강화 학습 과정에서는 단순한 학습을 반복하는 것보다 훨씬 많은 연산 비용이 들어간다. 기존의 AI 모델은 한 번 학습된 데이터셋을 기반으로 최적화되지만, 강화 학습 기반 모델은 스스로 학습하는 과정을 반복하면서 추가적인 연산이 필요하다.
이러한 점을 고려하면, DeepSeek R1이 단순히 'GPU 비용이 적게 들었다'는 주장만으로 저비용 모델이라고 보기 어렵다. 학습 과정에서 소요된 실제 비용이 과소 평가되었을 가능성이 크기 때문이다.
결론: DeepSeek R1은 정말 저비용 모델인가?
DeepSeek R1이 기존 빅테크 기업들의 AI 모델보다 효율적으로 학습된 것은 사실이지만, 발표된 비용이 모든 학습 과정을 반영한 것은 아니라는 점을 고려해야 한다. 최종 학습 비용만을 기준으로 비교하는 것은 적절하지 않으며, 구글 제미나이 2.0 플래시와 같은 더욱 저렴하고 강력한 대안 모델이 등장하면서 DeepSeek R1의 경제성 논란은 더욱 심화될 전망이다.
AI 업계의 경쟁이 점점 치열해지는 가운데, 단순한 숫자 비교가 아니라 실제 학습 방식과 활용성, 그리고 장기적인 비용 효율성을 고려하는 것이 더욱 중요해지고 있다. 앞으로도 AI 모델 간의 성능과 비용 경쟁은 계속될 것이며, 이에 대한 면밀한 분석이 필요하다.
댓글