세계 최강의 반도체 설계자로 알려진 짐 켈러가 설립한 스타트업 Tenstorrent가 새로운 AI 칩인 Wormhole 시리즈를 발표하면서 NVIDIA의 GPU 시장 주도권에 도전장을 내밀고 있습니다. 이번에 출시된 N150과 N300 칩은 HBM을 사용하지 않고도 고성능을 자랑하며, 특히 저전력과 고효율성에 초점을 맞추고 있습니다. 본 글에서는 Tenstorrent의 신제품인 Wormhole 칩의 사양과 짐 켈러의 업적, NVIDIA와의 비교, 그리고 향후 발전 가능성에 대해 자세히 살펴보겠습니다.
칩 사양
Tenstorrent의 Wormhole 칩은 다음과 같은 두 가지 모델로 출시되었습니다:
N150 칩
- TDP: 160W
- FP8 연산 성능: 262 TFLOPS
- 메모리: HBM 대신 GDDR 사용
- 연결성: PCIe 및 Ethernet 지원
N300 칩
- TDP: 300W
- FP8 연산 성능: 4665 TFLOPS
- 메모리: HBM 대신 GDDR 사용
- 연결성: PCIe 및 Ethernet 지원
이 두 모델은 높은 연산 성능과 함께 저전력 설계가 특징입니다. HBM을 사용하지 않음으로써 비용 절감과 함께 효율성을 극대화하였습니다.
짐 켈러
짐 켈러는 반도체 설계 분야에서 전설적인 인물입니다. 그의 주요 업적은 다음과 같습니다:
- AMD K7 및 K8 아키텍처: 고성능 CPU의 초석을 다졌습니다.
- Apple A4 및 A5 프로세서: 모바일 기기에서의 성능 혁신을 이끌었습니다.
- AMD Zen 아키텍처: AMD의 CPU 성능을 극대화하며 시장 점유율을 높였습니다.
그의 설계 철학은 항상 성능과 효율성의 균형을 맞추는 데 중점을 두었으며, 이는 Tenstorrent의 Wormhole 칩에도 고스란히 반영되어 있습니다.
짐 켈러: 반도체 설계의 전설
짐 켈러(Jim Keller)는 반도체 설계 분야에서 전설적인 인물로 손꼽히며, 그의 경력은 40년에 걸쳐 여러 주요 기업에서 중요한 역할을 맡아왔습니다.
주요 경력과 업적
1. Digital Equipment Corporation (DEC)
켈러는 1984년 DEC에 합류하여 초고속 Alpha 칩을 설계하는 팀의 일원으로 활동했습니다. Alpha 칩은 당시로서는 놀라운 속도인 500 MHz로 동작하며 1 GHz의 메모리 캐시를 갖추고 있었습니다.
2. AMD
1998년 AMD에 합류한 켈러는 Athlon (K7) 프로세서와 K8 마이크로아키텍처의 설계에 중요한 역할을 했습니다. 특히 K8 아키텍처는 x86-64 명령어 세트와 HyperTransport 인터커넥트를 도입하여 서버 시장에서 AMD의 입지를 강화했습니다. 2012년 다시 AMD로 돌아와 Zen 아키텍처 개발을 주도하며, AMD가 인텔과의 경쟁에서 다시 우위를 점할 수 있도록 했습니다.
3. Apple
2008년 Apple에 합류한 켈러는 A4와 A5 시스템 온 칩(SoC) 프로세서를 설계했습니다. 이 프로세서들은 iPhone 4, 4S, iPad, iPad 2 등 여러 Apple 제품에 사용되었습니다.
4. Tesla
2016년 Tesla에 합류하여 자율주행 하드웨어 엔지니어링 부문 부사장으로 활동하며, 자율주행 차량을 위한 칩 설계를 주도했습니다.
5. Intel
2018년 Intel에 합류하여 수석 부사장으로 활동하며, Intel의 칩 설계 부문을 재정비하는 데 기여했습니다.
6. Tenstorrent
2020년 AI 칩 스타트업 Tenstorrent의 CTO로 합류한 후, 2023년 CEO로 임명되었습니다. Tenstorrent에서는 AI 관련 반도체 개발을 주도하고 있습니다.
짐 켈러의 중요성
짐 켈러는 다양한 반도체 아키텍처(x86, PowerPC, MIPS, ARM)를 설계하며 반도체 산업의 여러 중요한 변곡점에서 핵심적인 역할을 했습니다. 그의 설계 철학은 복잡한 문제를 단순화하고, 효율성을 극대화하는 데 중점을 두고 있습니다.
이러한 접근 방식은 AMD의 K8 아키텍처, Apple의 A4/A5 프로세서, Tesla의 자율주행 칩 등에서 두드러지게 나타났습니다.켈러의 경력은 단순한 기술적 성취를 넘어, 반도체 산업 전체에 걸쳐 큰 영향을 미쳤습니다. 그의 혁신적인 설계는 여러 기업들이 시장에서 경쟁력을 유지하고, 새로운 기술적 도전에 대응할 수 있도록 도왔습니다.
NVIDIA와의 비교
NVIDIA는 GPU 시장에서 오랜 기간 동안 강자로 군림해 왔습니다. 그러나 Tenstorrent의 Wormhole 칩은 다음과 같은 점에서 NVIDIA의 제품과 차별화됩니다:
- 성능 대 비용: Wormhole 칩은 높은 성능을 제공하면서도 비용 효율성이 뛰어납니다.
- 전력 소비: NVIDIA의 GPU는 높은 전력 소비를 특징으로 하는 반면, Wormhole 칩은 저전력 고효율을 자랑합니다.
- 확장성: Wormhole 칩은 다중 칩 구성에서의 확장성을 지원하여 대규모 컴퓨팅 시스템 구축에 유리합니다.
이러한 점에서 Tenstorrent의 새로운 AI 칩은 NVIDIA의 GPU를 대체할 수 있는 경쟁력 있는 대안으로 떠오르고 있습니다.
확장성과 스케일러빌리티
Wormhole 칩은 단일 칩으로도 강력한 성능을 자랑하지만, 다중 칩 구성을 통해 더욱 강력한 컴퓨팅 파워를 제공합니다. 이는 대규모 AI 모델 훈련이나 데이터 분석 작업에 최적화된 환경을 구축할 수 있게 합니다. Tenstorrent는 향후 Nebula와 Blackhole 프로젝트를 통해 AI 처리 성능을 한층 더 강화할 계획입니다.
Tenstorrent Wormhole AI 칩의 중요성 및 NVIDIA 칩과의 비교
Tenstorrent Wormhole AI 칩의 중요성
Tenstorrent의 Wormhole AI 칩은 AI 처리 성능과 비용 효율성에서 중요한 혁신을 가져왔습니다. 이 칩들은 특히 AI 개발자와 스타트업에게 매력적인 선택지를 제공합니다. 주요 특징은 다음과 같습니다:
- 성능: Wormhole n150은 160W TDP에서 262 TFLOPS의 FP8 성능을 제공하며, n300은 300W TDP에서 4665 TFLOPS의 성능을 자랑합니다.
- 비용 효율성: n150과 n300의 가격은 각각 $999와 $1,399로, 시장에서 경쟁력 있는 가격을 제시합니다.
- 확장성: 이 칩들은 이더넷을 통해 멀티칩 메쉬 네트워크를 지원하여 워크스테이션과 서버에서 확장 가능한 구성을 제공합니다.
- 개발자 친화적: 두 개의 오픈 소스 SDK(TT-Buda™와 TT-Metalium™)를 통해 고수준 및 저수준 개발을 지원합니다.
NVIDIA 칩과의 비교
Wormhole 칩과 NVIDIA 칩의 주요 차이점은 다음과 같습니다:
아키텍처 | RISC-V 기반 Tensix 코어 | CUDA 기반 GPU |
메모리 | GDDR6 메모리 사용 | HBM 메모리 사용 |
성능 | n150: 262 TFLOPS, n300: 4665 TFLOPS | H100: 1670 TFLOPS (FP8) |
전력 소비 | n150: 160W, n300: 300W | H100: 300W |
가격 | n150: $999, n300: $1,399 | H100: 약 $30,000 |
확장성 | 이더넷 기반 멀티칩 메쉬 네트워크 지원 | NVLink 기반 인터커넥트 지원 |
시장 평가
Tenstorrent의 Wormhole 칩은 다음과 같은 이유로 시장에서 긍정적인 평가를 받을 가능성이 높습니다:
- 비용 효율성: NVIDIA의 고가 GPU에 비해 훨씬 저렴한 가격으로 높은 성능을 제공하여, 특히 예산이 제한된 AI 스타트업과 연구기관에 매력적입니다.
- 확장성 및 유연성: 이더넷을 통한 멀티칩 메쉬 네트워크 지원으로 다양한 규모의 AI 워크로드에 유연하게 대응할 수 있습니다.
- 개발자 친화적 환경: 오픈 소스 SDK와 개발자 키트를 통해 AI 소프트웨어 개발을 촉진하고, 개발자 커뮤니티의 성장을 지원합니다.
결론적으로, Tenstorrent의 Wormhole AI 칩은 성능, 비용 효율성, 확장성 측면에서 NVIDIA의 기존 GPU에 대한 강력한 대안으로 평가받을 수 있습니다. 이는 AI 시장에서 새로운 경쟁 구도를 형성할 가능성이 큽니다.
결론
짐 켈러의 전문 지식과 Tenstorrent의 혁신적인 기술이 결합된 Wormhole AI 칩은 효율적이고 비용 효율적인 솔루션을 제공함으로써 NVIDIA의 GPU 시장 점유율에 도전하고 있습니다. 이번 칩의 출시로 AI 및 고성능 컴퓨팅 분야에서의 경쟁이 한층 더 치열해질 것으로 예상되며, 이는 결국 소비자에게 더 나은 제품과 서비스를 제공하는 결과로 이어질 것입니다.
댓글