로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
'헌정사상 첫 5선' 오세훈 서울시장, 풀어야 할 과제 '둘'
N
[IT뉴스]
전시장 바닥에 앉아 쉬는 젠슨 황 포착 …소탈한 '호랑이 경영자'
N
[IT뉴스]
한배 탄 라인게임즈와 카카오게임즈
N
[IT뉴스]
[컴퓨텍스 2026] 마우저 부스에 뜬 AI 로봇…음성으로 부품 검색한다
N
[실시간뉴스]
美, 쿠바 대통령·카스트로 가족 등 전·현 최고권력층 제재(종합)
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스][인터뷰] 해밀턴 WD 디렉터 "NVMe-oF, HBM 부담 덜 SSD 확장 계층 될 것"
온카뱅크관리자
조회:
13
2026-06-05 07:07:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">[반도체레이다]</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Qi4AMcsAln"> <p contents-hash="e40e48ce464c9a179998c914815d871b4e0031d52a859c3cced5bee98252ba16" dmcf-pid="xn8cRkOcvi" dmcf-ptype="general"><strong>[컴퓨텍스 2026] KV 캐시 폭증에 HBM 용량 압박…외부 SSD 계층 주목</strong></p> <p contents-hash="ffb7a3899be5bf17f46cd762896cb4ca422da4b38f3eb78fbd4d6ca31b7c3ff0" dmcf-pid="y5luY72uSJ" dmcf-ptype="general"><strong>OpenFlex Data24, 로컬 SSD 수준 성능…"고대역폭·저지연 구현"</strong></p> <div contents-hash="265b94cafd26275c550939a95db7fa40e6fccf66530c6209088758ed2a3e1086" dmcf-pid="WWmtlFztyd" dmcf-ptype="general"> <strong>"SSD는 빠른 처리, HDD는 장기 보관" AI 데이터 역할 분화</strong> </div> <figure class="figure_frm origin_fig" contents-hash="8fb261cf97c401e73b7778474c710c5065aec2e7357f2c62286929ff5e728d5d" dmcf-pid="YYsFS3qFWe" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/05/552796-pzfp7fF/20260605070018476epvn.jpg" data-org-width="640" dmcf-mid="6yQ7GzV7vo" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/05/552796-pzfp7fF/20260605070018476epvn.jpg" width="658"></p> </figure> <p contents-hash="60ce0d93541b7b71377949ce214206fa03b66a51af5c8be4c0b4f1a5b1ec318e" dmcf-pid="GGO3v0B3lR" dmcf-ptype="general">[타이베이(대만)=디지털데일리 고성현기자] "값비싼 GPU 자원이 놀지 않도록 구동시키기 위해서는 이를 계속 활용할 수 있는 SSD 자원이 필요하다. (AI 시스템이) 작은 모델을 넘어서면 데이터 용량이 메모리를 초과해 KV 캐시(Cache) 추가 운용이 필요해지기 때문이다. NVMe-oF의 핵심 개념은 더 많은 SSD 용량을 제공하는 확장 계층으로 이를 지원하는 데 있다."</p> <p contents-hash="78cd9a63feb0db76bb765cd0f29e614d33b6587ed5f3c8a509fdd94de4a6a817" dmcf-pid="HHI0Tpb0lM" dmcf-ptype="general">웨스턴디지털(WD)이 AI 데이터센터 내 최대 병목으로 꼽히는 메모리 용량 한계를 넘겠다는 포부를 드러냈다. 핵심 기술인 'NVMe-oF 패브릭' 플랫폼을 통해서다. 특히 이 플랫폼이 급증한 KV 캐시를 안정적으로 운용할 핵심 열쇠가 될 것으로 전망했다.</p> <p contents-hash="f8aa3204e30c735e049a748ae09fc900158a53801cdee1a841366c506fed5579" dmcf-pid="XXCpyUKphx" dmcf-ptype="general">스콧 해밀턴 WD 제품 관리·마케팅·소비자 경험(CX) 담당 시니어 디렉터는 3일 '컴퓨텍스 2026'이 열리는 대만 타이베이 난강전시관에서 <디지털데일리>와 만나 "작은 모델을 넘어서면 데이터 용량이 메모리를 초과해 문맥(Context) 또는 KV 캐시를 저장할 역량이 필요해진다"며 "우리의 NVMe-oF 패브릭 인클로저는 더 큰 모델을 위해 더 많은 데이터를 활용할 수 있도록 확장을 제공한다"며 이처럼 밝혔다.</p> <p contents-hash="64c007340d86f6bd980c99762f63c7507814387d3290b45e9bb82ba04b9ac8f7" dmcf-pid="ZZhUWu9UWQ" dmcf-ptype="general">WD는 글로벌 반도체 저장장치 제조사다. 낸드플래시 기반의 솔리드스테이트드라이브(SSD)와 플래터 기반 하드디스크(HDD) 등을 제조한다. 최근에는 AI 인프라 확대에 맞춰 고용량 HDD와 고대역폭·저지연성 SSD 포트폴리오를 구축하고 있다.</p> <p contents-hash="6b1c789f82e2304032b012db7ed523ae511e14acffb8ec21ba3174acabc62591" dmcf-pid="55luY72uhP" dmcf-ptype="general">최근 AI 인프라는 데이터 급증에 따라 GPU 메모리 용량과 데이터 공급 구조가 병목으로 떠오르고 있다. 이른바 메모리 장벽(Memory Wall) 문제다. 사용자의 요청(Query)이 복잡해지며 컨텍스트가 늘어나고, 쿼리 응답을 위해 계산했던 키-밸류(Key-Value) 값을 저장한 KV 캐시가 급증하면서 GPU가 연산 과정에서 활용하는 고대역폭메모리(HBM)의 용량 압박이 커진 영향이다.</p> <p contents-hash="2a73ad5edf0d640b9b930c7a415247cae488bfd55cb700dd8e399a8def5161c9" dmcf-pid="11S7GzV7T6" dmcf-ptype="general">이에 따라 최근 AI 인프라에서는 HBM에 모든 데이터를 담는 방식에서 벗어나 GPU 메모리, 호스트 D램, 로컬 SSD, 외부 SSD 등을 용도에 따라 나눠 쓰는 메모리 계층화 구조가 확대되고 있다.</p> <p contents-hash="15636775ce2dea7e95081a8734d62e212b6d4a32cab580459333b22edf418ad4" dmcf-pid="tbt6uPJ6h8" dmcf-ptype="general">WD는 메모리 계층화에 따른 대안으로 오픈플렉스(OpenFlex) Data24 4000 시리즈를 내세우고 있다. 이는 NVMe SSD를 고성능 이더넷 패브릭으로 공유하는 NVMe-oF 저장장치 플랫폼으로, 로컬 NVMe SSD와 유사한 성능으로 유연성 있는 용량을 제공하겠다는 방식이다. 이를 활용하면 HBM과 호스트 D램이 감당하지 못하는 KV 캐시 일부를 외부 SSD 계층으로 넘겨 저장할 수 있다. 또 저장장치 자원을 서버 내부에 묶어두지 않고 패브릭으로 공유해 총소유비용(TCO)을 낮출 수 있다.</p> <p contents-hash="f8a1aa4cf67520643422b182082e6fb7dd8c1d49c38b7ee31823aecf53f3a6b0" dmcf-pid="FKFP7QiPS4" dmcf-ptype="general">해밀턴 시니어 디렉터는 "우리는 KV 캐시 시나리오에서 다양한 테스트를 진행했고, 그 결과 NVMe-oF의 초당 토큰 수가 로컬 SSD의 수와 매우 가까웠다"고 강조했다.</p> <p contents-hash="10315699e84543deddf924b6c8d20e7d1fd886069cfca6459c111b3e94f21326" dmcf-pid="393QzxnQhf" dmcf-ptype="general">통상 이더넷 등 네트워크는 PCIe 등 직접 연결된 환경에 비해 대역폭이 낮다. 이로 인해 데이터 이동 속도가 줄어 GPU 자원이 제대로 활용되지 못하는 병목을 유발하는 요인으로 꼽혔다. 해밀턴 디렉터의 언급은 이더넷을 연결한 NVMe-oF가 GPU 랙 내에 장착된 로컬 SSD와 유사한 대역폭과 성능을 가져 데이터 병목 없이 활용할 수 있다는 뜻으로 해석된다.</p> <p contents-hash="86e5de33438866ec603e0942b51280e04aa5ade21fff5b05d431e27b363c40a0" dmcf-pid="020xqMLxvV" dmcf-ptype="general">WD가 최근 공개한 기술 리포트에 따르면 70B 모델과 H100 4개 기반 추론 노드에서 GPU HBM만 활용한 경우의 초당 생성 토큰 수(TPS)는 동시 대화 4개 처리 기준 34.39였다. 로컬 SSD를 활용한 경우 TPS는 33.94로 1.3% 줄었고, NVMe-oF는 33.79로 1.7% 감소했다. 두 방식의 차이는 0.4%포인트에 불과했다.</p> <p contents-hash="395adb8f5b797518e273dea5f11ad722e0be3c5c1e49e80f63587122a646111b" dmcf-pid="pVpMBRoMC2" dmcf-ptype="general">응답 지연도 크게 늘지 않았다. 첫 토큰 생성 시간(TTFT)은 NVMe-oF가 로컬 SSD보다 2.4~2.9% 짧게 측정됐다. WD는 P99 기준 최악 지연도 로컬 SSD와 원격 SSD 계층 간 차이가 거의 없었고, 모든 구성에서 실패율이 0%였다고 설명했다.</p> <div contents-hash="37d77e16ee99ff6b3e5f09511f39b3662ce0545356a22c3c4b229ccf82a4ec9b" dmcf-pid="UfURbegRC9" dmcf-ptype="general"> 이는 NVMe-oF 플랫폼이 네트워크를 거쳐 외부 SSD를 활용하더라도 로컬 SSD와 유사한 수준의 추론 처리량과 응답성을 제공할 수 있다는 의미다. </div> <figure class="figure_frm origin_fig" contents-hash="d5ba29a87b36836d347fab4d17b7c5c6f3aae2326d5b75b79c3ad8d029eb33b7" dmcf-pid="u4ueKdaelK" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/05/552796-pzfp7fF/20260605070019760xscs.jpg" data-org-width="640" dmcf-mid="PPRmLsvmhL" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/05/552796-pzfp7fF/20260605070019760xscs.jpg" width="658"></p> </figure> <p contents-hash="c6f8e2ccbab0e67e15d521f5fd8875f6a5f09fced53d3731186d59b5456c8071" dmcf-pid="787d9JNdWb" dmcf-ptype="general">해밀턴 디렉터는 NVMe-oF 기반 SSD가 메모리 부족 상황을 타개할 확장 계층의 역할을 할 것으로 봤다. 그는 "D램이 무한하다면 KV 캐시를 낸드플래시로 오프로드하지 않을 것"이라며 "D램이 무한하지 않다는 조건이라면 그것은 좋은 확장이고 좋은 계층"이라고 말했다.</p> <p contents-hash="cf5bea54f9909813ab8deb165260615484635b5d8026895ceda13c0ff7b8c501" dmcf-pid="zL6keEIklB" dmcf-ptype="general">또 NVMe-oF가 로컬 SSD와 유사한 성능을 내는 이유로는 자체 패브릭 브리지 구조를 꼽았다. 해밀턴 디렉터는 "NVMe-oF 플랫폼이 고대역폭·저지연인 이유는 PCIe를 이더넷으로 변환하는 패브릭 브리지 디바이스 때문"이라며 "그것은 ASIC이고 칩이다. 모든 데이터 경로가 하드웨어인 스테이트 머신을 통과하며 이는 매우 높은 성능을 낸다"고 설명했다.</p> <p contents-hash="4ce48b241cd9bcda603d9c68eab4b3c63b71d983e920f77dd98790742b9ee186" dmcf-pid="qoPEdDCEvq" dmcf-ptype="general">NVMe-oF의 또 다른 강점으로는 유연성을 꼽았다. 기존 로컬 SSD 방식은 GPU 서버 안에 저장장치를 직접 꽂아 쓰는 구조라 서버마다 용량이 고정된다. 이로 인해 어떤 서버에는 저장공간이 남고, 다른 서버에는 부족해도 자원을 쉽게 나눠 쓰기 어렵다. 반면 NVMe-oF는 SSD를 서버 밖의 공유 자원처럼 두고 여러 GPU 노드가 필요에 따라 접근하는 구조다. GPU 노드와 저장장치를 따로 늘리거나 줄일 수 있어 인프라 전체 운용 효율을 높일 수 있다.</p> <p contents-hash="d1669f739f7e2dd64a8c60b6f147cc18e7f3380ac324a10d172deea96331a2ee" dmcf-pid="BgQDJwhDvz" dmcf-ptype="general">해밀턴 디렉터는 "NVMe-oF의 핵심 개념은 더 많은 SSD를 제공하는 확장이라는 점"이라며 "로컬처럼 보이지만 로컬은 아니다 SSD 풀이 패브릭에 연결돼 있으면 더 필요할 때 더 많이 접근할 수 있다. 패브릭 위에 있기 때문이고 박스 안에 갇혀 있지 않다"고 강조했다.</p> <p contents-hash="ae2c4255b78499963a4de2992108220e9d31d88261634ba6273931fe3b0cf19f" dmcf-pid="baxwirlwl7" dmcf-ptype="general">특히 이 방식이 하이퍼스케일급 대형 데이터센터뿐 아니라 온프레미스, 엔터프라이즈, 클라우드 등 환경 전반에 적용될 수 있다고 전했다.</p> <p contents-hash="364ec12977fc95f050e58fb1124be2b4eb01fc9722f8de608074d1b19228430c" dmcf-pid="KNMrnmSrlu" dmcf-ptype="general">해밀턴 디렉터는 "AI 여정의 어디에 있든, 온프레미스든 소규모 기업이든 엔터프라이즈든 클라우드든 핵심은 결국 규모"라며 "GPU는 매우 비싼 장치고 이를 계속해서 유휴 상태가 되지 않게 사용해야 한다. 이를 위한 핵심은 결국 충분한 용량의 SSD를 제공하는 것"이라고 전했다.</p> <p contents-hash="c042fc65b12452bb1b1603e24edd1d3c3952b81497097ae0898d0d69324fdbb7" dmcf-pid="9jRmLsvmhU" dmcf-ptype="general">그는 WD의 주력 제품군 중 하나인 HDD 포트폴리오의 중요성도 강조했다. 당초 HDD는 SSD보다 제공할 수 있는 용량이 크지만 느려 AI 인프라에 부적합할 것으로 전망됐다. 하지만 AI 모델을 만들기 위한 원천 데이터, 학습·추론에 들어가는 과거의 중간 결과값을 보관하는 역할로 주목받고 있다.</p> <p contents-hash="e5d101f5941a8260e6209c1530b9f529238d4b8802cae350d9f7364f753e0955" dmcf-pid="2AesoOTsyp" dmcf-ptype="general">해밀턴 디렉터는 "현재 작업에 필요한 중간 저장값은 빠른 접근을 위해 SSD에 두는 경우가 많지만, 나중에 되돌아갈 수 있는 이전 버전들은 HDD에 저장되는 경우가 많다"며 "AI 데이터는 계속 쌓이기 때문에 이를 모두 SSD에 담기는 어렵다. 오래 보관할 수 있는 저장장치가 필요하고, 그 지점에서 HDD가 역할을 할 것"이라고 말했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기