로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
정청래만 때리는 송영길… 鄭낙선 배드캅?
N
[IT뉴스]
에릭 징 젠스파크 CEO “한국에도 AI 창작의 불꽃 밝힐 것”
N
[IT뉴스]
[위클리AI] 앤트로픽·퀄컴·오픈AI, 영역 확장 본격화...성과에 관심 집중
N
[IT뉴스]
[자동차와 法] 자동차가 ‘위험한 물건’이 되는 순간…’난폭·보복운전’
N
[IT뉴스]
[AI는 지금] "韓 모델 또 누락"…'AI 3강' 노린 정부, 스탠포드 지표 정조준
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]화웨이, 차이나모바일 후베이와 ‘AI 추론 가속 솔루션’ 상용망 검증
온카뱅크관리자
조회:
6
2026-06-30 17:47:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">토큰 처리량 최대 3.7배 향상...중국 통신 업계 최초</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="5P1cx3Rfg3"> <p contents-hash="85794dde750d456f23b6293d60f95b5791d29b70f75daa29bb8a60607e47399f" dmcf-pid="1QtkM0e4gF" dmcf-ptype="general">(지디넷코리아=홍지후 기자)화웨이가 장문 AI 추론의 토큰 처리량을 최대 3.7배 끌어올리는 AI 추론 가속 솔루션을 중국 통신 업계 최초로 상용망에서 검증하는 데 성공했다.</p> <p contents-hash="99b377f84b1944188d1aaaf1773466a081de7a04b98b9637125d77673ef29cae" dmcf-pid="tZk21wFYNt" dmcf-ptype="general">화웨이는 지난 24일부터 26일까지 중국 상하이에서 열린 MWC 상하이 2026에서 차이나모바일 후베이와 이같은 성과를 공개했다고 30일 밝혔다.</p> <p contents-hash="9fdd1fa85015ed177b4f054fda587f9464566a0df96886b642554d707ca4cb58" dmcf-pid="F5EVtr3Gk1" dmcf-ptype="general">솔루션은 화웨이 오션스토(OceanStor) A800 스토리지와 어센드 A3 슈퍼팟, 통합 캐시 관리자(UCM)가 기반이다. 이를 통해 통신사가 AI 컴퓨팅 서비스를 배포할 수 있는 토대를 마련했다.</p> <p contents-hash="ef13f699f8b1d51c6338c5e918801fdbcde300335cb57048e08aa4f5c1e572eb" dmcf-pid="31DfFm0Hk5" dmcf-ptype="general">화웨이는 지난해 UCM을 선보였다. 기존 온칩 메모리와 D램의 제한적 용량이 KV 캐시 적중률을 떨어뜨려 AI에이전트 전체 성능을 저하시키는 문제를 해결하기 위해서다.</p> <figure class="figure_frm origin_fig" contents-hash="0eade2871b552b9542a97c80fc696977bab9b9b43b1cb8ac2a618f7eea3993f2" dmcf-pid="0tw43spXAZ" dmcf-ptype="figure"> <p class="link_figure"><img alt="화웨이는 지난 24일부터 26일까지 중국 상하이에서 열린 MWC 상하이 2026에서 장문 AI 추론의 토큰 처리량을 최대 3.7배 끌어올리는 AI 추론 가속 솔루션을 중국 통신 업계 최초로 상용망에서 검증하는 데 성공했다. (사진=화웨이)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/30/ZDNetKorea/20260630174352960mooo.jpg" data-org-width="640" dmcf-mid="Zvr80OUZo0" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/30/ZDNetKorea/20260630174352960mooo.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 화웨이는 지난 24일부터 26일까지 중국 상하이에서 열린 MWC 상하이 2026에서 장문 AI 추론의 토큰 처리량을 최대 3.7배 끌어올리는 AI 추론 가속 솔루션을 중국 통신 업계 최초로 상용망에서 검증하는 데 성공했다. (사진=화웨이) </figcaption> </figure> <p contents-hash="87b1ec1ecd4980daa7097d1d743e22df430047158c50aca7f3451f8b36934885" dmcf-pid="pFr80OUZjX" dmcf-ptype="general"><span>UCM은 외부 고성능 스토리지를 활용해 온칩 메모리와 D램의 용량 한계를 넘어선 페타바이트(PB)급 KV 캐시를 구현한다. KV 캐시를 전 주기에 걸쳐 계층적으로 관리·스케줄링함으로써 단일 대화의 컨텍스트 창을 크게 넓힌다. 멀티턴 대화에선 과거 KV 캐시를 재사용해 중복 연산을 없애 더 낮은 비용으로 최적화된 추론 경험을 제공한다.</span></p> <p contents-hash="4aef44c52ccf676278936ba48df22af41c5d42d1f43e19c034ddacf37bc2bb85" dmcf-pid="U3m6pIu5jH" dmcf-ptype="general">검증은 차이나모바일 후베이의 상용망 환경에 'vLLM-Ascend' 프레임워크를 배포하고, '미니맥스 M2.5'와 'GLM-5.1' 등 주요 모델에 8K부터 190K 토큰에 이르는 장문 입력을 시뮬레이션하는 방식으로 이뤄졌다.</p> <p contents-hash="96c0809878e99bddb3bcd0689b7406896b7389f1a03aed58c0bc5781e19982c2" dmcf-pid="u0sPUC71jG" dmcf-ptype="general">결과적으로 미니맥스 M2.5는 UCM 적용 시 첫 토큰 생성 시간(TTFT)이 26%에서 62%까지 개선되고 NPU당 초당 토큰 수(TPS)가 크게 향상됐다. 시퀀스 길이별로는 64K에서 TPS가 58%, 128K 장문 환경에서 78% 높아졌다.</p> <p contents-hash="0c3cde35966964a418acf3c106f605f28f47bfbd010797d74f70692a213d0ee2" dmcf-pid="7pOQuhztoY" dmcf-ptype="general">GLM-5.1은 TTFT가 51%에서 93%까지 개선되고 TPS가 56%에서 372%까지 향상됐으며, 64K에서 313%, 128K 장문 환경에서 372% 상승했다.</p> <p contents-hash="cb9be6b015ee2c97e3b8876c8e20d346828c5581e8c0b7925ddae6601d858510" dmcf-pid="zUIx7lqFaW" dmcf-ptype="general">이 결과는 컨텍스트 길이가 길어질수록 AI 추론 가속 솔루션의 강점이 더욱 뚜렷해진다는 점을 보여준다. 솔루션은 장문 추론에서 KV 캐시 용량 병목을 해소한다.</p> <p contents-hash="8286a0907d5f6d2563ba304e1d0e8accfccdda3b78b2b648f79aaf61297fa6dc" dmcf-pid="quCMzSB3ay" dmcf-ptype="general">화웨이는 검증이 통신사의 AI 컴퓨팅 인프라 최적화에서 의미 있는 진전으로, 글로벌 AI 산업에 복제 가능한 기술 모델을 제시했다고 설명했다.</p> <p contents-hash="89a5a02584d1c97a02f9059fcb4859ac45847ca54a12400444ca663a35bb8e47" dmcf-pid="B7hRqvb0oT" dmcf-ptype="general">차이나모바일 후베이 관계자는 “AI 에이전트 상호작용과 코드 생성 같은 시나리오에서 AI 추론 가속 솔루션은 처리량을 50% 이상 높일 수 있어, 차이나모바일 후베이 AI 서비스의 대규모 배포를 위한 견고한 기반을 마련했다”고 밝혔다.</p> <p contents-hash="ce9c72857302a960011b49aafcc2db167625895b39cc79a13786ea58f36cb77d" dmcf-pid="bqSdby9Ucv" dmcf-ptype="general">마이클추 화웨이 글로벌 데이터 스토리지 마케팅·솔루션 세일즈 부문 사장은 “AI 추론 가속 솔루션은 TTFT를 크게 줄일 뿐 아니라 토큰 비용 절감에도 기여해, 통신사가 효율적이고 친환경적인 AI 컴퓨팅 인프라를 구축하도록 지원한다”고 말했다.</p> <p contents-hash="f877f0e0cb45208c279a6b5a476cd1e2f82487838c70359662ba454b153e1027" dmcf-pid="KBvJKW2ugS" dmcf-ptype="general">홍지후 기자(hoo@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기