로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
‘뮤직뱅크’ 측 “오늘(23일) 자막 오류, 깊은 사과” [공식]
N
[연예뉴스]
'흑백2' 손종원 셰프 "이상형? 상냥하고 예의바른 사람에게 호감 느껴" [RE:뷰]
N
[연예뉴스]
정유미, 유튜브 올렸다가 '저작권 삭제' 멘붕…"내 얼굴인데 왜 안돼"
N
[연예뉴스]
BTS 월드투어 전세계가 티켓팅 전쟁... 100만 명 대기에 서버 다운되기도[K-EYES]
N
[스포츠뉴스]
임효준에서 린샤오쥔으로…오성홍기 달고 8년 만에 올림픽 복귀
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]‘챗GPT’ 전력소모 44%↓추론성능 60%↑…KAIST, AI 반도체 핵심기술 확보
온카뱅크관리자
조회:
63
2025-07-04 10:07:33
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">- AI인프라 핵심 구성요소인 AI반도체와 AI시스템SW를 통합 설계<br>- 최신 GPU 대비 약 44% 낮은 전략 소모 등 평균 60% 성능 향상</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="1wQRH9Gk7b"> <figure class="figure_frm origin_fig" contents-hash="9b5f15e32b335668f6aa18d5735bffca0412df3b73d2338caf05110e2ae967a0" dmcf-pid="trxeX2HEUB" dmcf-ptype="figure"> <p class="link_figure"><img alt="박종세 KAIST 교수가 NPU(신경망처리장치) 핵심 기술에 대해 발표하고 있다.[KAIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/04/ned/20250704100031941idjf.jpg" data-org-width="1280" dmcf-mid="XpMczd7vu2" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/04/ned/20250704100031941idjf.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 박종세 KAIST 교수가 NPU(신경망처리장치) 핵심 기술에 대해 발표하고 있다.[KAIST 제공] </figcaption> </figure> <p contents-hash="1b51e0b5acb7d4194a4f76d6a56d4efcc69ecb526de915bdfe62881e3d2cd286" dmcf-pid="FmMdZVXDFq" dmcf-ptype="general">[헤럴드경제=구본혁 기자] 오픈AI ChatGPT4, 구글 Gemnini 2.5 등 최신 생성형AI 모델들은 높은 메모리 대역폭(Bandwidth) 뿐만 아니라 많은 메모리 용량를 필요로 한다. 마이크로소프트, 구글 등 생성형AI 클라우드 운영 기업들이 엔비디아 GPU를 수십만 장씩 구매하는 이유다.</p> <p contents-hash="f8e267810878fbf583a1fae0139a3781d02e7dff5bf0b9a6cbb7f94edd135306" dmcf-pid="3sRJ5fZwFz" dmcf-ptype="general">고성능 AI 인프라 구축의 핵심 난제를 해소할 방안으로, 국내 연구진이 최신 GPU 대비 약 44% 낮은 전력 소모에도 평균 60% 이상 생성형 AI 모델의 추론 성능을 향상시킬 NPU(신경망처리장치) 핵심 기술을 개발하는데 성공했다.</p> <p contents-hash="7a49a519678fe06442de30ddefbb3b9f8def6f44ee1b9e1021f8a8d6488712fc" dmcf-pid="0wQRH9Gku7" dmcf-ptype="general">KAIST는 전산학부 박종세 교수 연구팀과 (주)하이퍼엑셀이 연구 협력을 통해, ChatGPT와 같은 생성형AI 클라우드에 특화된 고성능·저전력 NPU 핵심 기술을 개발했다고 4일 밝혔다.</p> <p contents-hash="6d08d04a3ceedd5e7b6c11b8f918ebfc4cde73912c883871bea90930fff6ed8b" dmcf-pid="prxeX2HEFu" dmcf-ptype="general">이번 연구의 핵심은 추론 과정에서 경량화를 통해 정확도 손실을 최소화하면서도 메모리 병목 문제를 해결해 대규모 생성형AI 서비스의 성능을 개선하는 것이다. 이번 연구는 AI인프라의 핵심 구성요소인 AI반도체와 AI시스템SW를 통합 설계했다는 점에서 그 가치를 높게 인정 받았다.</p> <p contents-hash="a5e11508453441dd02bc9729caaaa1f6e9ae1f56dfd0d94e522d657f5a4b2dce" dmcf-pid="UmMdZVXDpU" dmcf-ptype="general">기존 GPU 기반 AI 인프라는 높은 메모리 대역폭과 메모리 용량 요구를 충족하기 위해 다수의 GPU 디바이스가 필요한 반면, 이번 기술은 메모리 사용의 대부분을 차지하는 KV 캐시의 양자화를 통해 적은 수의 NPU 디바이스 만으로 동일 수준의 AI 인프라를 구성할 수 있어, 생성형 AI 클라우드 구축 비용을 크게 절감할 수 있다.</p> <figure class="figure_frm origin_fig" contents-hash="e9e6c9cab30c0f47fb6dfdcb303ed8ffce7fbca5191d31f688d6e4f8c700b5ee" dmcf-pid="usRJ5fZwup" dmcf-ptype="figure"> <p class="link_figure"><img alt="연구에서 제안한 하드웨어 모듈 및 이들을 통합한 NPU 아키텍처.[KAIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/04/ned/20250704100032286vhjs.png" data-org-width="1280" dmcf-mid="53gI4jf5FK" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/04/ned/20250704100032286vhjs.png" width="658"></p> <figcaption class="txt_caption default_figure"> 연구에서 제안한 하드웨어 모듈 및 이들을 통합한 NPU 아키텍처.[KAIST 제공] </figcaption> </figure> <p contents-hash="a979f470b899d70838609146f770b0d3b509d9cd763772f068b47d4e374baebf" dmcf-pid="7Oei145rF0" dmcf-ptype="general">연구팀은 기존 NPU 아키텍처의 연산 로직을 변경하지 않으면서 메모리 인터페이스와 통합될 수 있도록 설계했다. 이번 하드웨어 아키텍처 기술은 제안된 양자화 알고리즘을 구현할 뿐만 아니라, 제한된 메모리 대역폭 및 용량을 효율적으로 활용하기 위한 페이지 단위 메모리 관리 기법과 양자화된 KV 캐시에 최적화된 새로운 인코딩 기법 등을 개발했다.</p> <p contents-hash="13e2fe0d8cb6db084581ff355d5842cfd15f650e341167e4af168f8bfe92c25b" dmcf-pid="zIdnt81mz3" dmcf-ptype="general">또한 최신 GPU 대비 비용·전력 효율성이 우수한 NPU 기반 AI 클라우드를 구성할 경우, NPU의 고성능, 저전력 특성을 활용해 운영 비용 역시 크게 절감할 수 있을 것으로 기대된다.</p> <p contents-hash="0e335af8fce0c325f1386b1cb36131415e5100913a5ee4db4098f348e2394180" dmcf-pid="qCJLF6tspF" dmcf-ptype="general">박종세 교수는 “추론의 정확도를 유지하면서 메모리 요구량을 줄이는 경량화 기법과, 이에 최적화된 하드웨어 설계를 결합해 최신 GPU 대비 평균 60% 이상 성능이 향상된 NPU를 구현했다”고 말했다.</p> <p contents-hash="a9cbe2d6cafdc3e48988e22950b331ee3b1e96ad044251ae4859ea276dd6a9c5" dmcf-pid="Bhio3PFO3t" dmcf-ptype="general">이어 “생성형AI에 특화된 고성능·저전력 인프라 구현 가능성을 입증했으며, AI클라우드 데이터센터뿐 아니라 능동적인 실행형 AI인 ‘에이전틱 AI ’등으로 대표되는 AI 대전환(AX) 환경에서도 핵심 역할이 기대된다”고 강조했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기