로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
버스정류장에 갑자기 등장한 전세버스···안내에 바쁜 공무원, 승객·기사는 우왕좌왕
N
[실시간뉴스]
광주 5개 구청장 "행정통합 적극 동참…자치권 강화해야"(종합)
N
[실시간뉴스]
"일찍 나와도 속절없이 지각" 서울 버스 파업에 출근길 불편 속출[종합]
N
[실시간뉴스]
구형 앞둔 尹측 "이승만 계엄도 사법심사 없었다" 주장
N
[연예뉴스]
'탁재훈과 재회' 신정환 "돌아갈 순 없지만.." 20대 시절 추억 소환
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]레드햇 "높은 AI 비용 장벽, 오픈 플랫폼으로 해결"
온카뱅크관리자
조회:
80
2025-06-05 13:57:28
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">[CIS2025] AI 도입 이슈 해결 방안 제시…기업 vLLM 활용 소개도</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="H60Syz2XiS"> <p contents-hash="91a9f23902ee5464d0554bc54515c5120dd5b6cd0f1875cae66389ccf9f4e373" dmcf-pid="XPpvWqVZLl" dmcf-ptype="general">(지디넷코리아=김미정 기자)"기업의 생성형 인공지능(AI) 도입을 여전히 가로막는 장애물은 고비용과 복잡성, 유연성 부족입니다. 이를 해결하려면 누구나 쉽게 모델을 최적화할 수 있는 오픈 플랫폼이 필요합니다. 비용 절감을 위한 경량화 기술, 멀티 클라우드 환경을 아우르는 유연한 배포 체계도 필수입니다."</p> <p contents-hash="58e9db02540fd5ed098ede07b1ab68ace952b04e671cb6b5ad7d24ae6abcf713" dmcf-pid="Z25Oh0qyRh" dmcf-ptype="general">한국레드햇 유혁 테크세일즈팀 상무는 5일 지디넷코리아가 그랜드 인터컨티넨탈 서울 파르나스 그랜드볼룸에서 개최한 '컨버전스 인사이트 서밋(CIS) 2025'에서 'AI의 대중화를 넘어, 비용효율적 AI로'를 주제로 이같이 밝혔다.</p> <p contents-hash="c20de527bb4c2d7575beb33e3776883c3fe8dd475d4a66286ecd85bc22cf30c9" dmcf-pid="5V1IlpBWiC" dmcf-ptype="general">유 상무는 "복잡한 튜닝 프로세스와 높은 추론 비용, 인프라 유연성 부족이 기업의 AI 확산을 가로막고 있다"며 "특히 비전문가가 기업 데이터로 AI 모델을 맞춤화하는 데 겪는 어려움이 크다"고 진단했다.</p> <figure class="figure_frm origin_fig" contents-hash="3def5aa330cd2da8551d9b7da6050c51a27e5af9499d578646e096729561ad85" dmcf-pid="1ftCSUbYRI" dmcf-ptype="figure"> <p class="link_figure"><img alt="레드햇 유혁 테크세일즈 상무." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/05/ZDNetKorea/20250605135316903lyou.jpg" data-org-width="639" dmcf-mid="YJyQRwCniT" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/05/ZDNetKorea/20250605135316903lyou.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 레드햇 유혁 테크세일즈 상무. </figcaption> </figure> <p contents-hash="431f59b9dae664861abbcaafd26c70c0ee5272701df5331b63548a86fcb55ac7" dmcf-pid="t4FhvuKGiO" dmcf-ptype="general">유 상무는 AI 도입 비용 절감 전략으로 뉴럴매직을 통한 가상거대언어모델(vLLM) 기반 추론 최적화를 제시했다. </p> <p contents-hash="5f0b66eab7c068cad787bfe899998cf1aabdbaab8b9e03c5dea867bee118d92a" dmcf-pid="F83lT79Hns" dmcf-ptype="general">그는 "메타의 라마 같은 모델을 FP16이나 FP8 같은 간소한 형식으로 압축하면, 메모리 사용량과 응답 시간을 줄이면서도 정확도를 유지할 수 있다<span>"고 설명했다. 그러면서 "실제 AI 챗봇·상품 리뷰 요약 서비스 사례에서 </span><span>vLLM을 통해 약 40%의 비용 절감 효과를 거뒀다"고 덧붙였다.</span></p> <p contents-hash="a2a6a473b7b0f9e3009df8d43a6d6be8037195fd4b8de7790400163e3e74800a" dmcf-pid="360Syz2Xdm" dmcf-ptype="general">레드햇은 이에 대한 해법으로 복잡성 대응 전략을 내세웠다. 핵심은 '그래닛(Granite)' 모델과 '인스트럭트랩(InstructLab)' 툴이다. 그래닛은 특정 도메인에 최적화된 오픈소스 고성능 모델이다. 기업이 프라이빗 데이터를 기반으로 신뢰성 있게 활용할 수 있도록 설계됐다.</p> <figure class="figure_frm origin_fig" contents-hash="91a9d56bf701e67aa4fc913bff6ebe0fc8b9986bfe8653f32833155b1ad101d1" dmcf-pid="0PpvWqVZJr" dmcf-ptype="figure"> <p class="link_figure"><img alt="인스트럭트랩은 비전문가도 쉽게 모델을 커스터마이징할 수 있도록 지원하는 툴이다." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202506/05/ZDNetKorea/20250605135318190oekt.jpg" data-org-width="639" dmcf-mid="Gs6p7RLKJv" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202506/05/ZDNetKorea/20250605135318190oekt.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인스트럭트랩은 비전문가도 쉽게 모델을 커스터마이징할 수 있도록 지원하는 툴이다. </figcaption> </figure> <p contents-hash="980adb6e68f2ae2b78889872fd2bd1270a5fada4e431f782df87cefd4ba735c6" dmcf-pid="pQUTYBf5Lw" dmcf-ptype="general">인스트럭트랩은 비전문가도 쉽게 모델을 커스터마이징할 수 있도록 지원하는 툴이다. 챗봇 성능 향상을 위한 대규모 정렬(<span>LAB)</span><span> 방식인 '교사–비평자–학생' 구조로 이뤄진 자동 튜닝의 데이터 생성과 자동 튜닝으로 모델을 훈련한다. </span></p> <p contents-hash="75e8605bc4187fcd86d360bbe2de07e78f9e68b0ada69d111cbb7f74dd7572d4" dmcf-pid="UxuyGb41eD" dmcf-ptype="general"><span>이는 '오픈시프트 AI'와 '레드햇 엔터프라이즈 리눅스(RHEL) AI'와 연계돼 단일 서버부터 클러스터 환경까지 이용 가능하다.</span></p> <p contents-hash="e88338d22f178e66d21ca83f6b9dba82313a343e19c9f16e692c05555459d1ed" dmcf-pid="uM7WHK8teE" dmcf-ptype="general">레드햇은 유연성 확보를 위한 방안으로 '레드햇 오픈시프트 AI(RHOAI)' 기반 하이브리드 전략을 설명했다. 해당 플랫폼은 프라이빗 클라우드와 퍼블릭 클라우드, 엣지 등 다양한 환경에 맞게 AI 앱과 모델을 배포할 수 있게 돕는다. 이 플랫폼은 데이터 현지화와 규제 대응, 저지연 추론 처리 등도 지원한다. 또 ML옵스 기반 자동화된 모델 생애주기 관리, 재학습, 편향 탐지까지 가능하다는 설명이다.</p> <p contents-hash="2607a1614f678122e892568e7b54305b25c104d93d954787d6bd2d39892278f9" dmcf-pid="7RzYX96FRk" dmcf-ptype="general">유 상무는 "AI 도입은 단순히 모델 하나를 도입하는 것이 아니라, 학습·추론·앱 통합까지 전체 라이프사이클을 관리할 수 있어야 진정한 효과를 볼 수 있다"며 "우리는 오픈소스 기반 전략을 통해 이를 효율적으로 실현할 수 있다"고 말했다.</p> <p contents-hash="532af9743033de0ec7c15df7ba0d334d6f2dd444cc94c82ec00ac3b537a920ca" dmcf-pid="zeqGZ2P3ic" dmcf-ptype="general">김미정 기자(notyetkim@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기