로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
코스피, 6거래일 만에 8000선 재탈환…역대 최고치 경신
N
[연예뉴스]
케데헌 '골든', 올해의 노래 수상…"혼문 제대로 닫아" [AMA 2026]
N
[IT뉴스]
삼성D, 페라리 3년 협력 결실…'루체'에 OLED 4종 공급
N
[IT뉴스]
‘미토스’ 쇼크 커지는데…韓 ‘글래스윙’ 참여 ‘지지부진’, SKT 참여 포기
N
[IT뉴스]
글로벌 겨냥 통했다...세계 달군 K-트리플A 게임
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]KAIST-포스텍-소니AI, 현장감에 가장 가까운 소리 생성 AI기술 개발
온카뱅크관리자
조회:
14
2026-05-26 09:07:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">시각 패턴 중심 기존 한계 극복…영화·게임·VR·메타버스 음향 제작 자동화 기대</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="B0Mktq5Tgn"> <p contents-hash="55efc89b479fd765434daa5be02d09fdef9d296b89f1a3f78bf96adc01b5000a" dmcf-pid="bpREFB1yoi" dmcf-ptype="general">(지디넷코리아=박희범 기자)<span>밀폐된 </span><span>공간과 </span><span>개방된 </span><span>공간에서 </span><span>각각 </span><span>폭탄이 </span><span>터지면, </span><span>서로 </span><span>소리도 </span><span>다르다. </span><span>이 </span><span>같은 </span><span>상황을 </span><span>AI가 </span><span>이해하고, </span><span>거의 </span><span>현장감과 유</span><span>사한 </span><span>소리를 </span><span>만들어내는 </span><span>기술이 개발됐다.</span></p> <p contents-hash="9b984e0f9a7007335484aa1cf51f7f47bc3034a217e3ad8835c58bd996e9345a" dmcf-pid="KUeD3btWNJ" dmcf-ptype="general"><span>KAIST는 오태현 전산학부 교수 연구팀이 POSTECH 및 소니 AI 연구팀과 공동으로 영상 속 물리적 상황을 이해한뒤 보다 현실감 있는 소리를 생성하는 인공지능(AI) 기술 ‘파바스(PAVAS)를 개발했다고 26일 밝혔다.</span></p> <figure class="figure_frm origin_fig" contents-hash="95edde734c252abbc7a40814d7fdef05efa99899f1c420d4245221ed2331c192" dmcf-pid="9udw0KFYod" dmcf-ptype="figure"> <p class="link_figure"><img alt="기존 영상→음향 생성 모델(위)과 PAVAS가 생성한 음향의 스펙트로그램 비교.(그림=KAIST)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/26/ZDNetKorea/20260526090004188fmaz.jpg" data-org-width="640" dmcf-mid="03tVEhcnku" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/26/ZDNetKorea/20260526090004188fmaz.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 기존 영상→음향 생성 모델(위)과 PAVAS가 생성한 음향의 스펙트로그램 비교.(그림=KAIST) </figcaption> </figure> <p contents-hash="99ef9479b3a0f5e2da69ece322d5855b1647b2cdda802ac28b0b36d580578e9f" dmcf-pid="27Jrp93Goe" dmcf-ptype="general">기술 핵심은 영상 속 물체 질량과 속도 등 눈에 보이지 않는 물리 정보를 AI가 스스로 추론하도록 설계했다는 점이다. 일반적인 영상에는 물체의 정확한 무게나 속도가 숫자로 제시되지 않지만, 연구팀은 AI가 주변 환경과 움직임의 맥락을 분석해 이를 추정하고, 그 결과를 소리 생성 과정에 반영하도록 했다.</p> <p contents-hash="03ce5ac4f6d1a99e7637521b8ebd69974154a27371a87d4eb804f393bf663cca" dmcf-pid="VzimU20HaR" dmcf-ptype="general">단순히 ‘무엇이 보이는지’를 인식하는 수준을 넘어, ‘왜 이런 소리가 나야 하는지’에 대한 물리적 원인까지 AI가 이해하도록 만들었다.</p> <p contents-hash="d72d965103ffdd7753a407aa1719ec3cdfa415e64bedd44e54f59034f5bf3174" dmcf-pid="fqnsuVpXAM" dmcf-ptype="general">기술 검증 결과, 물체 간 충돌이나 타격 등 물리적 상호작용이 발생하는 장면에서 실제 환경과 매우 유사한 소리를 생성했다. 특히 물체의 질량과 속도가 달라질 때 소리의 크기와 음색도 자연스럽게 변화하는 등 보다 현실감 있는 음향을 구현했다.</p> <p contents-hash="3ab37d7ae1ae0b5357d7eb82e72623ab7c4a25d9cc49eecdab1a4b66f68483ff" dmcf-pid="4BLO7fUZox" dmcf-ptype="general">최근에는 영상과 오디오를 동시에 생성하는 생성형 AI 기술이 빠르게 발전하고 있다. 대표적으로 구글 ‘비오(Veo) 3’, 바이트댄스 ‘시댄스(Seedance) 2.0’ 등이 있다. 그러나 실제 영화·광고·게임 제작 현장에서는 새로운 영상을 생성하는 것보다 기존 영상에 장면에 맞는 효과음을 추가하거나 음향을 보완하는 후반 작업 수요가 훨씬 크다.</p> <p contents-hash="9bfdd0162fe4339610d1a12cfa0500d17370d73c78ef9a18dc500419c28dc971" dmcf-pid="8JCtRax2aQ" dmcf-ptype="general">연구팀은 이번 기술이 ‘물리적으로 일관된 생성 AI(Physical AI)’ 분야의 새로운 가능성을 제시했다고 설명했다. 물리적으로 일관된 생성 AI는 단순히 그럴듯한 결과를 만드는 수준을 넘어, 현실 세계의 물리 법칙과 인과관계까지 이해하는 AI를 의미한다.</p> <p contents-hash="5e6437452611818ef3abce7a653ad3f2a51c8203f28d85c1540bc606a1ce48da" dmcf-pid="6ihFeNMVgP" dmcf-ptype="general">향후 이 기술은 콘텐츠 음향 제작 자동화는 물론, 증강현실(AR)·가상현실(VR) 콘텐츠, 메타버스, 로보틱스 시뮬레이션 등 다양한 분야에서 더욱 몰입감 있는 사용자 경험을 제공할 수 있을 것으로 기대된다.</p> <figure class="figure_frm origin_fig" contents-hash="c56e0e473597a1a5fc71d9a093600add8dfd96505670516dc31055cab510cea0" dmcf-pid="Pnl3djRfa6" dmcf-ptype="figure"> <p class="link_figure"><img alt="연구진. 왼쪽부터 오현빈 연구원(1저자, POSTECH 통합과정), 타키다 유타 및 우에사카 토시미츠 연구원(소니 AI), 오태현 교수(KAIST 전산학부), 미츠후지 유키 부사장(소니 AI/뉴욕대 방문연구교수 겸)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/26/ZDNetKorea/20260526090005454nwjz.jpg" data-org-width="619" dmcf-mid="xVwG8Jfzol" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/26/ZDNetKorea/20260526090005454nwjz.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 연구진. 왼쪽부터 오현빈 연구원(1저자, POSTECH 통합과정), 타키다 유타 및 우에사카 토시미츠 연구원(소니 AI), 오태현 교수(KAIST 전산학부), 미츠후지 유키 부사장(소니 AI/뉴욕대 방문연구교수 겸) </figcaption> </figure> <p contents-hash="7197bff8a5a32d0207d553f8d2f14ca7f9331067aa09a6a9ab3f70c5b91e1c42" dmcf-pid="QLS0JAe4c8" dmcf-ptype="general">오태현 교수는 “기존 생성 AI가 데이터와 모델 규모를 키우는 방식으로 발전해 왔다면, 이번 연구는 AI가 물리량과 인과관계를 직접 이해하도록 설계했다는 점에서 의미가 있다”며 “향후 텍스트·영상·음성 등 다양한 정보를 동시에 이해하고 처리하는 차세대 멀티모달 AI의 핵심 기반 기술로 확장될 수 있을 것”이라고 말했다.</p> <p contents-hash="235805548220d5a5bee91694714ec4dbb4968b94e027e906434ec64932eb9a0f" dmcf-pid="xovpicd8c4" dmcf-ptype="general">연구는 POSTECH 오현빈 통합과정 학생이 제1저자로 참여했다. KAIST 오태현 교수와 소니 AI 타키다 유타(Yuta Takida), 토시미츠 우에사카(Toshimitsu Uesaka), 미츠후지 유키(Yuki Mitsufuji) 연구원이 공동 저자로 참여했다.</p> <p contents-hash="6a22a66615a3c8bc7a7b74630a61043091dde83af9756d82a4815ce39556c537" dmcf-pid="ytPjZuHlgf" dmcf-ptype="general">연구결과는 컴퓨터 비전(영상 기반 인공지능 기술) 분야 국제학술대회인 ‘CVPR 2026(Computer Vision and Pattern Recognition 2026)’에서 전체 논문 중 상위 1% 이내만 선정되는 오랄(Oral) 발표 논문으로 채택됐다.</p> <p contents-hash="340c2b3c63148d8985ef97e1eebf112ef2985a70ed4fc6207d38eba9b91f203e" dmcf-pid="WFQA57XSAV" dmcf-ptype="general">박희범 기자(hbpark@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기