로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
홍상수·김민희 '그 자연이 네가 뭐라고', 베를린 영화제 경쟁 진출
N
[연예뉴스]
전현무도 푹 빠진 ‘정조의 여인’ 성덕임의 매력은?(선넘클)
N
[연예뉴스]
악뮤 이찬혁・프로미스나인 이새롬 결별설…YG, 이번에도 "확인 불가"
N
[연예뉴스]
홍상수♥김민희 신작, 베를린 경쟁 진출…동반 참석→임신설 언급할까
N
[연예뉴스]
깔끔 슈트핏 최현욱→위풍 당당 문가영, ‘그놈은 흑염룡’ 캐릭터 티저 영상 공개
N
커뮤니티
더보기
[자유게시판]
집으로~~~
N
[자유게시판]
오늘하루도 수고하셨습니다.
N
[자유게시판]
집으로
N
[자유게시판]
시간이 참 빨라요
N
[자유게시판]
퇴근이욤….
N
제휴문의 @spostar
목록
글쓰기
[IT뉴스]"오픈AI·구글 이상"…KAIST, `멀티모달 LLM` 공개
온카뱅크관리자
조회:
42
2024-06-20 16:16:14
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">노용만 교수팀, 시각성능 향상 '콜라보', '모아이' 개발<br>GPT4-V 등에 비해 정확도 10% 향상..물체와 배경 구분</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="YPfWZ2CnS8"> <figure class="figure_frm origin_fig" dmcf-pid="GM6Ht4SgS4" dmcf-ptype="figure"> <p class="link_figure"><img alt="KAIST는 GPT-4V, 제미나이-프로 등 기존 비공개형 상업용 멀티모달 대형언어모델(LLM)의 시각성능을 뛰어넘는 공개형 멀티모달 LLM인 '콜라보', '모아이'를 개발했다. KAIST 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202406/20/dt/20240620161615506vzql.jpg" data-org-width="540" dmcf-mid="WLUmh0A8h6" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202406/20/dt/20240620161615506vzql.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> KAIST는 GPT-4V, 제미나이-프로 등 기존 비공개형 상업용 멀티모달 대형언어모델(LLM)의 시각성능을 뛰어넘는 공개형 멀티모달 LLM인 '콜라보', '모아이'를 개발했다. KAIST 제공 </figcaption> </figure> <p dmcf-pid="HEjbfaphCf" dmcf-ptype="general">오픈AI의 GPT-4V, 구글의 '제미나이 프로' 등에 비해 시각지능이 10% 이상 우수한 국산 멀티모달 대형 언어모델(LLM)이 개발됐다. 기존 상업용 비공개 LLM 모델보다 현저히 떨어지는 물체에 대한 이미지 이해 능력을 획기적으로 높여 향후 고성능 멀티모달 LLM 개발에 널리 쓰일 전망이다.</p> <p dmcf-pid="XSIxJsVZSV" dmcf-ptype="general">KAIST는 노용만 전기·전자공학부 교수 연구팀은 멀티모달 LLM의 시각 성능을 향상시킨 콜라보(CoLLaVO), 모아이(MoAI) 등 2개 AI 모델을 개발했다고 20일 밝혔다.</p> <p dmcf-pid="ZvCMiOf5T2" dmcf-ptype="general">멀티모달 대형언어모델은 텍스트뿐 아니라 이미지 데이터 유형까지 처리할 수 있는 AI 모델이다. 오픈AI사의 'GPT-4V', 구글 '제미나이-프로' 등 대부분 글로벌 빅테크 기업들이 풍부한 컴퓨팅 자원을 바탕으로 비공개 상업 모델로 개발해 왔다. </p> <p dmcf-pid="5neFuMGkl9" dmcf-ptype="general">연구팀은 모델 크기를 키우거나 고품질의 시각지시 조정 데이터셋을 만들지 않고 멀티모달 LLM의 시각 성능을 높일 수 있는 2가지 AI 모델을 학계에서 처음으로 내놨다. </p> <p dmcf-pid="1Ld37RHElK" dmcf-ptype="general">연구팀이 내놓은 콜라보 모델은 이미지 내의 정보를 배경과 물체 단위로 분할하고, 각각의 배경과 물체에 대한 정보를 멀티모달 LLM에 입력해 직접 넣어주는 '크레용 프롬프트' 방식으로 비공개형 모델보다 성능이 떨어진 물체에 대한 이미지 이해 능력을 높였다. 또한 학습한 정보를 잃어 버리지 않도록 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터(매개변수)로 학습시키는 '듀얼 큐로라' 방식을 적용해 이미지 내 배경과 물체를 구분하는 능력을 크게 향상시켰다. 콜라보는 멀티모달 모델의 성능을 평가하는 벤치마크에서 오픈AI의 GPT-4V, 구글의 제미나이 프로보다 높은 정확도를 보였다고 연구팀은 설명했다. </p> <p dmcf-pid="tjo7KntsWb" dmcf-ptype="general">모아이는 인간이 사물을 판단할 때 물체의 존재, 상태, 물체 간 상호작용, 배경·텍스트에 대한 이해 등으로부터 상황을 판단하는 인지과학적 AI 모델이다. 기존 멀티모달 LLM은 이미지 픽셀 수준에서 자세하고 종합적인 이해가 부족한데, 모아이는 화면분할, 물체검출기, 상황그래프 생성, 글자인식 등 네 가지의 컴퓨터 비전 모델 결과를 모두 인간이 이해할 수 있는 언어로 변환한 뒤 멀티모달 LLM에 입력해 학습시킬 수 있다. 기존 LLM이 부족했던 시각 능력을 대답하기 전에 이미지를 충분히 이해하는 과정을 인간 언어로 정보를 제공함으로써 시각 성능을 크게 높였다. </p> <p dmcf-pid="FAgz9LFOSB" dmcf-ptype="general">노용만 KAIST 교수는 "두 AI 모델은 허깅 스페이스에서 선정하는 '화제의 논문'으로 추천됐고, 모든 모델을 공개형 LLM로 출시해 다양한 분야에 활용될 것"이라며 "앞으로 많은 컴퓨팅 자원을 활용하지 않고 효율적이면서 성능 높은 멀티모달 LLM 개발에 기여할 것"이라고 말했다.</p> <p dmcf-pid="3NLubi1mlq" dmcf-ptype="general">한편 콜라보 모델은 자연어 처리 분야 최고의 국제 학회(ACL Findings 2024)에 승인을 받았고, 모아이는 컴퓨터 비전 국제 학회(ECCV 2024) 승인 결과를 기다리고 있다.</p> <p dmcf-pid="0jo7KntsSz" dmcf-ptype="general">한편 이번 연구에는 이병관 KAIST 전기·전자공학부 박사과정이 제1저자로, 박범찬 석박사통합과정과 김채원 박사과정이 공동 저자로 참여했다.이준기기자 bongchu@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
1
블리자드직원
1100
2
혈마
1000
3
사나존예보스
900
4
비가오는날
900
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
N
N
N
N
N
N
채팅하기