로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[스포츠뉴스]
홍명보는 끝났지만, 기득권은 살아남았다
N
[실시간뉴스]
검은 옷 입고 가슴 치며 '피의 복수' 다짐…하메네이 장례 첫날
N
[스포츠뉴스]
[단독] 안세영, 100주 연속 세계 1위 예약!…초대형 신화 또또 해냈다→9월8일 새 역사 확정
N
[IT뉴스]
[인터뷰] "명일방주: 엔드필드의 매력은 무엇인가요?"
N
[IT뉴스]
‘반도체 피크아웃’ 우려에도…67만전자·420만닉스 전망, “아직도 싸다”
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]생물무기·악성코드도 답한다…AI 안전장치 제거 도구, 1300만번 다운됐다
온카뱅크관리자
조회:
47
2026-05-26 18:17:35
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="VIgedoPKts"> <figure class="figure_frm origin_fig" contents-hash="eab59a62ae7fa23eefb64f990c9858cf0d1e63253c2471e7d48d0955ab99598a" dmcf-pid="fCadJgQ9tm" dmcf-ptype="figure"> <p class="link_figure"><img alt="[게티이미지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/26/ned/20260526181154070padl.png" data-org-width="594" dmcf-mid="26tYG1Sr1O" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/26/ned/20260526181154070padl.png" width="658"></p> <figcaption class="txt_caption default_figure"> [게티이미지] </figcaption> </figure> <p contents-hash="3004ed829ca18418123018be67f2b708fe1ff678c928f6d469e9df7700aef931" dmcf-pid="4hNJiax2Zr" dmcf-ptype="general">[헤럴드경제=장윤우 기자] AI 모델의 안전장치를 10분 만에 제거하는 도구가 온라인에서 확산하고 있다. 이 도구로 만들어진 변형 모델은 생물학 무기 제조법과 악성코드 작성 요청에도 제한 없이 답변했다.</p> <p contents-hash="7bbbd0c3dbfde788c3ba84a7e5e0fa9214fff483b44ba5e2c88be18b5f4e44bf" dmcf-pid="8ljinNMVXw" dmcf-ptype="general">25일(현지시간) 영국 매체 파이낸셜타임스(FT)에 따르면 AI 안전성 연구단체 앨리스(Alice)가 실험한 결과, 안전장치가 제거된 오픈소스 AI 모델들은 기존 시스템에서 차단되던 질문에도 응했다.</p> <p contents-hash="f5de7d4e404df873ea8878a680f3d337f6b7fb9f39f340779913066e93f7e861" dmcf-pid="6SAnLjRfHD" dmcf-ptype="general">앨리스 공동창업자 겸 최고경영자(CEO) 노암 슈워츠는 FT에 “지니가 병 밖으로 나왔다”며 “SF처럼 여겨졌던 것들이 더 이상 SF가 아니다. 사회 전체가 대비해야 한다”고 경고했다.</p> <p contents-hash="3b572ad48c4be350043a1b9c519a28fe0f688bac1e5e8a7c715b8772f625d344" dmcf-pid="PvcLoAe45E" dmcf-ptype="general">문제의 도구는 깃허브(GitHub)에 공개된 ‘헤레틱(Heretic)’이다. ‘어블리터레이션(abliteration)’이라 불리는 기술 원리를 자동화한 소프트웨어로, 별도 전문 장비 없이 명령어 한 줄로 실행된다.</p> <p contents-hash="2920ebfe6a83eee0aefa616fd096dc5c214b2dd0db3f0283e70a2174536e4a94" dmcf-pid="QGrjAwLxXk" dmcf-ptype="general">작동 방식은 이렇다. AI가 문제가 되는 내용(약물, 성인물, 폭력 등)의 요청을 거부하는 것은 신경망 내부에 ‘거부 방향’이라는 특정 활성화 패턴이 존재하기 때문이다. 헤레틱은 이 방향을 수학적으로 찾아내 거부 메커니즘 자체를 지운다. 추가 학습 없이 모델 원본에 직접 개입한다.</p> <p contents-hash="917f05a36d99abafe15a44f151e9cd739cb184ce18db726eae0ac5d7b1e5662c" dmcf-pid="xHmAcroM1c" dmcf-ptype="general">헤레틱의 성능 벤치마크는 구체적이다. 기존에 구글의 ‘젬마(Gemma) 3 12B’ 원본 모델은 유해 프롬프트 100개 중 97개를 거부했다. 그러나 헤레틱을 사용하자 거부 횟수가 3개로 줄었다. 기존 수작업 어블리터레이션 도구들과 비교하면 헤레틱은 AI 모델의 손상을 최소화하면서 안전장치를 제거했다.</p> <p contents-hash="15411ac596da1c02b94d2f3a8f8a54799f71c443a6a49be50755d22bdcaafe75" dmcf-pid="ydKUubtWHA" dmcf-ptype="general">연구진이 이 도구로 메타의 ‘라마(Llama) 3.3’ 안전장치를 제거하는 데 걸린 시간은 10분이었다. 구글의 최신 모델 ‘젬마 4’는 출시 90분 만에 같은 방식으로 뚫렸다.</p> <p contents-hash="50dc726609977c41c22509cf5269fb85a2d1b3f3edb6ffea737f60ecebe3a293" dmcf-pid="WJ9u7KFYZj" dmcf-ptype="general">안전장치가 제거된 젬마 3 변형 버전은 염소가스를 밀폐 공간에 퍼뜨리는 방법, 신용카드 정보 탈취 코드 생성 등 각종 요청에 응했다.</p> <p contents-hash="67d1b8705733bd90e66de1a52629ec03acf0544a7fb84c9139a75dbec2d9e38d" dmcf-pid="Yi27z93GXN" dmcf-ptype="general">헤레틱 개발자 필리프 에마누엘 바이트만은 FT에 “지난해 공개 이후 이 도구를 활용해 3500개 이상의 ‘검열 해제’ 모델이 만들어졌다”며 “관련 모델 다운로드 수는 1300만 건에 달한다”고 밝혔다.</p> <p contents-hash="ce71796d490fe2f59d3ff04defe87c6a0d5e7c288633cc7dfb59db5acdb5a763" dmcf-pid="GnVzq20HZa" dmcf-ptype="general">오픈AI는 최근 공개한 GPT-OSS 모델에서 위험 정보를 제거한 데이터 세트로 학습시키는 방식을 도입하고 있다. 깃허브와 허깅페이스에는 GPT-OSS, 젬마 3, 콴(Qwen) 3 등의 변형 버전을 포함해 헤레틱 기반 모델 1000개 이상이 이미 올라와 있다.</p> <p contents-hash="ac1dc51fbd2969d2383a8127ce7b414a5f039a01159ac6b702cb5d483020d165" dmcf-pid="HLfqBVpX5g" dmcf-ptype="general">변형 모델 확산으로 각국 정부의 규제 시도도 복잡해지고 있다. 모델이 일단 다운로드되면 개발사의 통제 밖에서 복사·수정·공유가 가능하기 때문이다.</p> <p contents-hash="04747de8b0cbb8750a2088ba3ae97b737fa9d52175b434d2acd7127628ec7b8d" dmcf-pid="Xo4BbfUZHo" dmcf-ptype="general">깃허브는 “불법 공격이나 악성코드 활동을 직접 지원하는 콘텐츠는 금지하고 있다”면서도 “보안 연구와 교육 목적의 소스코드는 허용 대상”이라고 밝혔다.</p> </section> </div> <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기