728x90
반응형

LLM 자체에 내장된 안전 필터를 우회하려는 공격

 

(개념) 프롬프트 인젝션(Prompt Injection)은 LLM(대형 언어 모델)을 기반으로 구축된 애플리케이션에 대한 공격의 일종으로,
애플리케이션 개발자가 구성한 신뢰할 수 있는 프롬프트에 신뢰할 수 없는 사용자 입력을 이어 붙여 공격하는 방식

 

 

LLM 탈옥 방법

 

 

 

https://dothack.io/session/%EC%8B%A0%EB%A2%B0%ED%95%A0%20%EC%88%98%20%EC%9E%88%EB%8A%94%20AI%20%EC%83%9D%ED%83%9C%EA%B3%84%20%EA%B5%AC%EC%B6%95%3A%20LLM%20%EC%B7%A8%EC%95%BD%EC%A0%90%20%EB%B6%84%EC%84%9D%EA%B3%BC%20%EA%B2%BD%EB%9F%89%ED%99%94%EB%90%9C%20guard%20model%20%EA%B0%9C%EB%B0%9C

 

.HACK Conference 2025 - 닷핵 컨퍼런스 2025

끊임없이 도전하는 해커들의 사이버 보안 컨퍼런스

dothack.io

 

 

728x90
Posted by Mr. Slumber
,