-
메타 AI, 오픈소스 보안 프레임워크 'LlamaFirewall'을 공개AI 2025. 5. 13. 09:30
메타 AI는 AI 에이전트의 보안 위협에 대응하기 위해 오픈소스 보안 프레임워크 'LlamaFirewall'을 공개하였습니다. 이 도구는 프롬프트 인젝션, 에이전트 오작동, 불안전한 코드 생성을 방지하는 3중 보안 체계를 제공하며, 실제 테스트에서 공격 성공률을 최대 90%까지 낮추는 성과를 보였음. 앞으로 멀티모달 지원 등 기능 확장이 예고하였습니다.
[주요 논점]
1. LlamaFirewall은 프롬프트 인젝션, 에이전트 목표 불일치, 불안전 코드 생성을 막기 위한 3가지 보안 레이어(PromptGuard 2, AlignmentCheck, CodeShield)로 구성.
2. PromptGuard 2는 실시간 다국어 프롬프트 공격 탐지, AlignmentCheck는 에이전트의 내부 추론을 분석해 목표 일치 여부를 점검, CodeShield는 코드 취약점 정적 분석을 담당.
3. 실제 벤치마크(AgentDojo)에서 공격 성공률을 17.6%→1.75%로 낮추는 등 높은 보안 효과를 입증. 향후 멀티모달(이미지·음성) 지원, 효율성 개선, 위협 범위 확장 등이 추진될 예정.
소스코드 :
https://github.com/meta-llama/PurpleLlama/tree/main/LlamaFirewall
관련자료 :
'AI' 카테고리의 다른 글
LLM, 에이전트 기반의 업무 자동화 플랫폼인 디파이의 고객 사례 및 최근 기능 업그레이드 내역 공유의 건 (0) 2025.05.21 에이전트 기반 GAI 업무 자동화, 이제는 Dify.ai 온프레미스 버전으로 단 몇시간 안에 끝냅니다! (2) 2025.04.30 LLM 솔루션, DeepKMS 챗봇과 Dify.ai 소개 웨비나 안내의 건 (2) 2025.04.30 대형 언어 모델(LLM)의 심층 분석: ChatGPT의 작동 방식 이해하기 (2) 2025.04.25 [4월 GAI 트렌드 특집] A-Z까지 오픈소스로 구현하는 생성형 AI 애플리케이션을 위한 링크 모음입니다. (0) 2025.04.25