전남대 유석봉 교수팀
인공지능에 대한 적대적 공격 방어기술 개발
시스템 보안 ‘인텐스 퓨어’ 기술
전남대학교 유석봉 교수팀이 인공지능에 대한 적대적 공격을 효과적으로 방어하는 기술인 ‘인텐스 퓨어’를 개발했다.
전남대 유석봉 교수(인공지능융합학과)팀은 이미지에 가해진 적대적 공격량을 추정하고, 그에 따라 최적화된 강도로 이미지를 정화하는 시각지능 알고리즘을 제안했다.
연구팀이 개발한 ‘인텐스 퓨어(Intens Pure)’는 적대적 정화 기술을 통해 인공지능 모델의 강건성을 높이는 기술이다. 적대적 공격 강도에 따른 최적의 정제량이 존재함을 관찰해 ID 안정성과 속성 일관성을 바탕으로 적대적 공격량을 추정하고, 디퓨전 정제 강도를 조절하는데 사용된다.
정확도 및 복잡도 면에서 효과적인 정화를 위해 입력 이미지를 이산 코사인 변환 기반 2차 이미지로 재구성해 적대적 공격이 주로 가해지는 특정 주파수 영역에 초점을 맞춰 정화하는 2차 도메인 적응 디퓨전 모델을 새롭게 제안한 것이다.
이 기술은 입력 이미지에 가해질 수 있는 적대적 공격량을 정확히 추정하고 적응적으로 처리하는 데도 장점이 있다. 연구팀은 다양한 유형의 적대적 공격 및 데이터베이스 실험을 통해 개발된 기술이 최신 성능의 이미지 정화 방법들을 능가하는 결과를 확보했다.
‘적대적 공격’이란 눈에 띄지 않는 작은 변화만으로도 인공지능 시스템이 오도해 잘못된 판단을 내리게 만드는 공격이며, 인공지능 시대의 새로운 위협이다. 이에 따라 인공지능 시스템의 안전을 보장하기 위해선 적대적 방어 기술 개발이 필수적이다.
이 연구는 전남대 인공지능융합학과 시각지능미디어연구실 이은기 석사과정, 이문석 석박사통합과정, 윤재현 석사과정 학생이 참여했고, 유석봉 교수가 교신저자로 참여했다.
해당 연구논문은 승인률 10%대 AI 분야 탑 컨퍼런스인 ‘International Joint Conference on Artificial Intelligence (IJCAI)’ 2024 국제 컨퍼런스에서 올해 8월 공식적으로 발표될 예정이다.
*논문 원제: IntensPure: Attack Intensity-aware Secondary Domain Adaptive Diffusion for Adversarial Purification