에임인텔리전스는 연세대·KIST·서울대와 공동으로 개발한 AI 안전성 평가 체계 ‘ELITE(Enhanced Language-Image Toxicity Evaluation)’가 세계적인 머신러닝 학술대회 ICML 2025에 공식 논문으로 채택됐다고 7일 밝혔다.
ICML(International Conference on Machine Learning)은 1980년부터 전 세계 연구자들이 최신 머신러닝 및 인공지능 기술을 공유하는 대표적인 국제 학술대회로, 올해로 42회를 맞이하였다. 이번에 채택된 ELITE는 이미지와 텍스트를 함께 입력하는 비전언어모델(VLM)의 응답을 정밀하게 평가하는 AI 안전성 진단 체계다. 사진과 글을 짝지어 AI에게 보여 준 뒤, 겉보기엔 멀쩡해 보여도 독성, 설득력, 구체성 등 세부 항목으로 AI의 응답을 분석해, 은밀하게 유해할 수 있는 발언까지 탐지할 수 있도록 설계됐다.
‘ELITE’ 시스템은 한마디로 AI의 숨은 위험 신호를 잡아내는 ‘정밀 건강검진 키트’다. 연구팀은 기존 7개 평가 도구를 통합하고, 자체 제작한 고난도 문제 1,054개를 포함해 총 4,587건의 실험을 수행했다. 그 결과, 유명 오픈소스 AI 모델 18종 중 10개 이상이 40% 이상 유해 발언에 노출되는 실태를 공개하며, 실제 서비스 환경에서의 AI 위험성을 보다 현실적으로 진단할 수 있는 기준을 제시했다.
에임인텔리전스 유상윤 대표는 “ICML 무대에서 국내 기술력이 공론화됐다는 것 자체가 큰 의미”라며 “앞으로도 누구나 안심하고 사용할 수 있는 AI 환경을 위해 연구·협력을 더욱 강화하겠다”라고 밝혔다.
한편, 에임인텔리전스는 한국정보통신기술협회(TTA) 등과 함께 AI 안전성 표준화 작업에 참여하고 있으며, 이번 연구 성과를 바탕으로 금융·공공·의료·로봇·국방 등 고위험 산업 분야에 적용 가능한 AI 평가 기준 수립할 계획이다.