
< (왼쪽부터) 노준혁 교수 (이화여대 인공지능학과 조교수), 서진환, 조윤기 박사과정, 윤성의 교수 (KAIST 전산학부 교수) >
‘카메라가 다른 곳을 비추는 사이 사라진 물체는 무엇 인가요?’라는 복잡한 질문이 나오면 AI는 많은 경우 영상 속 실제 상황을 보고 판단하는 것이 아니라, 언어 패턴에 의존해 ‘그럴듯한 답’을 추측하는 문제가 있다. 우리 대학 연구진은 이 한계를 해결하기 위해 영상 속 ‘딱 중요한 순간(Trigger moment)’을 AI가 스스로 찾아내도록 하는 기술을 개발했고, 이 기술로 국제 AI 대회에서 우수성을 입증했다.
우리 대학은 전산학부 윤성의 교수 연구팀이 이화여대 노준혁 교수 연구팀과 공동 연구를 통해, 세계적 권위의 컴퓨터 비전 학회 ICCV 2025에서 열린 Perception Test Challenge의 영상 근거 기반 질의응답(Grounded Video Question Answering) 트랙에서 1위를 차지했다고 28일 밝혔다.
이번 ICCV 2025에서 열린 인지 테스트 대회(Perception Test Challenge)는 구글 딥마인드(Google DeepMind)가 주관하여 총 상금 50,000 유로(한화 약 8,300만원)가 걸린 대회로, 영상·음성·텍스트 등 다양한 데이터를 종합적으로 이해하는 멀티모달 AI의 인지 및 추론 능력을 평가한다. 특히 언어 중심 편향을 벗어나 실제 영상 근거를 바탕으로 판단하는 능력이 핵심 평가 요소다.
우리 대학 연구팀은 영상 전체를 무작정 분석하는 기존 방식과 달리, AI가 정답을 위해 꼭 필요한 핵심 장면(Trigger moment)을 먼저 찾아내도록 만드는 새로운 기술을 개발했다. 쉽게 말하면, “이 질문에 답하려면 이 장면이 결정적이야!”를 AI가 스스로 찾아내도록 설계한 기술이다.
이 프레임워크를 연구팀은 CORTEX(Chain-of-Reasoning for Trigger Moment Extraction)라고 부른다.
연구팀의 시스템은 서로 다른 기능을 수행하는 세 모델이 순차적으로 작동하는 3단계 구조로 구성된다. 먼저 추론 AI(Gemini 2.5 Pro)가 질문에 답하기 위해 어느 순간을 봐야 하는지 사고하고 딱 그 순간(Trigger moment) 후보를 찾는다. 다음으로 객체 위치 찾기 모델(Grounding 모델, Molmo-7B)이 해당 순간 화면 속 사람·차·사물의 정확한 위치(좌표)를 파악한다. 마지막으로 추적 모델(Tracking 모델, SAM2)이 선택된 한 장면을 기준으로 앞뒤 시간대의 객체 움직임을 정밀하게 추적해 오류를 줄인다.
즉, ‘핵심 장면 한 컷을 정확히 찍고, 그 장면을 중심으로 정답 근거를 추적하는 방식’덕분에 영상 초반 오판이나 가려짐 같은 문제도 크게 줄었다.
총 23개 팀이 참여한 영상 근거 기반 질의응답(Grounded VideoQA) 트랙에서 KAIST팀 SGVR Lab(Scalable Graphics, Vision & Robotics Lab)은 ‘고차 추적 정확도(HOTA, Higher Order Tracking Accuracy)’지표에서 0.4968점을 기록하며 2등 미국 콜럼비아대의 0.4304점을 압도적인 점수 차로 상회하며 1위를 차지했다. 이는 전년도 우승 기록 0.2704점보다도 약 두 배에 가까운 성과다.
이 기술은 실생활에서도 넓게 쓰일 수 있다. 자율주행차는 사고 위험이 있는 순간을 정확히 보고, 로봇은 주변 상황을 더 똑똑하게 이해한다. 또 보안·감시 시스템은 중요한 장면을 빠르게 찾아내고, 미디어 분석에서는 사람이나 사물의 행동을 시간 순서대로 정확히 추적할 수 있다.
즉, AI가 “영상 속 실제 근거”를 보고 판단할 수 있도록 만드는 핵심 기술이다. 특히 영상 속 객체가 시간에 따라 어떻게 행동하는지 정확히 짚어내는 능력은 향후 AI의 실제 현장 적용을 크게 확장할 것으로 기대된다.

< 연구팀이 제안한 비디오 질의 응답을 위한 그라운딩 프레임워크의 파이프라인 이미지 >
이번 연구는 ICCV 2025, the 3rd Perception Test Challenge 학회에서 10월 19일자 발표하였다.
이 성과는 과학기술정보통신부 기초연구사업 중견연구와 SW스타랩 사업 ‘오픈 월드 로봇 서비스를 위한 불특정 환경 인지·행동·상호작용 알고리즘 개발’ 및 AGI 사업 ‘체화형 AGI를 위한 현실 세계 구축과 인지 에이전트 기반 이원 역량 접근법’ 과제의 지원을 받아 수행되었다.
AI와 로보틱스가 인간과 사회의 기본 질서를 바꾸는 시대, KAIST가 기술의 방향을 묻는 AI 철학 연구센터를 공식 출범시켰다. 이광형 KAIST 총장은 “기술이 사회를 바꾸는 속도만큼 그 의미와 방향을 성찰하는 철학이 필요한 시대”라며 “KAIST AI 철학 연구센터는 인간 중심의 기술 발전과 책임 있는 미래 사회를 설계하는 핵심 거점이 될 것”이라고 밝혔다. 우리 대학은 KAIST AI 철학 연구센터가 오는 1월 21일(수) 대전 KAIST 본원 학술문화관(E9) 2층 양승택 오디토리움에서 ‘KAIST AI 철학 연구센터 개소 기념 국제 심포지엄’을 개최한다고 19일 밝혔다. KAIST AI 철학 연구센터는 철학과 인공지능 과학기술의 융합을 통해 인류사회가 직면한 문제를 진단하고, 실현 가능한 미래 비전과 대응 전략을 제시하기 위해 설립됐다. 이번 국제 심포지엄에서는 포스트 AI 시대를 맞아 자율성&mid
2026-01-19“지정학적 경쟁이 심화되는 환경에서 한국, 캐나다, 영국, 싱가포르 등 ‘AI 브리지 파워(bridge power) 국가’가 경쟁력을 유지하면서 책임있는 AI 개발을 위해서는 이들 국가 간 연대가 필수적이다”– AI 석학이자 본 보고서 공동저자인 요슈아 벤지오(Yoshua Bengio) 교수 우리 대학은 과학기술과 글로벌발전연구센터(G-CODEs) 박경렬 교수팀이 캐나다 밀라연구소(Mila), 옥스퍼드대, 독일 아헨공대(RWTH Aachen), 뮌헨공대(TUM), 파리 고등사범학교(ENS-PSL) 등과 함께 미·중 중심의 AI 패권 구도를 넘어서는 새로운 국제협력 전략을 제시한 정책 보고서 「AI 개발에 관한 다국적 협력의 청사진(A Blueprint for Multinational Advanced AI Development)」을 공동 발간했다고 18일 밝혔다. 보고서는 전 세계 AI 컴퓨팅 역량의 약 90
2026-01-19“AI 시대에는 데이터의 바다 속에 새로운 미래가 있다. KAIST가 세계 1위 AI 연구 집단으로 도약해 달라.”(김재철 동원그룹 명예회장) 우리 대학은 김재철 동원그룹 명예회장이 인공지능(AI) 인재 양성과 연구 인프라 강화를 위해 59억 원의 발전기금을 추가로 약정해 총 603억원을 기부했다고 16일 밝혔다. 이번 기부는 2020년 이후 두 번째 추가 기부로, 김재철 명예회장은 대한민국 AI 분야의 국가 경쟁력 강화를 위한 지원을 이어오고 있다. 김재철 명예회장은 2020년 기부를 통해 ‘KAIST 김재철 AI대학원’을 설립하며 KAIST가 AI 분야에서 세계 최고 수준의 역량을 갖출 것을 당부해왔다. KAIST가 최근 5년간(20~24년) AI 연구 수준이 세계 대학 중 5위라는 소식을 접한 김 명예회장은 이를 세계 1위 수준으로 도약시켜 달라고 요청했다. 이에 이광형 총장은 “현재 세계 최고 수준으로 평가받는 카
2026-01-16주요 우울 장애 등 정신건강 질환은 주관적 설문과 면담으로 진단한다. 복합적이고 모호한 ‘우울감’은 우울증 진단의 가장 큰 한계로 꼽혀왔다. 국내 연구진이 AI로 일상행동을 분석해 우울증을 객관적으로 진단하고 치료 효과를 평가하는 기술을 개발하며, 정신질환 진단과 치료의 새로운 해법을 제시했다. 우리 대학은 생명과학과 허원도 석좌교수 연구팀이 동물 모델의 일상적인 행동 패턴을 분석할 수 있는 인공지능(AI) 기술을 개발하고, 이를 통해 일상행동 속에서 성별과 중증도에 따른 우울증 증상을 탐지할 수 있음을 입증했다고 13일 밝혔다. 연구팀은 우울증 환자의 팔다리 움직임, 자세, 표정 등 신체 운동 양상이 일반인과 다르다는 점에 주목했다. 감정과 정서 상태가 운동 능력으로 드러나는 현상인 ‘정신운동(psychomotor)’을 정밀하게 파악하기 위해, 연구팀은 실험동물의 자세와 움직임을 3차원으로 분석해 우울 상태에 따른 미세한 행동 변화
2026-01-13“유전자는 알지만 기능은 모른다”는 미생물 연구의 오랜 난제를 해결하기 위해, 공동연구진이 인공지능(AI) 기반 미생물 유전자 기능 발견의 속도를 크게 높일 수 있는 최신 연구 전략을 제시했다. 우리 대학은 생명화학공학과 이상엽 특훈교수 연구팀이 UCSD 생명공학과 버나드 폴슨(Bernhard Palsson) 교수와 함께 AI를 활용해 미생물 유전자 기능 발견을 획기적으로 가속할 수 있는 최신 연구 접근법을 체계적으로 정리·분석한 리뷰논문을 발표했다고 12일 밝혔다. 2000년대 초 전장 유전체 해독 기술이 본격화되며 생명체의 유전자 구성을 완전히 규명할 수 있을 것이라는 기대가 컸다. 그러나 20년이 지난 지금도 미생물 유전체 내 상당수 유전자는 어떤 역할을 하는지 밝혀지지 않은 상태다. 유전자 결실 실험, 발현량 조절, 시험관 내 활성 측정 등 다양한 실험이 시도돼 왔지만 ▲ 대규모 실험의 한계 ▲ 복잡한 생물학적 상호작용 ▲ 실험실 결
2026-01-12