
< (왼쪽부터) 노준혁 교수 (이화여대 인공지능학과 조교수), 서진환, 조윤기 박사과정, 윤성의 교수 (KAIST 전산학부 교수) >
‘카메라가 다른 곳을 비추는 사이 사라진 물체는 무엇 인가요?’라는 복잡한 질문이 나오면 AI는 많은 경우 영상 속 실제 상황을 보고 판단하는 것이 아니라, 언어 패턴에 의존해 ‘그럴듯한 답’을 추측하는 문제가 있다. 우리 대학 연구진은 이 한계를 해결하기 위해 영상 속 ‘딱 중요한 순간(Trigger moment)’을 AI가 스스로 찾아내도록 하는 기술을 개발했고, 이 기술로 국제 AI 대회에서 우수성을 입증했다.
우리 대학은 전산학부 윤성의 교수 연구팀이 이화여대 노준혁 교수 연구팀과 공동 연구를 통해, 세계적 권위의 컴퓨터 비전 학회 ICCV 2025에서 열린 Perception Test Challenge의 영상 근거 기반 질의응답(Grounded Video Question Answering) 트랙에서 1위를 차지했다고 28일 밝혔다.
이번 ICCV 2025에서 열린 인지 테스트 대회(Perception Test Challenge)는 구글 딥마인드(Google DeepMind)가 주관하여 총 상금 50,000 유로(한화 약 8,300만원)가 걸린 대회로, 영상·음성·텍스트 등 다양한 데이터를 종합적으로 이해하는 멀티모달 AI의 인지 및 추론 능력을 평가한다. 특히 언어 중심 편향을 벗어나 실제 영상 근거를 바탕으로 판단하는 능력이 핵심 평가 요소다.
우리 대학 연구팀은 영상 전체를 무작정 분석하는 기존 방식과 달리, AI가 정답을 위해 꼭 필요한 핵심 장면(Trigger moment)을 먼저 찾아내도록 만드는 새로운 기술을 개발했다. 쉽게 말하면, “이 질문에 답하려면 이 장면이 결정적이야!”를 AI가 스스로 찾아내도록 설계한 기술이다.
이 프레임워크를 연구팀은 CORTEX(Chain-of-Reasoning for Trigger Moment Extraction)라고 부른다.
연구팀의 시스템은 서로 다른 기능을 수행하는 세 모델이 순차적으로 작동하는 3단계 구조로 구성된다. 먼저 추론 AI(Gemini 2.5 Pro)가 질문에 답하기 위해 어느 순간을 봐야 하는지 사고하고 딱 그 순간(Trigger moment) 후보를 찾는다. 다음으로 객체 위치 찾기 모델(Grounding 모델, Molmo-7B)이 해당 순간 화면 속 사람·차·사물의 정확한 위치(좌표)를 파악한다. 마지막으로 추적 모델(Tracking 모델, SAM2)이 선택된 한 장면을 기준으로 앞뒤 시간대의 객체 움직임을 정밀하게 추적해 오류를 줄인다.
즉, ‘핵심 장면 한 컷을 정확히 찍고, 그 장면을 중심으로 정답 근거를 추적하는 방식’덕분에 영상 초반 오판이나 가려짐 같은 문제도 크게 줄었다.
총 23개 팀이 참여한 영상 근거 기반 질의응답(Grounded VideoQA) 트랙에서 KAIST팀 SGVR Lab(Scalable Graphics, Vision & Robotics Lab)은 ‘고차 추적 정확도(HOTA, Higher Order Tracking Accuracy)’지표에서 0.4968점을 기록하며 2등 미국 콜럼비아대의 0.4304점을 압도적인 점수 차로 상회하며 1위를 차지했다. 이는 전년도 우승 기록 0.2704점보다도 약 두 배에 가까운 성과다.
이 기술은 실생활에서도 넓게 쓰일 수 있다. 자율주행차는 사고 위험이 있는 순간을 정확히 보고, 로봇은 주변 상황을 더 똑똑하게 이해한다. 또 보안·감시 시스템은 중요한 장면을 빠르게 찾아내고, 미디어 분석에서는 사람이나 사물의 행동을 시간 순서대로 정확히 추적할 수 있다.
즉, AI가 “영상 속 실제 근거”를 보고 판단할 수 있도록 만드는 핵심 기술이다. 특히 영상 속 객체가 시간에 따라 어떻게 행동하는지 정확히 짚어내는 능력은 향후 AI의 실제 현장 적용을 크게 확장할 것으로 기대된다.

< 연구팀이 제안한 비디오 질의 응답을 위한 그라운딩 프레임워크의 파이프라인 이미지 >
이번 연구는 ICCV 2025, the 3rd Perception Test Challenge 학회에서 10월 19일자 발표하였다.
이 성과는 과학기술정보통신부 기초연구사업 중견연구와 SW스타랩 사업 ‘오픈 월드 로봇 서비스를 위한 불특정 환경 인지·행동·상호작용 알고리즘 개발’ 및 AGI 사업 ‘체화형 AGI를 위한 현실 세계 구축과 인지 에이전트 기반 이원 역량 접근법’ 과제의 지원을 받아 수행되었다.
우리 대학이 4월 과학의 달을 맞아 국내 최대 규모의 과학 축제인 ‘2026 대한민국 과학기술축제’에 참여해, AI와 로봇 공학의 정점을 선보이는 참여형 전시관 ‘KAIST Play World’를 운영한다고 10일 밝혔다. 올해 축제는 ‘2026 대한민국 과학축제 인(in) 대전(4월 17일~19일)’과 ‘2026 대한민국 과학축제 인(in) 경기(4월 24일~26일)’로 나뉘어 개최된다. KAIST는 대전 DCC(제2전시장)와 일산 킨텍스에서 순차적으로 전시를 진행하며, ‘Play World’ 콘셉트를 적용해 세대 특성에 맞춘 차별화된 체험형 콘텐츠를 선보일 예정이다. 특히 KAIST 캐릭터 ‘넙죽이’를 활용한 현장 이벤트와 기념품도 함께 제공해 관람객의 참여도를 높일 계획이다. □ [대전] 휴머노이드 로봇부터 우주 로버, AI 반도체 친구 &ls
2026-04-10우리 대학 인공지능반도체대학원은 4월 8일(수) 오전 대전 오노마 호텔에서 '제5회 한국인공지능시스템포럼(KAISF)' 조찬 강연회를 성공적으로 개최하였다. 이번 강연회는 인공지능이 물리 세계와 직접 맞닿으며 산업 현장에 빠르게 스며드는 'Physical AI' 시대를 주제로, 총 63명의 산학 전문가가 참석한 가운데 활발한 논의가 이루어졌다. 초청 강연은 ㈜NC AI 이연수 대표이사와 김민재 CTO가 '물리 내재화 기반의 차세대 피지컬 AI와 전주기 통합 플랫폼 개발 현황'을 주제로 공동 진행하였다. 강연에서는 AI 기술의 발전으로 물리 법칙을 스스로 이해하는 피지컬 AI가 로봇 산업의 판도를 바꾸고 있는 현황을 소개하며, 다음 세 가지 핵심 내용을 중심으로 전개되었다. ▲질량·마찰·탄성 등 역학적 관계를 내재화한 WFM(월드 파운데이션 모델) 핵심 기술 및 로봇 파운데이션 모델(RFM) 기반 작업 지능 최적화 ▲Sim-to-Real 간극을 최소화
2026-04-10과학기술정보통신부 이노코어(InnoCORE) 사업을 통해 구축된 연구 협력 기반 아래, KAIST 이노코어 연구진이 의미 있는 연구 성과를 도출했다. 우리 대학은 2024년 노벨 화학상 수상자인 David Baker 교수(데이비드 베이커, 미국 워싱턴대학교)의 방문을 계기로, 공동연구를 통해 AI로 원하는 화합물을 정확히 인식하는 단백질 설계 연구 결과를 공개했다. 우리 대학은 생명과학과 이규리 교수가 AI-CRED 혁신신약 이노코어(InnoCORE) 연구단에 참여 중인 연구진으로서, David Baker 교수와의 공동 연구를 통해 특정 화합물을 선택적으로 인식하는 인공 단백질을 AI로 설계하는 데 성공했다고 9일 밝혔다. 이번 연구는 AI를 활용해 특정 화합물을 인식하는 단백질을 처음부터 설계(de novo)하고, 이를 실제로 작동하는 바이오 센서로 구현한 것이 특징이다. 기존에는 자연 단백질을 탐색하거나 일부 기능을 수정하는 방식이 주를 이뤘다면, 이번 연구는 AI 기반
2026-04-09우리 대학은 한전KDN(대표이사 박상형)과 인공지능(AI)과 에너지 분야를 융합한 ‘AI+X’ 전략 기반 캠퍼스 마이크로그리드(Micro Grid, 소규모 독립형 전력망) 구축을 위한 업무협약(MOU)을 8일 체결했다고 밝혔다. 한전KDN(KEPCO Knowledge, Data & Network Co., Ltd.)은 전력 시스템에 정보통신기술(ICT)을 접목한 에너지 플랫폼을 개발·운영하는 한국전력공사 계열 공기업이다. 이번 협약은 AI 기반 전력 운영 기술을 활용해 캠퍼스 단위의 탄소중립(Net-Zero) 플랫폼을 구축하고, 이를 실증하기 위한 에너지 테스트베드를 조성하기 위해 추진됐다. 이를 통해 차세대 에너지 기술 고도화와 글로벌 비즈니스 모델 창출을 도모할 계획이다. 양 기관은 KAIST 캠퍼스를 중심으로 실제 전력 생산·소비 데이터를 활용한 AI 기반 에너지 관리 시스템(Energy Management System
2026-04-08AI 성능을 좌우해온 ‘메모리 병목’이 뚫렸다. 우리 대학이 참여한 국제 공동연구팀이 최대 6배까지 메모리를 줄이면서도 성능은 유지하는 차세대 알고리즘을 공개하며, AI 산업은 물론 반도체 수요 구조까지 바꿀 기술적 전환점을 제시했다. 고용량 중심에서 고효율 중심으로 전환되면서, AI는 더 저렴해지고 빠르게 확산되는 동시에 반도체 수요 역시 질적으로 고도화될 전망이다. 우리 대전기및전자공학부 한인수 교수가 참여한 구글 리서치(Google Research), 딥마인드(DeepMind), 뉴욕대(New York University) 공동 연구팀이 인공지능(AI) 모델의 고질적인 한계로 꼽혀온 메모리 과부하 문제를 해결할 차세대 양자화 알고리즘 ‘터보퀀트(TurboQuant)’를 공개했다고 27일 밝혔다. AI 모델은 입력 데이터를 벡터 형태로 바꾼 뒤, 벡터 간 유사도를 계산해 작동한다. 이 과정에서 고정밀(high-precision)
2026-03-28