< (왼쪽부터) KAIST 전산학부 안성진 교수, KAIST 전산학부 김영빈 석사과정, 럿거스 대학교 가텀 싱 박사과정, KAIST 전산학부 박준영 석사과정, 딥마인드 책임 연구원 찰라 걸셔(현 EPFL 교수) >
‘노란 포도'나 `보라색 바나나'와 같이 본 적 없는 시각 개념을 이해하고 상상하는 인공지능 능력 구현이 가능해졌다.
우리 대학 전산학부 안성진 교수 연구팀이 구글 딥마인드 및 미국 럿거스 대학교와의 국제 공동 연구를 통해 시각적 지식을 체계적으로 조합해 새로운 개념을 이해하는 인공지능 새로운 모델과 프로그램을 수행하는 벤치마크를 개발했다고 30일 밝혔다.
인간은 `보라색 포도'와 `노란 바나나' 같은 개념을 학습하고, 이를 분리한 뒤 재조합해 `노란 포도'나 `보라색 바나나'와 같이 본 적 없는 개념을 상상하는 능력이 있다. 이런 능력은 체계적 일반화 혹은 조합적 일반화라고 불리며, 범용 인공지능을 구현하는 데 있어 핵심적인 요소로 여겨진다.
체계적 일반화 문제는 1988년 미국의 저명한 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망이 이 문제를 해결할 수 없다고 주장한 이후, 35년 동안 인공지능 딥러닝 분야에서 큰 도전 과제로 남아 있다. 이 문제는 언어뿐만 아니라 시각 정보에서도 발생하지만, 지금까지는 주로 언어의 체계적 일반화에만 초점이 맞춰져 있었고, 시각 정보에 관한 연구는 상대적으로 부족했다.
< 그림 1. 안성진 교수 연구팀은 장면을 구성하는 물체들을 몇 가지 특성으로 분해한 뒤, 해당 특성을 정해진 규칙 아래에서 재조합하여 새로운 이미지를 생성하는 방식을 이용하였다. >
안성진 교수가 이끄는 국제 공동 연구팀은 이러한 공백을 메우고자 시각 정보에 대한 체계적 일반화를 연구할 수 있는 벤치마크를 개발했다. 시각 정보는 언어와는 달리 명확한 `단어'나 `토큰'의 구조가 없어, 이 구조를 학습하고 체계적 일반화를 달성하는 것이 큰 도전이다.
연구를 주도한 안성진 교수는 “시각 정보의 체계적 일반화가 범용 인공지능을 달성하기 위해 필수적인 능력이며 이 연구를 통해 인공지능의 추론능력과 상상능력 관련 분야의 발전을 가속할 것으로 기대한다”고 말했다.
또한, 딥마인드의 책임 연구원으로 연구에 참여한 연구원이자 현재 스위스 로잔연방공과대학교(EPFL)의 찰라 걸셔(Caglar Gulcehre) 교수는 “체계적 일반화가 가능해지면 현재보다 훨씬 적은 데이터로 더 높은 성능을 낼 수 있게 될 것이다”라고 전했다.
이번 연구는 12월 10일부터 16일까지 미국 뉴올리언스에서 열리는 제37회 신경정보처리학회(NeurIPS)에서 발표될 예정이다.
관련논문: “Imagine the Unseen World: A Benchmark for Systematic Generalization in Visual World Models”, Yeongbin Kim, Gautam Singh, Junyeong Park, Caglar Gulcehre, Sungjin Ahn, NeurIPS 23
우리 대학 전기및전자공학부 심현철 교수 연구팀이 2025년 4월 12일 아랍에미리트(UAE) 정부 후원으로 개최된 아부다비 자율 레이싱 대회(Abu Dhabi Autonomous Racing League, 이하 A2RL)의 드론 챔피언십 리그( Drone Championship League, 이하 DCL)에서 세계 3위를 차지하였다. 아부다비 국립 전시 센터 마리나(ADNEC Marina) 대회장에서 개최된 본 선 대회에서는 2024년 가을 예선을 통해 선발된 14개 팀들이 참가해 실력을 겨뤘다. 참가팀들은 ▲최단 비행시간 경연(AI Grand Challenge), ▲4대동시 자율비행, ▲양쪽에서 마주 보면서 고속으로 비행하는 드래그 레이싱, ▲AI 대 인간 조정사 대결 등 총 4개 부문에서 경합을 벌였다. 그 중 8개 팀이 최단 비행시간 경연 준결승에 진출했고, 이 중 KAIST는 네덜란드 델프트공대(TU Delft), UAE 기술혁신연구소(TII), 체코 공과대학(Czec
2025-04-18효소는 세포 내에서 일어나는 생화학적 반응을 촉매하는 단백질로, 세포의 대사 과정에서 핵심적인 역할을 수행한다. 이에 따라 새로운 효소의 기능을 규명하는 것은 미생물 세포공장 구축에서 핵심적인 과제다. KAIST 연구진이 인공지능(AI)을 활용해 자연에 존재하지 않는 새로운 효소를 설계함으로써, 미생물 세포공장 구축을 가속화하고 신약·바이오 연료 등 차세대 바이오산업의 개발 가능성을 크게 높였다. 우리 대학 생명화학공학과 이상엽 특훈교수 연구팀이 AI를 활용한 효소 기능 예측 기술의 발전 과정과 최신 동향을 정리하고, AI가 새로운 효소를 찾고 설계하는데 어떤 역할을 해왔는지 분석하여 ‘인공지능을 이용한 효소 기능 분류’를 발표했다. 이상엽 특훈교수 연구팀은 이번 연구에서 머신러닝(Machine learning)과 딥러닝(Deep learning)을 활용한 효소 기능 예측 기술의 발전 과정을 체계적으로 정리·분석하여 제공했다.
2025-04-17빅데이터와 인공지능 기반의 건설재료 품질관리 혁신 기술 제시 우리 대학 건설및환경공학과 김재홍 교수 연구팀은 시멘트 분산제의 성능을 정밀하게 평가할 수 있는 자동화 실험 시스템을 개발했다. 이 시스템은 기존 수작업 실험의 한계를 극복하고, 데이터 사이언스와 머신러닝 기법을 활용해 시멘트 기반 재료의 품질 관리를 혁신적으로 개선할 수 있는 길을 열었다. 건설재료 품질관리의 도전과제 콘크리트는 전 세계에서 가장 많이 생산되는 공학 재료지만, 시멘트와 골재 같은 원재료가 지역마다 성질이 달라 품질과 성능의 변동성이 크다. 따라서 콘크리트 재료의 성능 시험에는 많은 수의 샘플이 필요하며, 이는 노동 집약적인 작업으로 이어진다. 김재홍 교수는 "건설재료는 다른 공학 재료에 비해 변동성이 매우 크기 때문에, 재료의 성능평가 신뢰성을 높이려면 충분한 양의 데이터가 필요합니다. 이를 위해서는 많은 수의 샘플을 제조하고 테스트해야 하는데, 기존의 수작업 방식으로는 단순히 품질 검증을 위한
2025-04-14우리 대학은 세계적인 미디어 아티스트인 문화기술대학원 이진준 교수와 글로벌 아티스트 지드래곤(G-DRAGON)과의 협업을 통해, 지난 4월 9일 KAIST 우주연구원에서 실시한 세계 최초로 미디어아트를 기반으로 한 '우주 음원 송출 프로젝트'를 성공적으로 추진했다. 이번 프로젝트는 KAIST와 갤럭시코퍼레이션과 추진 중인‘AI 엔터테크 연구센터’의 일환으로 제안된 것이다. 갤럭시코퍼레이션 소속 아티스트이자 KAIST 기계공학과 초빙교수로 활동 중인 가수 지드래곤(본명 권지용)의 메세지와 음원을 세계 최초로 우주로 송출하는 프로젝트이다. 과학기술, 예술, 대중음악이 결합된 융복합 프로젝트로, KAIST의 첨단 우주 기술과 이진준 교수의 미디어아트 작품, 그리고 지드래곤의 음성과 음원(홈스윗홈, HOME SWEET HOME)이 하나로 연결된 새로운 형태의 ‘우주 문화 콘텐츠’ 실험이다. 이번 협업은 ‘인간 내면의 우주를
2025-04-10우리 대학은 인공지능(AI) 엔터테크 기업 갤럭시코퍼레이션(대표 최용호)과 함께 ‘AI 엔터테크 연구센터’ 설립을 위한 현판식을 KAIST 본원에서 개최한다. 이번 협력은 KAIST가 추진해 온 예술 융합 연구 전략의 일환으로, 과학기술을 기반으로 한 창의적 문화 콘텐츠 개발을 통해 미래형 K-Culture를 주도하려는 노력의 연장선에 있다. KAIST는 단순한 기술 개발을 넘어, 감성 기술과 문화적 상상력의 융합을 통해 콘텐츠 산업의 지평을 넓히는 ‘테크-아트(Tech-Art)’ 융합 모델을 지속적으로 실현해 오고 있다. 앞서 KAIST는 세계적인 소프라노 조수미 초빙석학교수와의 협력으로 ‘조수미 아트&테크 연구센터’를 설립하고, AI 기반의 인터랙티브 공연 기술, 몰입형 콘텐츠 등 예술과 공학의 융합 연구를 선도해왔다. 이번 ‘AI 엔터테크 연구센터’ 설립은 K-콘텐츠 산업의 기술
2025-04-09