
< (왼쪽부터) KAIST 김현우 교수, 이상혁 박사후연구원, 송태훈 석사과정, 고려대학교 박지환 박사과정 >
새 스마트폰을 바꿀 때마다 연락처와 사진을 처음부터 다시 옮겨야 한다면 얼마나 불편할까. 지금의 인공지능(AI) 모델들도 이와 비슷한 상황에 놓여 있다. 성능이 더 좋은 새로운 ChatGPT 같은 AI 모델이 등장할 때마다, 특정 분야의 지식을 갖추기 위해 막대한 데이터와 비용을 들여 다시 학습해야 했기 때문이다. 한국 연구진이 이러한 비효율을 해결할 수 있는 AI 모델 간 ‘지식 이식’ 기술을 개발했다.
우리 대학은 전산학부 김현우 교수 연구팀이 고려대학교(총장 김동원) 연구팀과 공동연구를 통해, 서로 다른 인공지능 모델 사이에서 학습된 지식을 효과적으로 ‘이식’할 수 있는 새로운 기술을 개발했다고 27일 밝혔다.
최근 인공지능 분야에서는 사진과 글을 함께 이해하는 시각–언어 모델(Vision-Language Model, VLM)이 빠르게 발전하고 있다. 이는 사용자가 사진을 보여주며 질문하면 설명을 해주는 ChatGPT와 같은 멀티모달 AI를 떠올리면 이해하기 쉽다. 이러한 모델들은 대규모 이미지와 언어 데이터를 사전 학습해, 적은 양의 데이터만으로도 새로운 분야에 비교적 빠르게 적응할 수 있다는 장점을 지닌다.
그러나 새로운 AI 모델이 나올 때마다 이러한 ‘적응 과정’을 처음부터 다시 수행해야 한다는 점이 큰 비효율로 지적돼 왔다. 기존의 적응 기법들 역시 모델 구조가 조금만 달라져도 그대로 활용하기 어렵거나, 여러 모델을 동시에 사용해야 해 메모리와 연산 비용이 크게 증가하는 한계를 안고 있었다.
연구팀은 이러한 문제를 해결하기 위해 모델의 구조나 크기에 상관없이 학습된 지식을 재사용할 수 있는 전이 가능한 적응 기법(Transferable adaptation)인 ‘TransMiter’를 제안했다. 이 기술의 핵심은 한 AI가 학습하며 쌓은 ‘적응 경험’을 다른 AI 모델로 직접 옮기는 것이다.

< TransMiter: 모델 구조, 크기 등에 관계 없이 재사용 가능한 적응지식 전이 기법 >
연구진 기술은 AI의 복잡한 내부 구조를 뜯어고치지 않고, 예측 결과(output)만 보고 배운 요령을 다른 AI에게 전해주는 방식이다. 서로 생김새가 다른 AI 모델이라도 같은 질문에 내놓은 답변을 기준으로 정리해 주면, 한 AI가 익힌 노하우를 다른 AI도 바로 활용할 수 있다. 그래서 복잡하고 시간이 많이 드는 학습 과정을 다시 거칠 필요가 없고, 속도도 거의 느려지지 않는다.
이번 연구는 그동안 모델 구조나 크기가 다르면 재사용이 거의 불가능하다고 여겨졌던 AI의 적응 지식을 모델 종류에 상관없이 정밀하게 이식할 수 있음을 처음으로 입증했다는 점에서 의미가 크다. 이를 통해 반복적인 학습 비용을 줄일 수 있을 뿐 아니라, 필요한 분야에 맞춰 거대언어모델을 실시간으로 업데이트하는 이른바 ‘지식 패치(patch)’ 기술로의 활용도 기대된다.
김현우 교수는 “이번 연구를 확장하면, 빠르게 발전하는 초거대언어모델이 등장할 때마다 반복적으로 수행해야 했던 후학습(post-training)의 비용을 크게 줄일 수 있다”며, “특정 분야의 전문 지식을 손쉽게 추가하는 ‘모델 패치’가 가능해질 것”이라고 설명했다.
이번 연구에는 KAIST 전산학부 송태훈 석사과정 학생, 이상혁 박사후연구원, 고려대학교 박지환 박사과정 학생이 공동 저자로 참여했으며, 김현우 교수가 교신저자를 맡았다. 연구 결과는 인공지능 분야 최고 권위의 국제 학술대회인 AAAI 2026(Association for the Advancement of Artificial Intelligence)에 구두 발표(25년 기준 채택률 4.6%)로 채택돼, 1월 25일 발표됐다.
※ 논문명: Transferable Model-agnostic Vision-Language Model Adaptation for Efficient Weak-to-Strong Generalization. DOI : https://doi.org/10.48550/arXiv.2508.08604
한편, 김현우 교수 연구실은 이번 논문을 포함해 구글 클라우드 AI와 공동 진행한 문서내의 테이블 이해를 고도화한 기술인 TabFlash 포함하여 해당 학회에 총 3편의 논문을 발표했다.
우리 대학이 4월 과학의 달을 맞아 국내 최대 규모의 과학 축제인 ‘2026 대한민국 과학기술축제’에 참여해, AI와 로봇 공학의 정점을 선보이는 참여형 전시관 ‘KAIST Play World’를 운영한다고 10일 밝혔다. 올해 축제는 ‘2026 대한민국 과학축제 인(in) 대전(4월 17일~19일)’과 ‘2026 대한민국 과학축제 인(in) 경기(4월 24일~26일)’로 나뉘어 개최된다. KAIST는 대전 DCC(제2전시장)와 일산 킨텍스에서 순차적으로 전시를 진행하며, ‘Play World’ 콘셉트를 적용해 세대 특성에 맞춘 차별화된 체험형 콘텐츠를 선보일 예정이다. 특히 KAIST 캐릭터 ‘넙죽이’를 활용한 현장 이벤트와 기념품도 함께 제공해 관람객의 참여도를 높일 계획이다. □ [대전] 휴머노이드 로봇부터 우주 로버, AI 반도체 친구 &ls
2026-04-10우리 대학 인공지능반도체대학원은 4월 8일(수) 오전 대전 오노마 호텔에서 '제5회 한국인공지능시스템포럼(KAISF)' 조찬 강연회를 성공적으로 개최하였다. 이번 강연회는 인공지능이 물리 세계와 직접 맞닿으며 산업 현장에 빠르게 스며드는 'Physical AI' 시대를 주제로, 총 63명의 산학 전문가가 참석한 가운데 활발한 논의가 이루어졌다. 초청 강연은 ㈜NC AI 이연수 대표이사와 김민재 CTO가 '물리 내재화 기반의 차세대 피지컬 AI와 전주기 통합 플랫폼 개발 현황'을 주제로 공동 진행하였다. 강연에서는 AI 기술의 발전으로 물리 법칙을 스스로 이해하는 피지컬 AI가 로봇 산업의 판도를 바꾸고 있는 현황을 소개하며, 다음 세 가지 핵심 내용을 중심으로 전개되었다. ▲질량·마찰·탄성 등 역학적 관계를 내재화한 WFM(월드 파운데이션 모델) 핵심 기술 및 로봇 파운데이션 모델(RFM) 기반 작업 지능 최적화 ▲Sim-to-Real 간극을 최소화
2026-04-10과학기술정보통신부 이노코어(InnoCORE) 사업을 통해 구축된 연구 협력 기반 아래, KAIST 이노코어 연구진이 의미 있는 연구 성과를 도출했다. 우리 대학은 2024년 노벨 화학상 수상자인 David Baker 교수(데이비드 베이커, 미국 워싱턴대학교)의 방문을 계기로, 공동연구를 통해 AI로 원하는 화합물을 정확히 인식하는 단백질 설계 연구 결과를 공개했다. 우리 대학은 생명과학과 이규리 교수가 AI-CRED 혁신신약 이노코어(InnoCORE) 연구단에 참여 중인 연구진으로서, David Baker 교수와의 공동 연구를 통해 특정 화합물을 선택적으로 인식하는 인공 단백질을 AI로 설계하는 데 성공했다고 9일 밝혔다. 이번 연구는 AI를 활용해 특정 화합물을 인식하는 단백질을 처음부터 설계(de novo)하고, 이를 실제로 작동하는 바이오 센서로 구현한 것이 특징이다. 기존에는 자연 단백질을 탐색하거나 일부 기능을 수정하는 방식이 주를 이뤘다면, 이번 연구는 AI 기반
2026-04-09우리 대학은 한전KDN(대표이사 박상형)과 인공지능(AI)과 에너지 분야를 융합한 ‘AI+X’ 전략 기반 캠퍼스 마이크로그리드(Micro Grid, 소규모 독립형 전력망) 구축을 위한 업무협약(MOU)을 8일 체결했다고 밝혔다. 한전KDN(KEPCO Knowledge, Data & Network Co., Ltd.)은 전력 시스템에 정보통신기술(ICT)을 접목한 에너지 플랫폼을 개발·운영하는 한국전력공사 계열 공기업이다. 이번 협약은 AI 기반 전력 운영 기술을 활용해 캠퍼스 단위의 탄소중립(Net-Zero) 플랫폼을 구축하고, 이를 실증하기 위한 에너지 테스트베드를 조성하기 위해 추진됐다. 이를 통해 차세대 에너지 기술 고도화와 글로벌 비즈니스 모델 창출을 도모할 계획이다. 양 기관은 KAIST 캠퍼스를 중심으로 실제 전력 생산·소비 데이터를 활용한 AI 기반 에너지 관리 시스템(Energy Management System
2026-04-08AI 성능을 좌우해온 ‘메모리 병목’이 뚫렸다. 우리 대학이 참여한 국제 공동연구팀이 최대 6배까지 메모리를 줄이면서도 성능은 유지하는 차세대 알고리즘을 공개하며, AI 산업은 물론 반도체 수요 구조까지 바꿀 기술적 전환점을 제시했다. 고용량 중심에서 고효율 중심으로 전환되면서, AI는 더 저렴해지고 빠르게 확산되는 동시에 반도체 수요 역시 질적으로 고도화될 전망이다. 우리 대전기및전자공학부 한인수 교수가 참여한 구글 리서치(Google Research), 딥마인드(DeepMind), 뉴욕대(New York University) 공동 연구팀이 인공지능(AI) 모델의 고질적인 한계로 꼽혀온 메모리 과부하 문제를 해결할 차세대 양자화 알고리즘 ‘터보퀀트(TurboQuant)’를 공개했다고 27일 밝혔다. AI 모델은 입력 데이터를 벡터 형태로 바꾼 뒤, 벡터 간 유사도를 계산해 작동한다. 이 과정에서 고정밀(high-precision)
2026-03-28