< KAIST 김재철AI대학원 최재식 교수 >
최근 텍스트 기반 이미지 생성 모델은 자연어로 제공된 설명만으로도 고해상도·고품질 이미지를 자동 생성할 수 있다. 하지만, 대표적인 예인 스테이블 디퓨전(Stable Diffusion) 모델에서 ‘창의적인’이라는 텍스트를 입력했을 경우, 창의적인 이미지 생성은 아직은 제한적인 수준이다. KAIST 연구진이 스테이블 디퓨전(Stable Diffusion) 등 텍스트 기반 이미지 생성 모델에 별도 학습 없이 창의성을 강화할 수 있는 기술을 개발해, 예컨대 뻔하지 않은 창의적인 의자 디자인도 인공지능이 스스로 그려낼 수 있게 됐다.
우리 대학 김재철AI대학원 최재식 교수 연구팀이 네이버(NAVER) AI Lab과 공동 연구를 통해, 추가적 학습 없이 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다.
< NAVER AI Lab 이가영 연구원, KAIST 김재철AI대학원 권다희 박사과정, KAIST 김재철AI대학원 한지연 박사과정, NAVER AI Lab 김준호 연구원 >
최 교수 연구팀은 텍스트 기반 이미지 생성 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 기술을 개발했다. 또한, 모델 내부의 얕은 블록들이 창의적 생성에 중요한 역할을 한다는 것을 발견하고, 특징 맵을 주파수 영역으로 변환 후, 높은 주파수 영역에 해당하는 부분의 값을 증폭하면 노이즈나 작게 조각난 색깔 패턴의 형태를 유발하는 것을 확인했다. 이에 따라, 연구팀은 얕은 블록의 낮은 주파수 영역을 증폭함으로써 효과적으로 창의적 생성을 강화할 수 있음을 보였다.
연구팀은 창의성을 정의하는 두 가지 핵심 요소인 독창성과 유용성을 모두 고려해, 생성 모델 내부의 각 블록 별로 최적의 증폭 값을 자동으로 선택하는 알고리즘을 제시했다.
개발된 알고리즘을 통해 사전 학습된 스테이블 디퓨전 모델의 내부 특징 맵을 적절히 증폭해 추가적인 분류 데이터나 학습 없이 창의적 생성을 강화할 수 있었다.
< 그림 1. 개발팀에서 연구한 방법론 개요. 사전 학습된 생성 모델의 내부 특징맵을 고속푸리에변환을 통해 주파수 영역으로 변환 후, 낮은 주파수 영역의 특징맵을 증폭, 다시 고속푸리에역변환을 통해 특징공간으로 재변환하여 이미지를 생성한다. >
연구팀은 개발된 알고리즘을 사용하면 기존 모델 대비 더욱 참신하면서도 유용성이 크게 저하되지 않은 이미지를 생성할 수 있음을 다양한 측정치를 활용해 정량적으로 입증했다.
특히, 스테이블 디퓨전 XL(SDXL) 모델의 이미지 생성 속도를 대폭 향상하기 위해 개발된 SDXL-Turbo 모델에서 발생하는 모드 붕괴 문제를 완화함으로써 이미지 다양성이 증가한 것을 확인했다. 나아가, 사용자 연구를 통해 사람이 직접 평가했을 때도 기존 방법에 비해 유용성 대비 참신성이 크게 향상됨을 입증했다.
공동 제1 저자인 KAIST 한지연, 권다희 박사과정은 "생성 모델을 새로 학습하거나 미세조정 학습하지 않고 생성 모델의 창의적인 생성을 강화하는 최초의 방법론ˮ이라며 "학습된 인공지능 생성 모델 내부에 잠재된 창의성을 특징 맵 조작을 통해 강화할 수 있음을 보였다ˮ 라고 말했다.
이어 “이번 연구는 기존 학습된 모델에서도 텍스트만으로 창의적 이미지를 손쉽게 생성할 수 있게 됐으며, 이를 통해 창의적인 상품 디자인 등 다양한 분야에서 새로운 영감을 제공하고, 인공지능 모델이 창의적 생태계에서 실질적으로 유용하게 활용될 수 있도록 기여할 것으로 기대된다”라고 밝혔다.
< 그림 2. 개발팀에서 연구한 방법론의 적용 사례. 다양한 Stable Diffusion 모델에서 기존 생성 대비 생성 대상의 의미를 유지하면서도 참신한 이미지를 생성함. >
KAIST 김재철AI대학원 한지연 박사과정과 권다희 박사과정이 공동 제1 저자로 참여한 이번 연구는 국제 학술지 `국제 컴퓨터 비전 및 패턴인식 학술대회 (IEEE Conference on Computer Vision and Pattern Recognition, CVPR)’에서 6월 15일 발표됐다.
※논문명 : Enhancing Creative Generation on Stable Diffusion-based Models
※DOI: https://doi.org/10.48550/arXiv.2503.23538
한편 이번 연구는 KAIST-네이버 초창의적 AI 연구센터, 과학기술정보통신부의 재원으로 정보통신기획평가원의 지원을 받은 혁신성장동력프로젝트 설명가능인공지능, AI 연구거점 프로젝트, 점차 강화되고 있는 윤리 정책에 발맞춰 유연하게 진화하는 인공지능 기술 개발 연구 및 KAIST 인공지능 대학원 프로그램과제의 지원을 받았고 방위사업청과 국방과학연구소의 지원으로 KAIST 미래 국방 인공지능 특화연구센터에서 수행됐다.
우리 대학과 다임리서치는 2025년 6월 25일 KAIST 본원 기계공학동(N7, 1601호)에서 “피지컬 AI와 SDx가 창조하는 제조와 자동화산업의 미래”라는 주제로 국내 최초 피지컬 AI 기반 제조 혁신 포럼을 개최하였다. 최근 인공지능(AI)은 단순한 언어 처리나 데이터 분석을 넘어 현실 공간에서 직접 작동하는 ‘피지컬 AI (Physical AI)’ 시대로 진입하고 있다. 챗GPT와 같은 언어 모델이 인간의 사고를 모사하는 ‘언어형 AI’였다면, 피지컬 AI는 공간과 시간의 맥락을 인식하고 물리적 행동을 수행하는 “움직이는 지능”으로서 제조, 물류, 건설, 농업 등 산업 전반을 혁신하는 새로운 산업의 기회로 떠오르고 있다. 포럼은 크게 두 개 세션으로 구성되며, 첫 번째 세션에서는 현대자동차의 민정국 상무가 세계 최초로 현대차가 도입한 Software-Defined Factory (
2025-06-25새 정부 출범과 함께 AI 및 과학기술 분야에 대한 사회적 관심이 크게 높아진 가운데, 우리 대학은 과학기술을 기반으로 국가 혁신을 주도하고 인류의 문제 해결에 앞장서는‘AI 중심 가치 창출형 과학기술특성화대학’으로 거듭날 계획임을 24일 밝혔다. 대한민국이 기술 주도형 사회로 대전환을 맞이하는 시점에서 KAIST는 지난 반세기 동안 국가 발전사의 '스타터킷(Starter Kit)' 역할을 수행해온 경험을 토대로, 단순한 교육·연구기관을 넘어 새로운 사회적 가치를 창출하는 글로벌 혁신 허브로의 도약을 준비하고 있다. 특히 우리 대학은 대한민국이 인공지능 주요 3개국(G3)에 도약할 수 있도록 전 국민이 소외 없이 AI를 활용할 수 있는 'AI 기본사회' 실현을 비전으로 제시했다. 이를 위해 KAIST가 주관하는 대한민국을 대표하는 ‘국가AI연구거점’사업(책임자 김기응)을 통해 AI 기술을 기반으로 산업 경쟁력을 제고하고 사회
2025-06-24생성형 AI 기술이 발전하면서 이를 악용한 온라인 여론 조작 우려가 커지고 있다. 이에 따른 AI 생성글 탐지 기술도 개발되었는데 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발돼, 짧고(평균 51자), 구어체 표현이 많은 한국어 뉴스 댓글에는 적용이 어려웠다. 우리 연구진이 한국어 AI 생성 댓글을 탐지하는 기술을 개발해서 화제다. 우리 대학 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소(국보연)와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다. 최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정과 논조까지 조절할 수 있으며, 몇 시간 만에 수십만 개의 댓글을 자동 생성할 수 있어 여론 조작에 악용될 수 있다. OpenAI의 GPT-4o API를 기준으로 하면 댓글 1개 생성 비용은 약 1원 수준이며, 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원이면 가능할 정도다.
2025-06-24우리 대학은 과학기술정보통신부(장관 유상임, 이하 과기정통부) 및 DGIST, GIST, UNIST*와 협력하여, AI 융합(AI+S&T) 첨단 전략 연구를 이끌 ‘이노코어(InnoCORE) 연구단’을 출범하고, 이를 통해 세계 최고 수준 박사후연구원(Postdoctoral researcher) 최대 200명 채용을 본격 추진한다고 16일 밝혔다. * DGIST(대구경북과학기술원),, GIST(광주과학기술원), UNIST(울산과학기술원) ‘이노코어(InnoCORE) 연구단’은 AI 융합 분야의 혁신(Innovation)을 이끌 핵심(Core) 연구인력 육성을 목표로, AI+과학기술 분야의 고급 연구인재를 집중 양성·유치한다. 이는 글로벌 AI 인재 확보 경쟁이 가속화되는 가운데 국내 인재의 두뇌유출 방지 및 해외 우수 인재 유치의 전략적 대응책이다. 우리 대학은 이번 사업을 통해 국내·외 최상위 박사
2025-06-17임산부의 입덧 완화 목적으로 사용됐던 약물인 탈리도마이드(Thalidomide)는 생체 내에서는 광학 이성질체*의 특성으로 한쪽 이성질체는 진정 효과를 나타내지만, 다른 쪽은 기형 유발이라는 심각한 부작용을 일으킨다. 이런 예처럼, 신약 개발에서는 원하는 광학 이성질체만을 선택적으로 합성하는 정밀 유기합성 기술이 중요하다. 하지만, 여러 반응물을 동시에 분석하는 것 자체가 어려웠던 기존 방식을 극복하고, 우리 연구진이 세계 최초로 21종의 반응물을 동시에 정밀 분석하는 기술을 개발해, AI와 로봇을 활용하는 신약 개발에 획기적인 기여가 기대된다. *광학 이성질체: 동일한 화학식을 가지며 거울상 관계에 있으면서 서로 겹칠 수 없는 비대칭 구조로 존재하는 분자 쌍을 말한다. 이는 왼손과 오른손처럼 형태는 유사하지만 포개어지지 않는 관계와 유사하다. 우리 대학 화학과 김현우 교수 연구팀이 인공지능 기반 자율합성* 시대에 적합한 혁신적인 광학이성질체 분석 기술을 개발했다고 16일
2025-06-16