음악 창작자가 초기 아이디어를 생각하거나 창작 중간 막힐 때, 이를 같이 해결해 주고 다양한 음악적 방향 탐색에 실질적인 도움을 주는 동료가 있다면 얼마나 좋을까? KAIST 연구진이 이런 음악 창작을 돕는 동료 작가와 같은 AI 기술을 개발했다.
KAIST(총장 이광형)는 전기및전자공학부 이성주 교수 연구팀이 AI 기반 음악 창작 지원 시스템 어뮤즈(Amuse)를 개발하였다. 이 연구 결과는 4월 26일부터 5월 1일까지 일본 요코하마에서 열린 인간-컴퓨터 상호작용 분야 세계 최고 권위의 국제학술대회인 CHI(ACM Conference on Human Factors in Computing Systems)에서 전체 논문 중 상위 1%에게만 수여되는 최우수 논문상(Best Paper Award)을 수상했다고 7일 밝혔다.
< (왼쪽부터) 카네기 멜런대 크리스 도너휴 교수, 전기및전자공학부 김예원 박사과정, 이성주 교수 >
이성주 교수 연구팀이 개발한 어뮤즈(Amuse) 시스템은 텍스트, 이미지, 오디오와 같은 다양한 형식의 영감을 입력하면 이를 화성 구조(코드 진행)로 변환해 작곡을 지원해 주는 AI 기반 시스템이다.
예를 들어, 사용자가 ‘따뜻한 여름 해변의 기억’과 같은 문구나 이미지, 사운드 클립을 입력하면, 어뮤즈는 해당 영감에 어울리는 코드 진행을 자동으로 생성해 제안한다.
기존의 생성 AI와 달리, 어뮤즈는 사용자의 창작 흐름을 존중하고, AI의 제안을 유연하게 통합·수정할 수 있는 상호작용 방식을 통해 창의적 탐색을 자연스럽게 유도한다는 점에서 차별성을 갖는다.
어뮤즈 시스템의 핵심 기술은 대형 언어 모델의 이용해 사용자의 영감으로 프롬프트에 입력한 글자 따라 이에 어울리는 음악 코드를 생성하고, 실제 음악 데이터를 학습한 AI 모델이 부자연스럽거나 어색한 결과는 걸러내는(리젝션 샘플링) 과정을 거쳐 결합한 두 가지 방법을 자연스럽게 이어 재현하는 하이브리드 생성 방식이다.
< 그림. 어뮤즈(Amuse)의 시스템 구성. 사용자 입력으로부터 음악 키워드를 추출한 뒤, 대형 언어 모델 기반 코드 진행을 생성하고 리젝션 샘플링으로 정제한다(왼쪽). 오디오 입력으로부터 코드 추출도 가능하다(오른쪽). 하단은 생성된 코드의 화성 구조를 시각화한 예시이다. >
연구팀은 실제 뮤지션들을 대상으로 한 사용자 연구를 수행하여, 어뮤즈가 단순한 음악 생성 AI가 아닌, 사람과 AI가 협업하는 창작 동반자(Co-Creative AI)로서의 가능성이 높다는 평가를 받았다.
KAIST 전기 및 전자공학부 박사과정 김예원, 이성주 교수, 카네기 멜런 대학의 크리스 도너휴(Chris Donahue) 교수가 참여한 해당 논문은 학계 및 산업계 모두의 창의적 AI 시스템 설계의 가능성을 보여주었다.
※ 논문명 : Amuse: Human-AI Collaborative Songwriting with Multimodal Inspirations DOI : https://doi.org/10.1145/3706598.3713818
※ 연구 데모 영상: https://youtu.be/udilkRSnftI?si=FNXccC9EjxHOCrm1
※ 연구 홈페이지: https://nmsl.kaist.ac.kr/projects/amuse/
이성주 교수는 “ 최근 생성형 AI 기술은 저작권이 있는 콘텐츠를 그대로 모방하여 창작자의 저작권을 침해하거나, 창작자의 의도와는 무관하게 일방향으로 결과물을 생성한다는 점에서 우려를 낳고 있다. 이에 연구팀은 이러한 흐름에 문제 의식을 가지고, 창작자가 실제로 필요로 하는 것이 무엇인지에 주목하며 창작자 중심의 AI 시스템 설계에 주안점을 두었다.”라고 말했다.
이어 ”어뮤즈는 창작자의 주도권을 유지한 채, 인공지능과의 협업 가능성을 탐색하는 시도로, 향후 음악 창작 도구와 생성형 AI 시스템의 개발에 있어 보다 창작자 친화적인 방향을 제시하는 출발점이 될 것으로 기대된다.“라고 설명했다.
이 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행되었다.(RS-2024-00337007)
우리 대학과 다임리서치는 2025년 6월 25일 KAIST 본원 기계공학동(N7, 1601호)에서 “피지컬 AI와 SDx가 창조하는 제조와 자동화산업의 미래”라는 주제로 국내 최초 피지컬 AI 기반 제조 혁신 포럼을 개최하였다. 최근 인공지능(AI)은 단순한 언어 처리나 데이터 분석을 넘어 현실 공간에서 직접 작동하는 ‘피지컬 AI (Physical AI)’ 시대로 진입하고 있다. 챗GPT와 같은 언어 모델이 인간의 사고를 모사하는 ‘언어형 AI’였다면, 피지컬 AI는 공간과 시간의 맥락을 인식하고 물리적 행동을 수행하는 “움직이는 지능”으로서 제조, 물류, 건설, 농업 등 산업 전반을 혁신하는 새로운 산업의 기회로 떠오르고 있다. 포럼은 크게 두 개 세션으로 구성되며, 첫 번째 세션에서는 현대자동차의 민정국 상무가 세계 최초로 현대차가 도입한 Software-Defined Factory (
2025-06-25새 정부 출범과 함께 AI 및 과학기술 분야에 대한 사회적 관심이 크게 높아진 가운데, 우리 대학은 과학기술을 기반으로 국가 혁신을 주도하고 인류의 문제 해결에 앞장서는‘AI 중심 가치 창출형 과학기술특성화대학’으로 거듭날 계획임을 24일 밝혔다. 대한민국이 기술 주도형 사회로 대전환을 맞이하는 시점에서 KAIST는 지난 반세기 동안 국가 발전사의 '스타터킷(Starter Kit)' 역할을 수행해온 경험을 토대로, 단순한 교육·연구기관을 넘어 새로운 사회적 가치를 창출하는 글로벌 혁신 허브로의 도약을 준비하고 있다. 특히 우리 대학은 대한민국이 인공지능 주요 3개국(G3)에 도약할 수 있도록 전 국민이 소외 없이 AI를 활용할 수 있는 'AI 기본사회' 실현을 비전으로 제시했다. 이를 위해 KAIST가 주관하는 대한민국을 대표하는 ‘국가AI연구거점’사업(책임자 김기응)을 통해 AI 기술을 기반으로 산업 경쟁력을 제고하고 사회
2025-06-24생성형 AI 기술이 발전하면서 이를 악용한 온라인 여론 조작 우려가 커지고 있다. 이에 따른 AI 생성글 탐지 기술도 개발되었는데 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발돼, 짧고(평균 51자), 구어체 표현이 많은 한국어 뉴스 댓글에는 적용이 어려웠다. 우리 연구진이 한국어 AI 생성 댓글을 탐지하는 기술을 개발해서 화제다. 우리 대학 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소(국보연)와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다. 최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정과 논조까지 조절할 수 있으며, 몇 시간 만에 수십만 개의 댓글을 자동 생성할 수 있어 여론 조작에 악용될 수 있다. OpenAI의 GPT-4o API를 기준으로 하면 댓글 1개 생성 비용은 약 1원 수준이며, 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원이면 가능할 정도다.
2025-06-24최근 텍스트 기반 이미지 생성 모델은 자연어로 제공된 설명만으로도 고해상도·고품질 이미지를 자동 생성할 수 있다. 하지만, 대표적인 예인 스테이블 디퓨전(Stable Diffusion) 모델에서 ‘창의적인’이라는 텍스트를 입력했을 경우, 창의적인 이미지 생성은 아직은 제한적인 수준이다. KAIST 연구진이 스테이블 디퓨전(Stable Diffusion) 등 텍스트 기반 이미지 생성 모델에 별도 학습 없이 창의성을 강화할 수 있는 기술을 개발해, 예컨대 뻔하지 않은 창의적인 의자 디자인도 인공지능이 스스로 그려낼 수 있게 됐다. 우리 대학 김재철AI대학원 최재식 교수 연구팀이 네이버(NAVER) AI Lab과 공동 연구를 통해, 추가적 학습 없이 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다. 최 교수 연구팀은 텍스트 기반 이미지 생성 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 기술을 개발했다. 또한, 모
2025-06-19우리 대학은 과학기술정보통신부(장관 유상임, 이하 과기정통부) 및 DGIST, GIST, UNIST*와 협력하여, AI 융합(AI+S&T) 첨단 전략 연구를 이끌 ‘이노코어(InnoCORE) 연구단’을 출범하고, 이를 통해 세계 최고 수준 박사후연구원(Postdoctoral researcher) 최대 200명 채용을 본격 추진한다고 16일 밝혔다. * DGIST(대구경북과학기술원),, GIST(광주과학기술원), UNIST(울산과학기술원) ‘이노코어(InnoCORE) 연구단’은 AI 융합 분야의 혁신(Innovation)을 이끌 핵심(Core) 연구인력 육성을 목표로, AI+과학기술 분야의 고급 연구인재를 집중 양성·유치한다. 이는 글로벌 AI 인재 확보 경쟁이 가속화되는 가운데 국내 인재의 두뇌유출 방지 및 해외 우수 인재 유치의 전략적 대응책이다. 우리 대학은 이번 사업을 통해 국내·외 최상위 박사
2025-06-17