
< (왼쪽부터) KAIST 오성룡 박사과정, 김윤성 박사과정, 김원웅 박사과정, 이유빈 박사과정, 정지용 석사과정 (동그라미 사진 왼쪽부터) 전산학부 박종세 교수, 조지아텍 다비야 마하잔 교수, 스웨덴 웁살라 대학 박창현 교수 >
최근 인공지능(AI) 모델이 길고 복잡한 문장을 이해하고 처리하는 능력이 커지면서, 연산 속도와 메모리 효율을 동시에 높일 수 있는 새로운 반도체 기술의 필요성이 커지고 있다. 이런 가운데 우리 대학 ·국제연구진이 거대언어모델(LLM)의 추론 속도는 4배 높이면서 전력 소비는 2.2배 줄인 트랜스포머(Transformer)와 맘바(Mamba) 하이브리드 구조 기반의 AI 반도체 핵심 두뇌 기술을 세계 최초로 메모리 내부에서 직접 연산이 가능한 형태로 구현하는 데 성공했다.
우리 대학은 박종세 교수 연구팀이 미국 조지아 공과대학교(Georgia Institute of Technology) 및 스웨덴 웁살라 대학교(Uppsala University)와 공동연구를 통해, 차세대 인공지능 모델의 두뇌 역할을 하는 ‘AI 메모리 반도체(PIM, Processing-in-Memory)’ 기반 기술 ‘PIMBA’를 개발했다고 17일 밝혔다.
현재 ChatGPT, GPT-4, Claude, Gemini, Llama 등 LLM은 모든 단어를 동시에 보는 ‘트랜스포머(Transformer)’ 두뇌 구조를 기반으로 작동한다. 이에 따라, AI 모델이 커지고 처리 문장이 길어질수록 연산량과 메모리 요구량이 급증해, 속도 저하와 에너지 소모가 주요 문제로 지적돼 왔다.
이런 트랜스포머 문제점을 보완하기 위해 최근 제시된 순차형 기억형 두뇌인 ‘맘바(Mamba)’ 구조는 시간의 흐름에 따라 정보를 처리하는 방식을 도입해 효율을 높였지만, 여전히 메모리 병목 현상(memory bottleneck)과 전력 소모 한계가 남아 있었다.
박종세 교수 연구팀은 트랜스포머와 맘바의 장점을 결합한 ‘트랜스포머–맘바 하이브리드 모델’의 성능을 극대화하기 위해, 연산을 메모리 내부에서 직접 수행하는 새로운 반도체 구조 ‘PIMBA’를 설계했다.
기존 GPU 기반 시스템은 데이터를 메모리 밖으로 옮겨 연산을 수행하지만, PIMBA는 데이터를 옮기지 않고 저장장치 내부에서 바로 계산을 수행한다. 이로써 데이터 이동 시간을 최소화하고 전력 소모를 크게 줄일 수 있다.

< 포스트-트랜스포머 모델 분석 및 문제해결형 가속 시스템 제안 >
그 결과, 실제 실험에서 PIMBA는 기존 GPU 시스템 대비 처리 성능이 최대 4.1배 향상되었고, 에너지 소비는 평균 2.2배 감소하는 성과를 보였다.
연구 성과는 오는 10월 20일 서울에서 열리는 세계적 컴퓨터 구조 학술대회 ‘제58회 국제 마이크로아키텍처 심포지엄(MICRO 2025)’에서 발표될 예정이며, 앞서 ‘제31회 삼성휴먼테크 논문대상’ 금상을 수상해 우수성을 인정받았다.
※논문명: Pimba: A Processing-in-Memory Acceleration for Post-Transformer Large Language Model Serving, DOI: 10.1145/3725843.3756121
이번 연구는 정보통신기획평가원(IITP), 인공지능반도체대학원 지원사업, 그리고 과학기술정보통신부와 정보통신기획평가원의 ICT R&D 프로그램의 일환으로 한국전자통신연구원(ETRI)의 지원을 받아 수행되었으며, EDA 툴은 반도체설계교육센터(IDEC)의 지원을 받았다.
우리 대학 건설및환경공학과 조계춘 교수가 구글(Google)의 ‘기초 과학 연구 지원 프로그램(Foundational Science Grant)’ 대상자로 최종 선정되어 USD140,000(2억원) 규모의 연구비를 지원받게 된다. 이번 선정은 국내 기초 과학 기술 발전을 지원하려는 구글의 의지가 담긴 결과로, 조계춘 교수팀은 서울대 민기복 교수팀과 함께 독창적인 연구 역량을 인정받았다. 이번 연구는 “물리 기반 인공지능(Physics-informed AI)”을 활용해 지열 에너지 개발의 불확실성을 해소하는데 초점을 맞추고 있다. 연구팀은 단순 데이터 학습 방식의 기존 AI를 넘어 실제 물리 법칙을 알고리즘에 결합함으로써 지하 심부의 온도, 압력, 유체 흐름 등을 정밀하게 예측하는 하이브리드 기술을 개발하고 있다. 특히 지열 발전 과정에서 발생할 수 있는 유발 지진(Induced Seismicity) 위험을 사전에 평가하고, 에너지
2026-05-08우리 대학은 김재철AI대학원이 7일(목) 오전 10시, 서울 코엑스(COEX)에서 ‘KAIST AI 기술설명회 2026’를 개최한다고 6일 밝혔다. 이번 행사는 KAIST 김재철AI대학원과 성남산업진흥원, 서울특별시가 공동 주최하며, 우리 대학이 수행 중인 주요 AI 연구 성과와 산업 현장으로 확산되고 있는 최신 인공지능 기술을 산업계와 일반 대중에게 소개함으로써 AI 기술 확산과 산학협력 활성화를 도모한다는 계획이다. 설명회에서는 로봇 파운데이션 모델(다양한 로봇 작업에 범용적으로 활용 가능한 대규모 사전학습 모델), 개인 맞춤형 AI, 멀티모달 AI(텍스트·이미지·음성 등 다양한 데이터를 함께 이해하는 인공지능), 신뢰가능한 AI, Physical AI(물리적 환경에서 직접 행동하고 상호작용하는 인공지능) 등 다양한 분야의 최신 연구 성과가 소개된다. 오전 초청강연에서는 KAIST 김재철AI대학원 신진우 교수와 오성준 교수,
2026-05-06빅데이터와 인공지능 시대, 수천 년이 걸리는 ‘조합 최적화 문제(가능한 모든 경우 중 가장 효율적인 답을 찾는 문제)’를 해결할 수 있는 길이 열렸다. KAIST 연구진이 기존 실리콘 공정만으로 구현 가능한 연산 하드웨어를 개발해, 별도 설비 없이 바로 생산·적용 가능한 전환점을 제시했다. 이를 통해 물류, 금융, 반도체 설계 등 다양한 산업에서 더 빠르고 정확한 의사결정이 가능해질 전망이다. 우리 대학은 전기및전자공학부 최양규 교수와 김상현 교수 공동 연구팀이 기존 실리콘 반도체 공정만을 활용해 차세대 최적화 전용 하드웨어인 ‘오실레이터 기반 아이징 머신(Oscillatory Ising Machine, 여러 진동 소자가 상호작용하며 최적 해를 찾아내는 특수 목적형 컴퓨터)’을 구현하는 데 성공했다고 6일 밝혔다. 연구팀이 주목한 것은 ‘오실레이터(일정한 주기로 신호를 반복하는 진동 소자)’다. 여러
2026-05-06“AI도 스스로‘모른다’고 말할 수 있어야 한다.” 자율주행과 의료 진단 등에서 인공지능(AI)의 가장 큰 위험으로 지적돼 온‘과도한 확신(overconfidence·틀린 예측에 대하여 높은 확신을 보이는 현상)’문제를 해결할 새로운 접근법이 제시됐다. 우리 대학 연구진은 AI가 스스로 모르는 상황을 인식하도록 하는 학습 방법을 개발해, 과신을 줄이고 신뢰성을 높일 수 있는 기반을 마련했다. 우리 대학은 뇌인지과학과 백세범 석좌교수 연구팀이 딥러닝(deep learning·인공신경망을 활용해 데이터를 학습하는 인공지능 기술)에서 널리 사용돼 온 무작위 가중치 초기화(random initialization·신경망 학습 시작 시 가중치를 확률 분포에 따라 무작위로 설정하는 방식)가 인공지능의 과신을 유발하는 근본적인 원인일 수 있음을 규명했다고 27일 밝혔다. 연구팀은 이를 해
2026-04-27살아있는 뇌 깊숙한 곳을 선명하게 관찰하려면 고가의 장비가 필수라는 한계가 있었다. 우리 대학 연구진이 물리 기반으로 한 AI 계산 알고리즘을 활용해 추가적인 광학 측정 장비 없이도 흐릿한 이미지를 또렷하게 복원하는 기술을 개발하며, 뇌과학 연구의 새로운 전환점을 제시했다. 우리 대학은 전기및전자공학부 강익성 교수가 UC 버클리 나지(Na Ji) 교수 연구팀과 공동연구를 통해, 신경장 모델(neural fields, 3차원 공간의 구조를 연속적으로 표현해 이미지와 형태를 동시에 복원하는 신경망 기반 기술)을 활용해 생체 내부를 관찰하는 현미경의 이미지 왜곡을 정밀하게 보정하는 기술을 개발했다고 21일 밝혔다. 연구팀이 활용한 ‘이광자 형광 현미경(two-photon fluorescence microscopy, 두 개의 약한 빛을 동시에 사용해 생체 깊은 곳 특정 지점만 선택적으로 빛나게 하는 기술)’은 살아있는 생체 조직 깊은 곳을 관찰할 수 있는 핵심
2026-04-21