-
눈을 감고도 터치스크린·로봇손 원격제어… 시각 보조, 가상현실 활용 기대
가상현실과 로봇 원격제어, 의료·재활 보조기기 분야가 빠르게 성장하면서, 손에 착용해 촉각만으로 방향과 움직임 정보를 전달하는 '웨어러블 햅틱(착용형 촉각 인터페이스)' 기술이 주목받고 있다. 그러나 기존 장치는 대부분 장치 자체의 위치와 방향을 기준으로 촉각 신호를 보내기 때문에, 손이나 손가락 자세가 바뀌면 "위·아래·좌·우"의 의미가 흔들려 사용자가 방향을 일관되게 해석하기 어려웠다. 예컨대 "위쪽"으로 느꼈던 신호가 손을 90도 돌리면 더 이상 같은 방향을 가리키지 않는 식이다.
우리 대학 기계공학과 오일권 교수 연구팀은 이러한 문제를 해결하기 위해, 손가락 관절을 기준으로 방향성 촉각 신호를 전달해 손 자세가 변해도 방향 정보가 일관되게 유지되는 착용형 소프트 햅틱 링 'PIHR(Pose-Independent Haptic Ring)'을 개발했다고 10일 밝혔다. PIHR은 손가락 첫 마디 관절(손등과 손가락이 만나는 MCP 관절)을 원점으로 삼아 촉각 신호를 매핑하는 장치다. 신호의 의미를 '장치 기준'이 아니라 '사용자의 손가락 관절 기준'으로 고정해, 손을 어떻게 돌리든 같은 자극이 같은 해부학적 방향을 뜻하도록 설계한 것이 핵심이다.
기존 햅틱 장치가 장치 중심 좌표계에 기반해 단순한 상·하·좌·우 신호를 보냈다면, PIHR은 MCP 관절을 중심으로 한 구면 좌표계 기반 촉각 매핑을 적용했다. 이를 통해 굽힘(flexion·손가락을 안으로 굽힘), 폄(extension·펴기), 벌림(abduction·옆으로 벌림), 모음(adduction·다시 모음)이라는 네 가지 해부학적 방향을 손 자세 변화와 관계없이 일관되게 전달한다. 기존 방식으로 이런 일관성을 유지하려면 별도의 자세 센서와 실시간 좌표 변환이 필요해 시스템이 복잡해지는데, PIHR은 신호의 기준 자체를 관절에 고정함으로써 이 문제를 해소했다.
좁은 링 안에서 충분한 촉각 출력을 얻는 것도 관건이었다. 연구팀은 구불구불한 격자 형태의 형상기억합금(SMA·Shape Memory Alloy, 열을 가하면 원래 형태로 돌아가는 금속) 액추에이터 구조를 최적화하고, 면적 밀도(AD)와 단위 밀도(UD)를 기준으로 설계를 비교했다. 그 결과 'AD61–UD4' 형상이 힘 출력·변위·응답 속도 사이에서 가장 균형 잡힌 성능을 보였다. 최종 액추에이터는 독립적으로 구동되는 4개 채널로 구성되며, 전기적 가열로 각 채널이 선택적으로 수축하면서 손가락 피부에 국소적인 수직 압입 자극을 전달한다. 이렇게 만든 액추에이터는 1.0암페어 전류에서 약 0.44초 만에 최대 1.3뉴턴의 힘을 내, 실시간 촉각 상호작용에 적합한 응답 속도를 보였다. 자체 무게 대비 힘 출력(질량당 84.2N/g)도 기존에 보고된 SMA 웨어러블 햅틱 장치보다 크게 높았으며, 반복 구동 시에도 피부 접촉 온도가 생체 적합 범위에 머물러 착용 안전성을 확보했다.
방향 인식 성능 검증을 위한 사용자 평가도 진행됐다. 10명의 참가자를 대상으로 별도의 사전 훈련 없이 손 자세가 계속 바뀌는 조건에서 실험한 결과, 네 방향 촉각 신호에 대해 전체 79.2%의 인식 정확도를 기록했다. 이는 무작위로 찍었을 때의 확률(25%)보다 통계적으로 유의하게 높은 수치로, 관절 중심 햅틱 매핑이 자세가 바뀌는 상황에서도 직관적인 방향 인식을 제공할 수 있음을 보여준다. 실제 응용 가능성도 두 가지 시연으로 확인했다. 눈을 가린 사용자가 손가락에서 전달되는 관절 중심 방향 신호만으로 터치스크린의 피아노 애플리케이션을 연주하고 화면을 넘겼으며, 로봇 손을 원격제어해 주사기로 액체 양을 단계적으로 조절하는 정밀 작업도 수행했다. 이는 PIHR이 단순한 접촉 알림을 넘어, 사용자의 손가락 움직임을 단계적으로 안내하는 착용형 햅틱 인터페이스로 활용될 수 있음을 보여준다.
오일권 교수는 "PIHR은 신호의 기준을 장치가 아니라 사용자의 손가락 관절에 두었다는 점에서 기존 착용형 햅틱과 차별화된다"라며 "시각 보조, 가상현실, 로봇 원격제어 등 시각 정보가 제한된 다양한 환경에서 직관적인 방향 안내 기술로 폭넓게 활용될 수 있을 것"이라고 밝혔다.
이번 연구는 우리 대학 기계공학과 김현수 석사과정이 제1저자로, 오일권 교수가 교신저자로 참여했다. 연구 성과는 국제 학술지 '스몰 스트럭처스(Small Structures)' 2026년 6월 발행 제7권 6호에 게재됐으며, 연구의 우수성을 인정받아 해당 호의 표지 논문(Front Cover)으로 선정됐다.
※ 논문명: Pose-Independent Soft Haptic Ring for Joint-Centered Directional Guidance via Multichannel Shape Memory Alloy Actuators
※ DOI: https://doi.org/10.1002/sstr.202600017
한편, 이번 연구는 과학기술정보통신부 재원으로 한국연구재단 중견연구지원사업(RS-2024-00345241), 미래개척융합과학기술개발사업(RS-2023-00302525), 나노·소재기술개발사업(RS-2025-25441263), 그리고 과학기술정보통신부 InnoCORE 프로그램(N10260002)의 지원을 받아 수행됐다.
2026.06.15
조회수 333
-
시각장애인 위한 점자 번역 엔진 ‘K-Braille’ 개발..정확도 100% 확인
우리 대학은 융합인재학부 재활인공지능연구실(Assistive AI Lab) 가현욱 교수 연구팀이 일반 글자(묵자)를 시각장애인이 읽을 수 있는 점자로 변환하는 ‘점역(點譯, Braille translation)’기술을 고도화한 차세대 점자 번역 엔진 ‘K-Braille(케이-브레일)’을 개발하고 대규모 성능 검증을 완료했다고 13일 밝혔다.
점역은 책, 문서, 웹페이지 등 일반 문자로 작성된 정보를 점자 체계에 맞게 변환하는 과정으로 시각장애인의 정보 접근을 위해 필수적인 기술이다. 그러나 한국어 점자 규정은 띄어쓰기, 기호, 외국어 표기 등 다양한 예외 규칙이 존재해 정확한 자동 점역이 쉽지 않다.
현재 시각장애인들이 사용하는 기존 점역 프로그램들은 문자나 기호를 단순 규칙에 따라 변환하는 방식이어서, 다국어(영문 등)·한글 혼용 표현이나 복합 단위 기호, 괄호 띄어쓰기 등 복잡한 규정 처리에서 오류가 발생하는 경우가 있었다. 점자 한 칸의 오류는 시각장애인에게 단순한 오타를 넘어 정보 왜곡으로 이어질 수 있다는 점에서 정확한 점역 기술의 중요성이 꾸준히 제기돼 왔다.
연구팀이 개발한 K-Braille 엔진의 가장 큰 특징은 ‘문장을 이해하는 점역 시스템’이라는 점이다. 기존 점역 프로그램이 문자나 기호를 단순히 바꾸는 치환 방식이라면, K-Braille은 형태소 분석과 문장 구조 분석(AST, Abstract Syntax Tree)을 통해 문장의 구조와 맥락을 분석하여 의미를 이해한 뒤 점자로 변환하는 기술이다.
이를 통해 외국어와 한글이 혼용된 문장, 복잡한 기호 조합, 단위 표기 등 개정된 점자 규정의 다양한 예외 상황을 보다 정확하게 처리할 수 있다.
연구팀은 기술의 정확도를 확인하기 위해 국립국어원이 구축한 국내 최대 규모의 점자 데이터셋인 ‘묵자-점자 병렬 말뭉치(NLPAK)’를 활용했다. 이 데이터에는 일반 글자와 점자가 짝을 이루는 문장들이 함께 정리돼 있으며, 연구팀은 여기서 1만7,943개의 문장을 추출해 K-Braille의 점역 결과가 실제 점자와 얼마나 일치하는지 전수 평가를 진행했다.
그 결과 점자 규정을 실제로 얼마나 정확하게 따르는지를 나타내는 ‘실질 점역 규정 준수율(True Adjusted Accuracy) ’이 100.0%로 나타났으며, 점자 문장의 구조가 정답과 얼마나 비슷한지를 보여주는 점역 형태소 구조 유사도도 평균 99.81%**를 기록해 높은 점역 정확도를 확인했다.
또한 국립국어원의 공식 점역 프로그램 ‘점사랑 6.3.5.8’과 동일 문장 세트를 이용한 비교 검증에서도 K-Braille이 더 높은 점역 일치율을 보이며 기술적 경쟁력을 확인했다.
10일 KAIST에 ‘포용적 AI’ 인재 양성을 위해 발전기금 10억 원을 기탁한 융합인재학부 재학생(학사과정)이자 스타트업 ㈜엠피에이지(MPAG) 대표인 정인서(28) 학생의 지도교수이자 이번 연구를 이끈 선천적 중증 시각장애인 연구자인 가현욱 교수(KAIST)는 “점자는 시각장애인에게 단순한 기호가 아니라 세상을 읽는 언어”라며 “이번 성과를 기반으로 향후 수학 수식과 과학 기호, 나아가 음악 악보까지 처리할 수 있는 차세대 점역 시스템으로 기술을 발전시킬 계획”이라고 말했다.
이어 “이 기술이 시각장애인의 정보 접근성을 한층 높이고, 한국 점자 번역 인공지능 분야의 새로운 기술 기준을 제시하는 계기가 되길 기대한다”고 덧붙였다.
연구팀은 앞으로 기존 점자 파일 형식(.brf)의 한계를 넘어 새로운 점자 파일 형식을 만들고, 그 파일을 작성·읽기·공유할 수 있는 소프트웨어와 장치 환경을 함께 만드는 차세대 전자 점자 파일 포맷 ‘.brfx(Braille File eXtended)’ 생태계 구축도 추진할 계획이다.
특히 연구팀은 K-Braille 엔진을‘포용적 AI(Inclusive AI)’기술로서 사회에 전면 무상으로 환원할 계획이다. 단, 기술의 파편화를 막고 지속 가능한 생태계를 유지하기 위해 무분별한 소프트웨어 오픈소스화보다는 공공기관, 교육청, 점자 도서관, 그리고 보조기기 제조사 등‘책임 있는 기술 활용 주체’들과의 공식적인 기술 이전 및 제휴망을 구축할 예정이다.
이를 올해 이내에 추진해, 기존에 점자 환경을 구축·운영 중인 기관들이나 신규 점자 디스플레이 업체들이 어떠한 추가적인 소프트웨어 라이선스 비용 없이도 가장 완벽한 2024년형 최신 점역 모듈(API 및 시스템 커널)을 즉각적으로 통합 연동할 수 있게 함으로써, 궁극적으로 최종 단계의 시각장애인 사용자들에게 일체의 비용 전가 없이 최상의 배리어프리(Barrier-free) 정보 접근성을 선물하는 것을 핵심 가치로 삼고 있다.
2026.03.13
조회수 4610
-
기계공학과 윤국진 교수 연구팀, 세계 최고 권위 ‘CVPR 2026’ 논문 10편 채택,글로벌 AI 연구 선도
우리 대학 기계공학과 윤국진 교수 연구팀이 세계적인 컴퓨터 비전 학술대회인 IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026(CVPR 2026)에서 주저자로 총 10편의 논문을 채택시키며, 연구팀의 압도적인 학술적 역량을 다시금 증명했다.
CVPR은 인공지능과 시각 지능 분야에서 가장 큰 영향력을 가진 국제 학술 대회로, 1983년 시작된 이래 매년 엄격한 심사를 거쳐 우수 논문을 선정한다. 올해 CVPR 2026에는 전 세계에서 총 16,092편의 논문이 제출되었으며, 그중 4,090편이 채택되어 약 25.42%의 낮은 채택률을 기록하였다. 단일 연구실에서 주저자/교신저자로 10편의 논문이 동시에 채택되는 것은 국제적으로 매우 독보적인 성과로 평가받는다.
윤국진 교수 연구팀은 인간 수준의 시각 지능 구현을 목표로 폭넓은 연구를 수행하고 있다. 이번에 채택된 논문들은 이벤트 카메라 기반 기술, 자율주행 인지 기술, 그리고 AI 효율화 및 적응 기술 등 컴퓨터 비전 분야의 최첨단 주제들을 다루고 있다.
연구팀은 이미 지난해 ICCV 2025에서도 주저자/교신저자로 12편의 논문을 발표하여 독보적인 연구 역량을 인정받은 바 있다. 이번 CVPR 2026의 성과는 연구팀이 글로벌 컴퓨터 비전 연구를 선도하는 핵심 거점임을 다시 한번 확고히 하는 계기가 되었다. 연구팀은 앞으로도 기존 기술의 한계를 뛰어넘는 도전적인 연구를 통해 미래 AI 기술 발전에 기여할 계획이다.
한편, 이번 CVPR 2026은 오는 6월 3일부터 7일까지 미국 콜로라도주 덴버에서 개최될 예정이다.
2026.03.06
조회수 3003
-
AI가 어떻게 생각하는가?...의사결정 내부 구조 첫 시각화
딥러닝 기반 이미지 인식 기술이 빠르게 고도화되고 있지만, AI가 내부에서 어떤 기준으로 이미지를 보고 판단하는지는 여전히 명확히 설명하기 어려운 영역으로 남아 있다. 특히 대규모 모델이 어떤 개념(예: 고양이 귀, 자동차 바퀴 등)을 어떻게 조합해 결론을 내리는지 분석하는 기술은 오랫동안 해결해야 할 과제로 제기돼 왔다.
우리 대학은 김재철AI대학원 최재식 교수 연구팀이 AI가 어떤 근거로 판단하는지를 인간이 이해할 수 있도록 보여주는‘설명가능성(XAI, Explainable AI)’분야에서, 모델 내부의 개념 형성 과정을 회로(circuit) 단위로 시각화하는 새로운 XAI 기술을 개발했다고 26일 밝혔다.
이번 연구는 ‘AI가 어떻게 생각하는지’를 구조적으로 들여다볼 수 있도록 한 중요한 진전으로 평가된다.
딥러닝 모델 내부에는 인간의 뇌처럼 ‘뉴런(Neuron)’이라는 기본 계산 단위가 존재한다. 뉴런은 이미지 속 작은 특징—예를 들어 귀 모양, 특정 색, 윤곽선 등—을 감지하는 기능을 갖고 있으며, 값(신호)을 계산해 다음 단계로 전달한다.
반면 ‘회로(circuit)’는 이러한 뉴런 여러 개가 서로 연결되어 하나의 의미(개념)를 함께 인식하는 구조를 말한다. 예를 들어 ‘고양이 귀’라는 개념을 인식하기 위해서는 귀의 윤곽을 감지하는 뉴런, 삼각형 형태를 감지하는 뉴런, 털 색 패턴을 감지하는 뉴런 등 여러 뉴런이 순차적으로 작동해야 하며, 이들이 하나의 기능 단위(회로)를 이룬다.
지금까지의 설명 기술은 “특정 뉴런이 특정 개념을 본다”는 단일 뉴런 중심의 접근이 많았다. 그러나 실제 딥러닝 모델은 여러 뉴런이 협력하는 회로 구조로 개념을 형성하며, KAIST 연구팀은 이 점에 착안해 AI의 개념 표현 단위를 '뉴런 → 회로'로 확장해 해석하는 기술을 제시했다.
연구팀이 개발한 ‘세분화된 개념회로(Granular Concept Circuits, GCC)’ 기술은 이미지 분류 모델이 내부에서 개념을 형성하는 과정을 회로 단위로 분석하고 시각화하는 새로운 방식이다.
GCC는 뉴런 민감도(Neuron Sensitivity), 의미 흐름 점수(Semantic Flow)를 계산해 회로를 자동적으로 추적한다. 뉴런 민감도는 특정 뉴런이 어떤 특징에 얼마나 민감하게 반응하는지, 의미 흐름 점수는 그 특징이 다음 개념으로 얼마나 강하게 전달되는지를 보여주는 지표로, 이를 통해 색·질감 같은 기본 특징이 어떻게 상위 개념으로 조립되는지 단계적으로 시각화할 수 있다.
연구팀은 특정 회로를 잠시 비활성화(ablation)하는 실험을 수행했다. 그 결과, 회로가 담당하던 개념이 사라지면서 AI의 예측이 실제로 달라지는 현상이 나타났다.
즉, 해당 회로가 실제로 그 개념을 인식하는 기능을 수행하고 있음을 직접적으로 입증한 것이다.
이번 연구는 복잡한 딥러닝 모델 내부에서 개념이 형성되는 실제 구조를 세밀한 회로 단위로 드러낸 최초의 연구로 평가된다. 이를 통해 AI 판단 근거의 투명성 강화, 오분류 원인 분석, 편향(Bias) 검출, 모델 디버깅 및 구조 개선, 안전성·책임성 향상 등 설명가능성(XAI) 전반에서 실질적인 응용 가능성을 제시한 것이다.
연구팀은 “AI가 내부에서 만드는 개념 구조를 사람이 이해할 수 있는 방식으로 보여주는 기술”이라며 “이번 연구는 AI가 ‘어떻게 생각하는지’를 과학적으로 연구할 수 있는 출발점”이라고 밝혔다.
최재식 교수는 “복잡한 모델을 단순화해 설명하던 기존 방식과 달리, 모델 내부를 세부 회로 단위로 정밀하게 해석한 최초의 접근”이라며 “AI가 학습한 개념을 자동으로 추적·시각화할 수 있음을 입증했다”고 말했다.
KAIST 김재철AI대학원 권다희 박사과정과 이세현 박사과정이 공동 제1 저자로 참여한 이번 연구는 국제 학술대회 `국제 컴퓨터 비전 학술대회 (International Conference on Computer Vision, ICCV)’에서 10월 21일 발표되었다.
※ 논문명 : Granular Concept Circuits: Toward a Fine-Grained Circuit Discovery for Concept Representations
※ 논문링크: https://openaccess.thecvf.com/content/ICCV2025/papers/Kwon_Granular_Concept_Circuits_Toward_a_Fine-Grained_Circuit_Discovery_for_Concept_ICCV_2025_paper.pdf
한편 이번 연구는 과학기술정보통신부와 정보통신기획평가원(IITP)이 지원하는 사람중심핵심원천기술개발사업의 일환으로 '플러그앤플레이 방식으로 설명가능성을 제공하는 인공지능 기술 개발 및 인공지능 시스템에 대한 설명 제공 검증' 과제, AI 연구거점 프로젝트 및 한국과학기술원 인공지능 대학원 프로그램과제의 지원을 받고 방위사업청과 국방과학연구소의 지원으로 한국과학기술원 미래 국방 인공지능 특화연구센터에서 수행됐다.
2025.11.26
조회수 3090
-
백세범 교수, 사이언스 어드밴시스 부편집장 임명
우리 대학 뇌인지과학과 백세범 교수가 세계적 권위의 과학 학술지인 사이언스 어드밴시스 (Science Advances)의 신경과학 (Neuroscience) 분과 부편집장(Associate Editor)으로 임명됐다고 14일 밝혔다.
이는 계산 신경과학 기반의 뇌 연구를 선도하고 있는 연구자인 백세범 교수의 탁월한 학문적 영향력과 학술적 소통 역량이 세계적으로 인정받은 성과다.
백세범 교수는 신경과학의 난제 중 하나였던 시각피질 뇌 지도 발생의 원리*를 세계 최초로 밝힌 이래, 지난 10여 년간의 연구를 통해 독창적인 이론 연구의 전문성을 인정받고 있다.
*시각피질 뇌 지도 발생의 원리: 포유류의 시각피질에서는 서로 다른 시각 정보(예: 색상, 방향 등)에 선택적으로 반응하는 신경세포들이 일정한 패턴을 이루며 배치되어 있는데 이를 기능성 뇌 지도(functional map)라고 함. 이 연구에서는 수학적 모델에 기반한 컴퓨터 시뮬레이션을 통하여 망막에 있는 신경세포들이 매우 단순한 물리적 상호작용에 따라 스스로 규칙적인 배열을 형성할 수 있으며 이렇게 형성된 구조가 시각피질에 투영되면서 다양한 기능성 뇌 지도가 만들어진다는 것을 설명하였음.
사이언스 어드밴시스는 미국 과학 진흥 협회(AAAS)가 발행하는 사이언스(Science) 저널의 온라인 자매지로, 과학 전 분야에 걸친 영향력 있는 연구를 다룬다. 2024년 기준 게재 승인 비율(acceptance rate)이 8.2%에 불과할 정도로 높은 수준의 연구 결과를 요구하며, 엄격한 검토 과정을 거친다.
백 교수는 신경과학 분과에서 연구 논문의 심사와 편집 업무에 참여하며, 전 세계 연구자들에게 중요한 과학적 발견을 전파하는 데 핵심적인 역할을 수행한다.
백 교수는 국내 1세대 계산신경과학자로서 이론적 모델 기반의 뇌 연구를 통해 신경과학의 다양한 현상들을 체계적으로 연계하여 설명하는 계산신경과학분야를 개척하고 있다.
최근에는 뇌신경망과 인공신경망의 비교에 기반한 인지 지능 발생 이론 연구들을 진행하며, 인간과 동물의 지능, 그리고 인공지능을 하나의 큰 틀에서 이해하려는 연구를 활발히 진행하고 있다.
백 교수는 그동안 스프링거-네이쳐(Springer-Nature)와 프론티어스(Frontiers) 그룹에서 발행하는 신경과학 저널들의 부편집장 및 편집위원으로 활동해 왔다. 2021년에는 KAIST 특이점 교수(Singularity Professor)에 임명되었으며, 2024년부터는 한국계산뇌과학회(CBrain) 회장직을 맡아 학회를 이끌고 있다.
백세범 교수는 “KAIST 교수진으로서 권위 있는 학술지의 편집위원으로 활동하게 되어 매우 기쁘며, 앞으로 뇌신경과학 분야의 다양한 연구 결과들의 심사 및 출판 과정을 진행하면서, 전 세계 연구자들과 교류를 통해 뇌신경과학 연구의 발전과 방향 설정에 기여하고 싶다”고 소감을 전했다.
2025.03.14
조회수 6023
-
초당 9,120프레임 포착 곤충눈 모사 카메라 개발
곤충의 겹눈은 빠르게 움직이는 물체를 병렬적으로 감지하고, 어두운 환경에서는 감도를 높이기 위해 시각세포가 여러 시간의 신호를 합쳐서 반응해 움직임을 결정한다. KAIST 연구진이 곤충의 생체를 모사하여 기존 고속 카메라가 직면했던 프레임 속도와 감도 간의 한계를 극복한 저비용 고속 카메라를 개발하는데 성공했다.
우리 대학 바이오및뇌공학과 정기훈·전산학과 김민혁 교수 연구팀이 곤충의 시각 구조에서 영감을 받아 초고속 촬영과 고감도를 동시에 구현한 새로운 생체모사 카메라를 개발했다고 16일 밝혔다.
고속 및 저조도 환경에서의 고품질 이미징은 많은 응용 분야에서 중요한 과제이다. 기존의 고속 카메라는 빠른 움직임을 포착하는 데 강점을 가지고 있지만, 프레임율을 높일수록 빛을 수집할 수 있는 시간이 줄어들어 저조도 환경에서는 감도가 부족한 문제가 발생해왔다.
이를 해결하기 위해 연구팀은 곤충의 시각 기관처럼, 여러 개의 광학 채널과 시간 합산을 활용하는 방식을 채택했다. 기존 단안 카메라 시스템과 달리, 생체 모사 카메라는 겹눈을 통해 서로 다른 시간대의 프레임을 병렬적으로 획득할 수 있다.
이 과정에서 각 프레임이 중첩되는 시간 동안 빛을 합산함으로써 신호대잡음비를 증가시킬 수 있다. 연구팀은 이러한 방식을 적용한 생체 모사 카메라가 기존의 고속 카메라 대비 최대 40배 더 어두운 물체까지 포착할 수 있었다고 밝혔다.
또한 연구팀은 카메라의 속도를 크게 향상하기 위해 ‘채널 분할’ 기술을 도입하여 패키징에 사용된 이미지센서보다 수천 배 빠른 프레임률을 획득할 수 있었다. 이에 더해 ‘압축 이미지 복원’ 알고리즘을 활용해 합산된 프레임에서 발생할 수 있는 흐림 현상을 제거하며, 선명한 이미지를 재구성했다.
연구팀은 제작된 생체 모사 카메라는 두께 1mm 이하의 매우 얇고, 작은 크기에도 불구하고 초당 9,120프레임을 촬영할 수 있고, 낮은 조도에서도 선명한 이미지를 제공한다.
향후 연구팀은 3D 이미징 및 초해상도 이미징을 위한 고급 이미지 처리 알고리즘을 통해 바이오의료 응용뿐 아니라 모바일 등 다양한 카메라 응용 기술을 개발할 예정이라고 밝혔다.
제1 저자인 바이오및뇌공학과 김현경 박사과정은 “제작된 곤충 눈 카메라가 작은 크기임에도 불구하고 고속 및 저조도 촬영에서 뛰어난 성능을 발휘하는 것을 실험적으로 검증했다”라며, “이 카메라는 이동식 카메라 시스템, 보안 감시, 의료 영상 등 다양한 분야에서의 응용 가능성을 열었다”라고 말했다.
바이오및뇌공학과 김현경 박사과정이 제1 저자로 참여한 이번 연구는 국제 학술지 `사이언스 어드밴시스(Science Advances)'에 1월 출판됐다. (논문명 : Biologically-inspired microlens array camera for high-speed and high-sensitivity imaging)
DOI: https://doi.org/10.1126/sciadv.ads3389
한편 이번 연구는 국방기술진흥연구소, 과학기술정보통신부, 그리고 산업통상자원부의 지원을 받아 수행됐다.
2025.01.16
조회수 8433
-
인간의 인지 방식과 유사한 AI 모델 개발
우리 연구진이 인간의 인지 방식을 모방해 이미지 변화를 이해하고, 시각적 일반화와 특정성을 동시에 확보하는 인공지능 기술을 개발했다. 이 기술은 의료 영상 분석, 자율주행, 로보틱스 등 다양한 분야에서 이미지를 이해하여 객체를 분류, 탐지하는 데 활용될 전망이다.
우리 대학 전기및전자공학부 김준모 교수 연구팀이 변환 레이블(transformational labels) 없이도 스스로 변환 민감 특징(transformation-sensitive features)을 학습할 수 있는 새로운 시각 인공지능 모델 STL(Self-supervised Transformation Learning)을 개발했다고 13일 밝혔다.
연구팀이 개발한 시각 인공지능 모델 STL은 스스로 이미지의 변환을 학습하여, 이미지 변환의 종류를 인간이 직접 알려주면서 학습하는 기존 방법들보다 높은 시각 정보 이해 능력을 보였다. 특히, 기존 방법론들을 통해 학습한 모델이 이해할 수 없는 세부적인 특징까지도 학습하여 기존 방법 대비 최대 42% 우수한 성능을 보여줬다.
컴퓨터 비전에서 이미지 변환을 통한 데이터 증강을 활용해 강건한 시각 표현을 학습하는 방식은 일반화 능력을 갖추는 데 효과적이지만, 변환에 따른 시각적 세부 사항을 무시하는 경향이 있어 범용 시각 인공지능 모델로서 한계가 있다.
연구팀이 제안한 STL은 변환 라벨 없이 변환 정보를 학습할 수 있도록 설계된 새로운 학습 기법으로, 라벨 없이 변환 민감 특징을 학습할 수 있다. 또한, 기존 학습 방법 대비 학습 복잡도를 유지한 채로 효율적인 최적화할 수 있는 방법을 제안했다.
실험 결과, STL은 정확하게 객체를 분류하고 탐지 실험에서 가장 낮은 오류율을 기록했다. 또한, STL이 생성한 표현 공간은 변환의 강도와 유형에 따라 명확히 군집화되어 변환 간 관계를 잘 반영하는 것으로 나타났다.
김준모 교수는 "이번에 개발한 STL은 복잡한 변환 패턴을 학습하고 이를 표현 공간에서 효과적으로 반영하는 능력을 통해 변환 민감 특징 학습의 새로운 가능성을 제시했다”며, "라벨 없이도 변환 정보를 학습할 수 있는 기술은 다양한 AI 응용 분야에서 핵심적인 역할을 할 것”이라고 말했다.
우리 대학 전기및전자공학부 유재명 박사과정이 제1 저자로 참여한 이번 연구는 최고 권위 국제 학술지 ‘신경정보처리시스템학회(NeurIPS) 2024’에서 올 12월 발표될 예정이다.(논문명: Self-supervised Transformation Learning for Equivariant Representations)
한편 이번 연구는 이 논문은 2024년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구 성과물(No.RS-2024-00439020, 지속가능한 실시간 멀티모달 인터렉티브 생성 AI 개발, SW스타랩) 이다.
2024.12.15
조회수 9016
-
구글딥마인드와 공동연구를 통해 인공지능으로 시각을 상상하다
‘노란 포도'나 `보라색 바나나'와 같이 본 적 없는 시각 개념을 이해하고 상상하는 인공지능 능력 구현이 가능해졌다.
우리 대학 전산학부 안성진 교수 연구팀이 구글 딥마인드 및 미국 럿거스 대학교와의 국제 공동 연구를 통해 시각적 지식을 체계적으로 조합해 새로운 개념을 이해하는 인공지능 새로운 모델과 프로그램을 수행하는 벤치마크를 개발했다고 30일 밝혔다.
인간은 `보라색 포도'와 `노란 바나나' 같은 개념을 학습하고, 이를 분리한 뒤 재조합해 `노란 포도'나 `보라색 바나나'와 같이 본 적 없는 개념을 상상하는 능력이 있다. 이런 능력은 체계적 일반화 혹은 조합적 일반화라고 불리며, 범용 인공지능을 구현하는 데 있어 핵심적인 요소로 여겨진다.
체계적 일반화 문제는 1988년 미국의 저명한 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망이 이 문제를 해결할 수 없다고 주장한 이후, 35년 동안 인공지능 딥러닝 분야에서 큰 도전 과제로 남아 있다. 이 문제는 언어뿐만 아니라 시각 정보에서도 발생하지만, 지금까지는 주로 언어의 체계적 일반화에만 초점이 맞춰져 있었고, 시각 정보에 관한 연구는 상대적으로 부족했다.
안성진 교수가 이끄는 국제 공동 연구팀은 이러한 공백을 메우고자 시각 정보에 대한 체계적 일반화를 연구할 수 있는 벤치마크를 개발했다. 시각 정보는 언어와는 달리 명확한 `단어'나 `토큰'의 구조가 없어, 이 구조를 학습하고 체계적 일반화를 달성하는 것이 큰 도전이다.
연구를 주도한 안성진 교수는 “시각 정보의 체계적 일반화가 범용 인공지능을 달성하기 위해 필수적인 능력이며 이 연구를 통해 인공지능의 추론능력과 상상능력 관련 분야의 발전을 가속할 것으로 기대한다”고 말했다.
또한, 딥마인드의 책임 연구원으로 연구에 참여한 연구원이자 현재 스위스 로잔연방공과대학교(EPFL)의 찰라 걸셔(Caglar Gulcehre) 교수는 “체계적 일반화가 가능해지면 현재보다 훨씬 적은 데이터로 더 높은 성능을 낼 수 있게 될 것이다”라고 전했다.
이번 연구는 12월 10일부터 16일까지 미국 뉴올리언스에서 열리는 제37회 신경정보처리학회(NeurIPS)에서 발표될 예정이다.
관련논문: “Imagine the Unseen World: A Benchmark for Systematic Generalization in Visual World Models”, Yeongbin Kim, Gautam Singh, Junyeong Park, Caglar Gulcehre, Sungjin Ahn, NeurIPS 23
2023.11.30
조회수 12703
-
이창희 교수팀, 인공지능과 서울이 만난 영상 작품 전시
우리 대학이 다음 달 1일부터 두 달간 광화문 광장 해치마당에서 인공지능을 활용한 시각 영상 작품을 전시한다.
산업디자인학과 이창희 교수팀(아트: 송유택, 오주원, 이정아, 김대욱. 보조: 이윤지, 조해나)이 제작한 '서브웨이 시냅스(Subway Synapse)'라는 제목의 작품은 서울시가 주최하는 '하이 에이아이(Hi, Ai)'의 일환으로 전시된다. 첨단 기술을 어려운 매체예술이 아닌 이해하기 쉬운 시민 친화적 미술 작품으로 전시하기 위해 기획된 행사다. 이 교수팀의 작품은 서울의 지하철이 단순한 이동 수단을 넘어 인간의 신경세포를 연결하는 시냅스(Synapse)처럼 우리의 일상을 밀접하게 연결한다는 영감을 바탕으로 만들어졌다. 서울의 여러 공간과 모습을 연결하는 하나의 완전한 시스템으로서의 지하철을 두 개의 영상을 합성하는 크로마키 기법으로 촬영한 후 다양한 생성 인공지능 기술로 상상력을 더해 시각화했다.
자연, 번잡한 거리, 현대적인 스카이라인, 우리나라의 특색있는 문화 예술 등을 담은 서울의 다양한 모습을 하나의 유기적인 흐름으로 재구성했으며, 이를 관람하는 시민들이 서울 여행을 하는 듯한 경험과 동시에 서울이라는 공간을 재발견하게 하려는 의도가 담겨있다.작품을 총괄한 이창희 산업디자인학과 교수는 "서울시민들이 자신들이 살고 있는 도시의 진정한 가치와 아름다움을 다시 한번 느꼈으면 좋겠다는 마음으로 작업했다"라고 밝혔다. 이어, 이 교수는 "인공지능이 예술적 독창성을 파괴한다는 우려와는 다르게 인공지능이 어떻게 예술과 연결될 수 있는지를 보여주는 하나의 예시가 될 수 있길 바란다"라고 전했다.
이 교수팀의 작품은 광화문 광장 이순신 장군과 세종대왕 동상 사이에 설치된 길이 53m 높이 3.25m의 미디어월에서 매일 아침 8시부터 저녁 10시까지 송출된다.
2023.08.30
조회수 12323
-
70대 노부인 KAIST에 전 재산 유증
70대 노부인이 전 재산이나 다름없는 5억 원 상당의 부동산을 기초 과학 인재 양성을 위해 우리 대학에 유증했다.
부산에 사는 70대 박 모 씨는 지난달 30일 총 5억 원 상당의 부동산 2곳을 기부했다. 박 씨는 2011년에도 현금 5천만 원을 기부한 데 이어 이번까지 두 번에 걸쳐 총 5억 5천만 원 상당을 우리 대학에 전달했다. 우리 대학과 특별한 연고가 없는 박 씨는 뉴스에서 상속 재산을 우리 대학에 기부한 사연을 접한 뒤 2011년 첫 기부를 단행했다. 기부로 과학기술 발전에 일조한다는 취지에 공감했기 때문이다. 첫 기부 이후 계속해서 우리 대학의 발전상을 지켜봐 온 박 씨는 더 늦기 전에 재산을 정리하기로 결심한 뒤 본인 명의의 부동산을 모두 기부하고 싶다며 발전재단으로 연락해 왔다.
삼 남매를 키우며 평생을 검소하게 살아온 박 씨는 "KAIST는 고정된 시각이 아닌, 남다른 생각으로 많은 사람에게 도움을 주는 훌륭한 과학 기술 인재를 길러낸다는 믿음에서 숙원이었던 기부를 실행했다"라고 소감을 전했다.
박 씨는 이어 "다른 사람의 기부 이야기를 들을 때마다 언젠가는 나도 해야겠다고 생각만 해오던 것을 직접 실천에 옮기니 기대 이상으로 뿌듯하다"라며, "기부에 대해 고민하는 분이 있다면 나의 이야기가 마음을 정하는 데 도움이 되길 바란다"라고 덧붙였다.
발전재단 관계자는 "기부자가 이름과 사연이 알려지는 것을 원하지 않았기 때문에 특별한 약정식 행사 없이 기부자의 자택에 방문해 유증을 위한 서류 절차를 진행하고 왔다"라고 전했다.
또한, 박 씨의 기부 결정을 세 자녀와 가족 모두가 찬성한 것으로 알려졌다. 유증 자리에 함께 참석한 둘째 딸 김 모 씨는 "어머니가 평생 아끼며 모은 재산이 어머니의 뜻대로 사용되길 바랐기 때문에 훌륭한 선택과 결정을 가족 모두 축하하는 마음으로 지지하고 있다"라고 말했다.
이광형 KAIST 총장은 "기부자의 평생이 담겨있는 기부금뿐만 아니라 12년이 넘는 긴 세월 동안 KAIST를 애정 어린 시선으로 바라봐 주신 그 믿음에도 깊은 감사를 전한다"라며, "세상에 없던 새로운 시도로 인류의 행복과 번영을 실현하는 과학기술 글로벌 인재들을 키워내 기부자의 기대에 부응하겠다"라고 말했다.우리 대학은 이번 기부금을 기초 과학 인재 양성 사업에 활용하여 박 씨의 뜻을 이어 나갈 계획이다.
2023.06.14
조회수 7900
-
효율적 정보 처리를 위한 뇌신경망의 최적화 구조 형성 원리 규명
우리 대학 바이오및뇌공학과 백세범 교수 연구팀이 대뇌 시각 피질 회로가 정보처리에 가장 최적화된 구조를 자발적으로 형성하는 원리를 밝혔다.
이번 연구 결과는 수 십년간의 뇌신경과학 연구에서 그 원리를 명확히 밝혀내지 못했던 시각 피질 기능성 지도들의 복합 구조 형성의 기작을 규명한 것으로, 수학적 모델의 도입을 통해 복잡한 생물학적 신경망 구조의 기원을 찾아낸 성공적인 연구로 평가된다.
연구팀은 망막 신경세포들이 초기 발생 단계에서 일정한 물리적 공간 분포 패턴을 형성하는 과정에서 다양한 종류의 정보 처리 회로가 자발적으로 생성될 뿐만 아니라, 이 패턴으로부터 시각 피질의 기능성 뇌지도들의 규칙적이고 효율적인 복합적 구조가 형성됨을 밝혀냈다.
바이오및뇌공학과 송민 박사과정과 장재선 박사가 공동 1저자로 참여한 이번 연구는 국제 학술지 ‘셀(cell)’의 온라인 자매지 ‘셀 리포츠(Cell Reports)’ 1월 5일 자에 게재됐다. (논문명: Projection of orthogonal tiling from the retina to the visual cortex).
포유류의 일차시각피질 신경세포들은 눈으로부터 입력된 시각 정보의 색, 물체의 형태를 이루는 선분의 각도, 폭 등의 기본적인 시각 정보를 구별하여 전기적 신호로 부호화 한다. 예를 들어 시각 자극의 방향에 따라 반응의 정도가 달라지는 성질인 방향 선택성(orientation selectivity)을 가지는 세포들은 물체의 형태를 구별하기위해 필요한 윤곽선에 대한 정보를 선택적으로 처리한다.
이러한 시각 피질 세포들의 방향 선택성, 공간 주기성등의 성질은 시각 피질 상에서 연속적, 주기적인 형태로 변하는 기능성 지도 (functional map) 구조를 형성하는데, 이 지도들의 구조는 서로 독립적으로 형성되는 것이 아니라 서로 수평, 또는 수직 관계를 이루며 매우 효율적인 짜임새 구조(efficient tiling)를 이룬다. 이를 통해 시각 피질의 모든 국소 영역에서 정보 요소들을 손실없이 효율적으로 부호화할 수 있도록 만드는 대주(hypercolumn) 구조를 형성하는데, 시각 정보처리의 핵심이 되는 이러한 기능성 구조가 어떻게 발생하는지에 대해서는 밝혀진 바가 없었다.
연구팀은 수학적 모델에 기반한 컴퓨터 시뮬레이션을 통하여 포유류의 망막에서 발견되는 신경절 세포들이 단순한 물리적 상호작용을 통해 시각 정보의 입력이 없는 상태에서도 놀라울 정도로 효율적인 공간적 배치를 자발적으로 형성할 수 있음을 확인하였다.
연구팀은 이러한 구조가 시각 피질로 투영되어 시각 피질의 다양한 기능성 뇌지도들을 형성됨과 동시에, 그 지도들 간의 상호 짜임새를 정보처리에 가장 최적화된 형태로 구성할 수 있음을 보였다. 뇌의 주요 정보 처리 회로에 대한 설계도가 이미 망막 단계의 신경망이 형성되는 과정에서 자발적으로 발생함을 증명한 것이다.
백세범 교수는 “시각 정보처리의 핵심 구조인 시각 피질의 기능성 지도가 어떻게 자발적으로 발생하는지 규명하였을 뿐 아니라, 다양한 정보를 처리하는 각각의 뇌신경망 회로 구조가 단순한 물리적 상호작용에 의해 가장 효율적인 형태의 복합 구조를 형성할 수 있음을 처음으로 증명한 연구다" 라고 언급했다.
이번 연구는 한국연구재단의 이공분야기초연구사업 및 원천기술개발사업의 지원을 받아 수행됐다.
2021.01.06
조회수 60441
-
바이오및뇌공학과 김진우 학사과정, 국제 학술지 표지 논문 게재
우리 대학 바이오및뇌공학과 백세범 교수 연구팀에 소속된 대학생(학사과정)의 연구논문이 뇌신경과학 분야 저명 국제학술지에 게재됐음은 물론 해당 저널의 표지 논문으로 선정돼 화제가 되고 있다.
바이오및뇌공학과 4학년에 재학 중인 김진우 학생(22세)이 백세범 교수의 지도하에 수행한 학부생 개별연구 프로젝트에서 두뇌의 *시각 피질에서 관측되는 주요 신경망 연결 구조 중 하나인 '장거리 수평 연결(Long-range horizontal connection)'이 두뇌 발생 초기에 형성되는 원리를 규명한 연구결과가 뇌신경과학 분야 '저널 오브 뉴로사이언스'의 표지 논문으로 선정됐다.
☞ 시각 피질(Visual Cortex): 두뇌에서 시각 정보처리를 담당하는 영역. 망막 신경망 영역을 통해 입력받은 외부 공간에 대한 시각 정보를 처리하여 인지 과정을 구현하는 기능성 신경망 구조로 이루어져 있다.
연구팀은 이번 연구를 통해 어린 포유류 동물이 눈을 뜨기 전, 시각적인 학습이 전혀 이뤄지지 않은 상태, 즉 두뇌 발생 초기 상태에서 *망막 내 신경세포들의 자발적인 활동으로부터 발생하는 '*망막 파동'이 두뇌 시각 피질의 신경세포들을 특정한 공간적 패턴으로 자극하고, 이를 통해 시각 정보 처리에서 중요한 역할을 담당하는 '장거리 수평 연결'을 형성한다는 사실을 밝혀냈다.
☞ 망막(Retina): 눈의 안쪽을 둘러싸고 있는 신경세포의 얇은 층으로, 시각 시스템에서 외부 시각 정보가 신경세포 신호로 처음 변환되는 영역
☞ 망막 파동(Retinal Wave): 포유류의 초기 발달과정의 망막에서 나타나는, 신경절 세포들이 차례대로 발화하며 파도와 같은 파형으로 활동패턴이 확산하는 현상
김진우 학생과 송민 박사과정 학생이 공동 제1 저자로 참여한 이번 연구는 뇌신경과학 분야의 대표 국제학술지인 '저널 오브 뉴로사이언스 (Journal of Neuroscience)' 19일 字에 게재되는 한편 해당 호 표지 논문으로 선정됐다. (논문명: Spontaneous retinal waves generate long-range horizontal connectivity in visual cortex)
포유류의 시각 피질에서는 신경세포들이 외부 시각 자극의 특정 요소에만 선택적으로 반응하는 신경 선택성(neural tuning)을 보이는데, 비슷한 신경 선택성을 가지는 세포들은 공간적으로 멀리 떨어져 있어도 '장거리 수평 연결'이라는 특별한 상호 연결망 회로로 이어져 있다. 이처럼 특이한 신경망 연결 구조는 포유류의 시각 인지기능에 중요한 역할을 하는 것으로 생각돼왔지만, 이러한 회로가 뇌의 발생 초기 단계에서 외부 시각 정보에 의한 자극 없이 어떻게 자발적으로 발생하는지는 아직까진 명확히 알려진 바가 없었다.
백 교수 연구팀은 망막 내 신경망 구조를 모델화하고, 이를 통해 망막 파동의 패턴이 시각 피질 내 구조 형성에 미치는 영향을 시뮬레이션했다. 그 결과, 연구팀은 망막의 신경절에서 자발적으로 발생하는 망막 파동이 시각 피질로 전달되는 과정에서 형성되는 선택적 활동 패턴이 시각 피질 내의 장거리 연결 구조를 형성함을 밝혀냈고, 이 모델을 기반으로 동물실험에서 관측되는 초기 시각 피질의 특징적인 신경 활동 패턴을 재현하는 데 성공했다.
이 연구를 통해 연구팀은 동물실험에서 관측된 시각 피질의 장거리 수평 연결이 형성되는 과정과 주요 인자들을 정확히 확인했다. 이 결과를 기반으로 연구팀은 뇌 피질 내에서의 활동 패턴이 피질 구조를 결정한다는 기존 모델의 오류를 지적하는 한편, 망막에서 전달된 활동 패턴이 시각 피질의 구조를 형성하는 데 결정적인 영향을 끼친다는 새로운 발생 모델을 제시했다.
백세범 교수는 "외부의 정보를 학습할 수 없는 감각 신경망의 발생 초기 단계에서, 감각기관 말단의 신경 활동 패턴이 뇌 신경망의 주요 구조 형성에 결정적으로 기여한다는 새로운 뇌 구조 발생 모델을 제시한 연구라는 점에서 의미가 크다ˮ고 설명했다.
김진우 학생은 "이번 연구는 뇌가 외부 세계에 대한 감각 정보를 처음으로 경험하기 이전에 어떻게 비 지도적으로 학습을 하는지에 대해, 알려진 실험 데이터에 기반한 명확한 이론적 설명을 제공한다는 점에서 흥미롭다ˮ고 말했다. 그는 이어 "이와 같은 방향의 연구가 향후 데이터 학습에 의존하지 않는 새로운 형태의 인공신경망 연구에도 큰 도움이 될 것으로 기대가 된다ˮ고 덧붙였다.
이번 연구는 한국연구재단의 이공분야기초연구사업 및 원천기술개발사업의 지원을 받아 수행됐다.
2020.08.23
조회수 32655