본문 바로가기
대메뉴 바로가기
KAIST
연구뉴스
유틸열기
홈페이지 통합검색
-
검색
메뉴 열기
%EC%8B%A0%EA%B8%B0%EC%A0%95
최신순
조회순
숨겨진 다자 간 관계를 추적·복원하는 AI '마리오' 개발
회의실에 여러 사람이 동시에 모여 회의하는 경우처럼, 다수의 객체가 동시에 상호작용하는 고차원 상호작용(higher-order interaction)은 다양한 분야에서 발생하며, 실세계의 복잡한 관계를 담고 있다. 하지만 기술적 제약으로 인해 많은 분야에서는 주로 개별 쌍 간의 저차원 정보만 수집돼, 전체 맥락이 손실되고 활용에 제약이 따랐다. KAIST 연구진이 이처럼 불완전한 정보만으로도 고차원 상호작용을 정밀하게 복원*하는 AI ‘마리오(MARIOH)’를 개발하며, 소셜 네트워크, 뇌과학, 생명과학 등 다양한 분야에서 혁신적 분석 가능성을 열었다. *복원: 사라지거나 관측되지 않은 원래 구조를 추정/재구성하는 것 우리 대학 김재철AI대학원의 신기정 교수 연구팀이 저차원 상호작용 정보만으로 고차원 상호작용 구조를 높은 정확도로 복원할 수 있는 인공지능 기술인 ‘마리오(이하 MARIOH, Multiplicity-Aware Hypergraph Reconstruction)’를 개발했다고 5일 밝혔다. 고차원 상호작용 복원이 어려운 이유는 동일한 저차원 상호작용 구조로부터 파생될 수 있는 고차원 상호작용의 가능성이 무수히 많기 때문이다. 연구팀이 개발한 MARIOH의 핵심 아이디어는 저차원 상호작용의 다중도(multiplicity) 정보를 활용해, 해당 구조로부터 파생될 수 있는 고차원 상호작용의 후보 수를 획기적으로 줄이는 데 있다. 더불어, 효율적인 탐색 기법을 통해 유망한 상호작용 후보를 신속하게 식별하고, 다중도 기반의 심층 학습 기술을 활용해 각 후보가 실제 고차원 상호작용일 가능성을 정확하게 예측한다. 연구팀은 10개의 다양한 실세계 데이터 셋을 대상으로 한 실험 결과, MARIOH는 기존 기술 대비 최대 74% 높은 정확도로 고차원 상호작용을 복원하는 데 성공했다. 예를 들어, 논문 공저 관계 데이터(출처: DBLP)에서는 98% 이상의 복원 정확도를 달성해, 약 86% 수준에 머무는 기존 기술을 크게 앞질렀다. 또한, 복원된 고차원 구조를 활용할 경우, 예측, 분류 등 다양한 작업에서의 성능이 향상되는 것으로 나타났다. 신기정 교수는 “MARIOH는 단순화된 연결 정보 정보에만 의존하던 기존 접근에서 벗어나, 실제 세계의 복잡한 연결 관계를 정밀하게 활용할 가능성을 열어 준다”라며, “단체 대화나 협업 네트워크를 다루는 소셜 네트워크 분석, 단백질 복합체나 유전자 간 상호작용을 분석하는 생명과학, 다중 뇌 영역 간 동시 활동을 추적하는 뇌과학 등 다양한 분야에서 폭넓게 활용될 수 있을 것”이라고 밝혔다. 김재철AI대학원의 이규한 석박통합과정(現 GraphAI 소프트웨어 엔지니어)과 이건 석박사통합과정, 신기정 교수가 저자로 참여한 이번 연구는 지난 5월에 홍콩에서 열린 제41회 IEEE 국제 데이터공학 학회(IEEE International Conference on Data Engineering, IEEE ICDE)에서 발표됐다. ※논문명: MARIOH: Multiplicity-Aware Hypergraph Reconstruction ※DOI: https://doi.ieeecomputersociety.org/10.1109/ICDE65448.2025.00233 한편, 이번 연구는 정보통신기획평가원의 지원을 받은 ‘EntireDB2AI: 전체 관계형 데이터베이스를 종합적으로 활용하는 심층 표현 학습 및 예측 원천기술과 소프트웨어 개발’ 과제와 한국연구재단의 지원을 받은 ‘그래프 파운데이션 모델: 다양한 모달리티 및 도메인에 적용 가능한 그래프 기반 기계 학습’과제의 성과다.
2025.08.05
조회수 519
기존 대비 50배 이상 압축 가능한 뉴크론 개발
희소 행렬에 해당하는 2억 건의 비디오 시청 내역을 10킬로바이트(KB) 크기로 성공적으로 압축할 수 있으며 기존 기술을 이용해 1기가바이트(GB)로 압축한 것보다도 압축으로 인한 정보 손실이 적은 기술이 개발됐다. 우리 대학 김재철AI대학원 신기정 교수 연구팀은 기존 대비 50배 이상 우수한 압축률의 희소 행렬 압축 기술인 뉴크론(NeuKron)을 개발했다고 9일 밝혔다. 희소 행렬이란 높은 비율의 원소가 0인 행렬을 의미하며, 전자상거래 구매 내역, 소셜 네트워크에서의 친구 관계, 문서와 단어 간 포함 관계 등 다양한 종류의 데이터가 희소 행렬 형태로 저장 및 활용된다. 예를 들어, 전자상거래 구매 내역의 경우, 행렬의 각 행이 각 구매자에 해당하고, 각 열이 각 상품에 해당하며, 각 원소는 해당 구매자가 해당 상품을 구매한 수량을 의미한다. 예를 들어, i행 j열 원소는, i번째 구매자가, j번째 상품을 구매한 수량에 해당한다. 각 구매자는 전체 상품 중, 일부만을 구매하기 때문에, 해당 행렬은 원소 대부분이 0인 희소 행렬이다. 실세계 데이터로부터 얻어진 대규모 희소 행렬을 효율적으로 다루기 위해서는, 압축 기술이 필수적이다. 예를 들어, 1억 명의 구매자와 1억 개의 상품으로 구성된 전자상거래 구매 내역의 경우, 행렬은 전체 구매자 수와 전체 상품 수의 곱에 해당하는 1경 개의 원소를 갖는다. 또한, 희소 행렬 압축은 많은 응용문제에 활용되고 있다. 예를 들어, 많은 추천시스템은 희소 행렬을 손실 압축한 뒤, 복원하는 과정을 통해, 각 구매자가 각 상품을 구매하고자 하는 의향을 추론한다. 또한, 이때의 복원 오차를 기반으로 이상 데이터를 탐지하고 교정하기도 하며, 매개 변수 행렬 압축을 통해서 인공지능 모델을 경량화하기도 한다. 신기정 교수팀은 희소 행렬의 압축률을 크게 개선할 수 있는 손실 압축 기술인 뉴크론을 개발했다. 뉴크론은 실세계 데이터에서 흔하게 발견되는 자기 유사성에 착안했는데, 자기 유사성이란 대상의 일부분을 확대해 볼 때, 대상의 전체와 닮은 패턴이 나타나는 성질을 의미한다. 뉴크론은 크게 세 가지 단계로 구성된다. 첫 번째 단계는, 행렬이 자기 유사적인 구조를 가질 수 있도록 행과 열을 재배열하는 것이며, 두 번째 단계는, 재배열된 행렬을 재귀적으로 분해하는 과정을 통해, 행렬의 각 원소를 위치 수열로 인코딩하는 것이다. 마지막 단계는 각 위치 수열을 입력으로 행렬의 원소값을 추론하는 순환신경망을 학습하는 것이다. 이때, 순환신경망은 행렬의 자기 유사성을 기반으로 정확한 추론을 수행한다. 신기정 교수팀의 뉴크론 기술은 희소 행렬뿐 아니라, 희소 텐서의 압축에도 적용할 수 있다. 행렬이 행과 열로 구성된 2차원 데이터라면, 텐서는 행렬을 3차원 이상으로 일반화한 것이다. 예를 들어, 3차원 텐서는 행렬을 수직으로 쌓은 형태이다. 실제로 행렬과 텐서를 포함 10개의 실세계 데이터 세트를 사용해 검증한 결과, 동일 복원 오차 하에서, 뉴크론은 기존 기술 대비 50배 이상 우수한 압축률을 보였다. 우리 대학 김재철AI대학원 권태형 박사과정, 고지훈 석박사통합과정이 공동 제1저자, 전북대학교 정진홍 교수가 공동 저자로 참여한 이번 연구는 올해 5월에 미국 오스틴에서 열리는 미 컴퓨터협회 웹 학술대회(이하 ACM WWW)에서 발표될 예정이다. (논문 제목: NeuKron: Constant-Size Lossy Compression of Sparse Reorderable Matrices and Tensors) 올해 32회를 맞은 ACM WWW는, 웹 분야 최우수 학회로, 전 세계에서 해당 분야 전문가들이 참석해 최신 연구 성과를 공유한다. 신기정 교수는 "다양한 실세계 데이터 그리고 인공지능 모델의 매개 변수가 희소 행렬의 형태로 표현된다ˮ라며, "희소 행렬 압축 기술을 추천시스템, 이상 탐지, 인공지능 모델 경량화 등 다양한 분야에 활용 가능할 것으로 기대한다ˮ라고 설명했다. 한편 이번 연구는 정보통신기획평가원의 지원을 받은 강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습 과제와 한국연구재단의 지원을 받은 부호화된 그래프 마이닝 과제의 성과다.
2023.03.09
조회수 7662
<<
첫번째페이지
<
이전 페이지
1
>
다음 페이지
>>
마지막 페이지 1