-
GPU 한 대로 95배 빠르게 그래프 분석 AI 'FlexGNN' 개발
텍스트 기반 대규모 언어 모델(LLM)인 ChatGPT 등과 함께, 산업 현장에서는 금융 거래, 주식, SNS, 환자기록, 등 비정형 데이터를 그래프 형태로 분석하는 GNN(Graph Neural Network) 기반의 그래프 AI 모델이 적극 활용되고 있다. 하지만 전체 그래프를 한 번에 학습(풀 그래프 학습)하는데 막대한 메모리와 GPU 서버가 필요하다는 한계점이 있다. KAIST 연구진이 단 한 대의 GPU 서버만으로도 대규모 GNN 모델을 최고속 학습할 수 있는 세계 최고 성능의 소프트웨어 기술 개발에 성공했다.
우리 대학 전산학부 김민수 교수 연구팀이 여러 대의 GPU 서버를 활용하는 기존 방식과 달리 한 대의 GPU 서버에서 대규모 풀(full) 그래프 AI 모델을 빠르게 학습하고 추론할 수 있는 GNN 시스템 ‘FlexGNN(플렉스지엔엔)’을 개발했다고 13일 밝혔다. FlexGNN은 기존 기술 대비 학습 속도를 최대 95배 향상한다.
최근 기후, 금융, 의료, 제약, 제조, 유통 등 다양한 분야에서는 데이터를 정점과 간선으로 구성된 그래프 형태로 변환해 분석 및 예측하는 사례가 증가하고 있다.
전체 그래프를 모두 학습에 활용하는 풀 그래프 방식이 더욱 우수한 정확도를 보이지만, 학습 과정에서 대규모의 중간 데이터(intermediate data)가 발생해 메모리 부족 현상이 빈번히 발생하고, 여러 서버 간의 데이터 통신으로 인해 학습 시간이 길어지는 한계가 있었다.
연구팀이 개발한 FlexGNN은 이러한 문제를 극복하기 위해 여러 대의 GPU 서버 대신 단일 GPU 서버에서 SSD(솔리드 스테이트 드라이브)와 메인 메모리를 활용한 최적의 AI 모델 학습을 수행한다.
특히 데이터베이스 시스템의 질을 최적화시키는 AI 퀴리 최적화 학습을 통해 GPU-메인 메모리-SSD 계층 간 모델 파라미터, 학습 데이터, 중간 데이터를 최적의 시점과 방식으로 계산을 시키는 새로운 학습 최적화 기술을 개발했다.
이를 통해 FlexGNN은 데이터 크기, 모델 규모, GPU 메모리 등 가용 자원 상황에 따라 유연하게 최적의 학습 실행 계획을 생성해 높은 자원 효율성과 학습 속도를 구현한다.
그 결과, 메인 메모리 용량을 훨씬 초과하는 데이터에 대해서도 GNN 모델을 학습하며, 단일 GPU 서버에서도 최대 95배 빠르게 학습이 가능해졌다. 특히 기후 예측 등에서 슈퍼컴퓨터보다 정밀한 분석이 가능한 풀 그래프 AI 구현이 현실화됐다.
우리 대학 김민수 교수는 “날씨 예측과 신소재 발견 등 복잡한 문제를 해결하는데 풀 그래프 GNN 모델이 활발히 활용되면서 관련 기술의 중요성이 점점 높아지고 있다”며 “FlexGNN이 그동안 어려움으로 남아 있던 그래프 AI 모델의 학습 규모와 속도 문제를 획기적으로 해결한 만큼, 다양한 산업 분야에 널리 활용되기를 기대한다”고 밝혔다.
이번 연구는 전산학부 배정민 박사과정이 제1 저자로, 김민수 교수창업기업인 (주)그래파이의 한동형 CTO가 제2 저자로 참여했으며, 김 교수가 교신저자를 맡았다.
연구 결과는 세계적 권위의 데이터마이닝 학술대회인 ‘ACM KDD’에서 지난 8월 5일에 발표됐다. FlexGNN 기술은 향후 (주)그래파이의 그래프 DB 솔루션인 그래프온(GraphOn)에도 적용될 예정이다.
※ 논문제목: FlexGNN: A High-Performance, Large-Scale Full-Graph GNN System with Best-Effort Training Plan Optimization
※ DOI: https://doi.org/10.1145/3711896.3736964
한편, 이번 연구는 과기정통부 IITP SW스타랩과 IITP-ITRC, 그리고 한국연구재단 중견과제의 지원을 받아 수행됐다.
2025.08.13
조회수 4979
-
코로나19 해외유입 확진자 수 예측 기술 개발
최근 전 세계적으로 코로나바이러스감염증-19(COVID-19) 확진자 수가 2,000만 명을 넘어선 가운데 최근 국내에서도 코로나19 확진자 수가 급증해 2차 대유행 조짐을 보이면서 정부는 8월 23일부터 전국 대상으로 사회적 거리두기 단계를 2단계로 격상해 시행 중이다.
중앙재난안전대책본부(중대본)에 따르면 국내 코로나 누적 확진자 수는 8월 23일 오전 0시 기준으로 총 1만7,399명이다. 이 중 해외유입 감염자 수는 2,716명(8월 22일 오전 0시 기준)으로 전체 확진자의 약 16%를 차지한다. 대륙별로 보면 아시아(중국 외), 미주, 유럽, 아프리카 순이다. 지난 14일 이후 국내 지역 발생 신규확진자 수가 급증하고 있지만 향후 해외유입 확진자 수의 확산추세 또한 결코 장담할 수 없는 상황이다.
이런 가운데 우리 연구진이 해외유입 확진자 수를 예측할 수 있는 관련 기술을 개발했다. 우리 대학 산업및시스템공학과 이재길 교수 연구팀이 코로나19 해외유입 확진자 수를 예측하는 빅데이터‧인공지능(AI) 기술을 개발했다고 19일 밝혔다.
이재길 교수 연구팀이 개발한 이 기술은 해외 각국의 확진자 수와 사망자 수, 해외 각국에서의 코로나19 관련 키워드 검색빈도와 한국으로의 일일 항공편 수, 그리고 해외 각국에서 한국으로의 로밍 고객 입국자 수 등 빅 데이터에 인공지능(AI) 기술을 적용해 향후 2주간의 해외유입 확진자 수를 예측한다.
코로나19 확진자 수가 급증할수록 해외유입에 의한 지역사회 확산의 위험성도 항상 뒤따르기 마련이다. 이에 따라 이재길 교수 연구팀이 개발한 정확한 해외유입 확진자 수 예측기술은 방역 시설 및 격리 시설 확충, 고위험 국가 입국자 관리 정책 등에 폭넓게 응용 및 적용될 수 있을 것으로 기대가 크다.
우리 대학 지식서비스공학대학원에 재학 중인 김민석 박사과정 학생이 제1 저자로, 강준혁, 김도영, 송환준, 민향숙, 남영은, 박동민 학생이 제2~제7 저자로 각각 참여한 이번 연구는 최고권위 국제 학술대회 'ACM KDD 2020'의 'AI for COVID-19' 세션에서 오는 24일 발표된다. (논문명 : Hi-COVIDNet: Deep Learning Approach to Predict Inbound COVID-19 Patients and Case Study in South Korea)
해외유입 확진자 수는 다양한 요인에 의해서 영향을 받는다. 일반적으로 해외 각국에서의 코로나19 위험도와 비례하며, 해외 각국에서 한국으로의 입국자 수와도 비례한다. 그러나 코로나19 위험도와 입국자 수를 실시간으로 알아내기에는 많은 제약이 따르므로 연구진은 쉽게 구할 수 있는 종류의 빅데이터를 기반으로 하는 인공지능(AI) 모델을 구축하는 데 성공했다.
연구진은 기본적으로 해외 각국의 코로나19 위험도를 산출할 때, 보고된 확진자 수와 사망자 수를 활용했다. 그러나 이러한 수치는 진단검사 수에 좌우되기 때문에 코로나19 관련 키워드 검색빈도를 같이 입력 데이터로 활용해 해당 국가의 코로나19 위험도를 실시간으로 산출했다.
이와 함께 실시간 입국자 수는 기밀정보로서 외부에 공개되지 않기 때문에 매일 제공되는 한국에 도착하는 항공편수와 로밍 고객 입국자 수를 통해 이를 유추해냈다. 로밍 고객 입국자 수 데이터는 KT로부터 제공 받았지만 KT 고객 입국자만을 포함한다는 한계를 일일 항공편수를 함께 고려함으로써 이 문제를 해소했다.
이밖에 해외유입 확진자 수 예측을 위해서는 국가 간의 지리적 연관성도 매우 중요하게 고려해야 한다. 어느 특정 국가의 코로나19 발병이 이웃 국가로 더 쉽게 전파되며, 국가 간의 교류도 거리에 따라 영향을 받기 때문이다. 연구팀은 이러한 문제해결을 위해 지리적 연관성을 학습하도록 국가-대륙으로 구성되는 지리적 계층구조에 따라 우선 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측함으로써 궁극적으로 전체 해외유입 확진자 수를 정확히 예측하도록 하는 인공지능(AI) 모델을 설계했다. 연구팀은 이 인공지능 모델을 'Hi-COVIDNet'라고 이름 붙였다.
이후 연구팀은 약 한 달 반에 걸친 단기간의 훈련 데이터만으로 생성된 `Hi-COVIDNet'을 통해 향후 2주 동안의 해외유입 확진자 수를 예측한 결과, 이 모델이 기존의 시계열 데이터기반의 예측 기계학습이나 딥러닝 기반의 모델과 비교했을 때 최대 35% 더 높은 정확성을 지니고 있음을 확인했다.
제1 저자인 김민석 박사과정 학생은 "이번 연구는 최신 AI 기술을 코로나19 방역에 적용할 수 있음을 보여준 사례ˮ 라면서 "K-방역의 위상을 높이는데 기여할 것으로 기대한다ˮ 고 밝혔다.
이번 연구는 KAIST 글로벌전략연구소(소장 김정호)의 코로나19 AI 태스크포스팀의 지원을 받았고, KT(담당 변형균 상무)와 과학기술정보통신부(담당 김수정 서기관)의 '코로나19 확산예측 연구 얼라이언스'를 통해 로밍 데이터 세트를 지원받아 이뤄졌다.
2020.08.23
조회수 43822
-
이재길 교수 연구팀 연구성과 Microsoft Research 블로그 게재
<이재길 교수, 송환준 박사과정>
우리대학 이재길 교수(산업및시스템공학과 지식서비스공학대학원)와 송환준 박사과정 학생의 최신 빅데이터 연구결과가 최근 Microsoft Research 블로그에 실렸다. Microsoft Research는 매 분기 자사의 지원을 받은 연구과제 중에서 대표적인 성과를 선정해 자사 블로그에 게시하고 있는데 이번에는 이재길 교수 연구팀의 연구결과가 그 중 하나로 선정된 것이다.
이교수 연구팀은 이번 연구를 통해 전통적인 데이터 군집화 알고리즘인 k-메도이드의 분산 병렬처리 알고리즘을 개발했다. 그동안 빅데이터의 처리 속도를 높이기 위해 결과 정확도를 다소 희생하는 것이 일반적인 관례였으나 이 교수팀은 이번 연구를 통해 정확도를 거의 잃지 않고 현존하는 타 알고리즘보다 높은 성능을 달성했다고 밝혔다.
이번 연구결과는 지난 8월 열린 데이터 마이닝 분야 최고 학술대회인 ACM KDD 2017에서 발표된바 있다. 이 교수는 "추가적인 군집화 알고리즘의 연구도 마무리해 아파치 스파크 오픈소스 플랫폼에 연 성과를 탑재시킬 것"이라고 향후 계획을 밝혔다.
블로그 게시물 : https://www.microsoft.com/en-us/research/lab/microsoft-research-asia/articles/using-microsoft-azure-research-tool-scalable-data-mining-2/
2017.10.16
조회수 17900