[과학을 읽]놀고 있는 PC방 GPU로 104배 빠른 'AI학습' 구현

M 최고관리자 0 297 09.26 11:40

대한민국 어디에서나 쉽게 찾을 수 있는 PC방. PC방은 게임을 하려는 이용자들이 대부분이다.
고사양 컴퓨터의 가격이 비싸다 보니 집에서 온라인 게임을 하는 것보다는 고성능 PC와 고급 모니터를 사용할 수 있는 PC방을 선호하게 된다.

PC방 이용자들이 가장 중요하게 생각하는 점은 그래픽처리장치(GPU)다.
최신 GPU를 사용해야 게임의 그래픽을 제대로 실감할 수 있다.
이 때문에 대다수 PC방은 최신 GPU를 설치했다는 현수막을 걸고 경쟁하기도 한다.

스마트폰 모바일 게임의 인기가 치솟으며 상황이 달라졌다.
PC방마다 빈자리가 늘고 있다.
운영비용까지 치솟자 문을 닫는 PC방도 늘고 있다.
적게는 수십만원에서 100만원 이상의 GPU를 사용한 PC방의 GPU들이 사용되지 않고 있다는 의미다.

인공지능(AI) 학습을 위한 초고가 GPU는 품귀현상인 상황에서 일하지 않고 놀고 있는 저가의 소비자용 GPU를 활용해 AI를 학습할 수 있다면 어떨까 하는 상상을 현실로 만든 기술이 국내 연구진에 의해 개발돼 무료로 공개됐다.

카이스트(KAIST) 전기 및 전자공학부 한동수 교수 연구팀이 개발한, 일반 소비자용 GPU를 활용해 네트워크 대역폭이 제한된 분산 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 기술은 현재 국내 PC방 상황에서 주목하기에 충분하다.

고가의 데이터센터급 GPU나 고속 네트워크 없이도 AI 모델을 만들 수 있다는 점에서 한정된 재원으로 AI 연구를 해야 하는 기업이나 연구자들에게 도움이 될 것으로 기대된다.
GPU 가동을 위해 데이터센터에 필요한 대규모 전력을 확보하지 않아도 된다는 점도 긍정적이다.

어찌 보면 이번 연구 결과는 엔비디아의 AI 기술의 출발점으로 돌아간 것과도 비슷하다.
엔비디아는 대학생이던 이언 벅(현 부사장)이 GPU를 연결해 성능을 높이는 것을 눈여겨보다 영입해 ‘쿠다’(CUDA) 생태계를 탄생시켰다.
엔비디아 AI 혁명의 출발점이 됐던 ‘알렉스넷’이라는 프로그램도 GPU 몇 장을 이용해 만들어졌다.

기존에는 AI 모델을 학습하기 위해 개당 수천만 원에 달하는 고성능 서버용 GPU인 엔비디아 ‘H100’ ‘A100’과 이들을 연결하기 위한 400Gbps급 고속 네트워크를 가진 고가 인프라가 필요했다.

소수의 거대 IT 기업을 제외한 대부분의 기업과 연구자들은 비용 문제로 이러한 고가의 인프라를 도입하기 어려운 것이 현실이다.
엔비디아 GPU 구매를 위한 자금이 있어도 GPU를 필요한 만큼 제때 구매하기도 어렵다.
업계 관계자는 "엔비디아의 DGX 시스템은 구할 수도 없다"고 말할 정도다.
이 때문에 클라우드 형식으로 GPU를 빌려주는 사업이 새롭게 부상할 정도다.

PC방은 게임용 엔비디아 GPU(RTX급)를 대량으로 보유하고 있다.
이들 GPU를 활용한다면 적은 비용으로 AI 학습을 할 수 있다.
문제는 게임용 GPU를 사용할 경우 AI 모델 학습 속도가 고성능 GPU와 비교해 턱없이 느려진다는 점이다.
GPU 메모리가 적은 데다 네트워크 속도 제한으로 인한 한계다.
하지만 RTX급도 AI 용으로 활용하기에 충분하다는 의견도 많다.

한동수 교수 연구팀이 개발한 스텔라트레인(StellaTrain) 기술은 CPU와 GPU를 병렬로 활용해 학습 속도를 높이고, 네트워크 속도에 맞춰 데이터를 효율적으로 압축 및 전송하는 알고리즘을 적용해 고속 네트워크 없이도 여러 대의 저가 GPU를 이용해 빠른 학습을 가능하게 해 이런 문제를 해결했다.

이 기술은 고성능 H100과 비교해 10~20분의 1로 저렴한 소비자용 GPU를 활용한다.
엔비디아가 사용하는 NV링크와 같은 고속의 전용 네트워크 대신 대역폭이 수백에서 수천 배 낮은 일반 인터넷 환경에서도 효율적인 분산 학습을 가능하게 한다는 것도 장점이다.

한 교수는 "이번 실험은 RTX급 GPU로 했지만, 그 이하의 GPU로도 구현이 가능하다"고 설명했다.
PC방 외에도 기업이나 학교가 보유한 GPU도 같은 방식으로 활용할 수 있다.
연구 재원이 부족한 이들도 AI 연구를 위한 길이 열린 셈이다.

연구 결과, 스텔라트레인 기술을 사용하면 기존의 데이터 병렬 학습에 비해 최대 104배 빠른 성능을 낼 수 있는 것으로 나타났다.

한 교수는 "이번 연구가 대규모 AI 모델 학습을 누구나 쉽게 접근할 수 있게 하는 데 크게 기여할 것"이라며 "앞으로도 저비용 환경에서도 대규모 AI 모델을 학습할 수 있는 기술 개발을 계속할 계획"이라고 말했다.

한 교수는 이번 연구 결과를 누구나 사용할 수 있도록 ‘깃허브’(Github)에 공개했다.
한 교수는 "이번 연구는 누구나 사용할 수 있도록 한 오픈소스다.
연구자들이 이를 활용해 AI 연구에 박차를 가했으면 한다"고 했다.

GPU 공유를 위한 유료 서비스도 있다.
소프트웨어 기업 데이터얼라이언스(DA)도 PC방에서 놀고 있는 GPU를 공유하는 GPU 공유경제모델인 ‘지큐브(gcube)’ 서비스를 선보이고 베타테스트 중이다.
이는 네이버클라우드를 통해 서비스될 예정이다.

[과학을 읽]놀고 있는 PC방 GPU로 104배 빠른 'AI학습' 구현

커뮤니티

[과학을 읽]놀고 있는 PC방 GPU로 104배 빠른 'AI학습' 구현

실시간 전세계에서 몰리는 경기 순위

종목별 팀 순위