TTA 간행물 - ICT Standard Weekly

> 표준화 참여 > TTA간행물 > ICT Standard Weekly

기술표준이슈

다운로드 (2018-40호)
트위터 페이스북 미투데이

[제893호] IETF/IRTF에서 AI를 위한 네트워크 기술 논의 필요성 대두

New Template

1. IETF/IRTF에서의 AI+Network 기술 논의 개요

2018 7, 102 IETF 미팅(캐나다 몬트리올)에서도 이전에 개최되었던 IETF 회의에서와 마찬가지로 IRTF 회의가 함께 열렸다. IRTF Internet Research Task Force의 약자로 인터넷 프로토콜, 인터넷 구조, 인터넷 응용과 관련된 장기 연구 주제를 발굴하고, 각 연구 주제별로 Research Group(RG)을 형성하여 해당 RG 내 논의를 거쳐 Information 성격의 RFC 표준 문서를 만드는 연구 중심의 국제 표준 조직이다. 102 IETF 미팅 이전에 IRTF에는 NMLRG(Network Machine Learning Research Group)라는 이름의 Proposed RG가 존재하였고 이곳에서 네트워크 관련 데이터를 Machine Learning 알고리즘에 접목하여 네트워크 제어 및 관리를 지능적으로 운영하는 것과 관련된 표준화 아이템을 모색하였다. 하지만, 네트워크 제어 및 관리에 기계 학습을 접목하는 이슈는 논의해야 할 아이템이 꽤 광범위하고, 특히 표준화를 해야 하는 아이템의 선별 작업이 어려워서 논의만 무성하다가 NMLRG는 정식 RG로 승인받지 못하고 닫히게 되었다. 이후 2017 99 IETF 미팅에서는 IDNET(Intelligence-Defined Network)이라는 이름의 Bar BoF가 열렸다. Bar BoF는 비형식적으로 임의의 주제에 대해 관심 있는 사람들끼리 모여 향후 연구 및 표준화 방향에 대해 논의하는 모임을 일컫는다. 1시간에 걸친 미팅에서 화웨이가 준비한 발표 자료를 바탕으로 전문가들의 논의가 있었고, Network Monitoring, Network Prediction, QoS 등과 같은 전통적인 네트워크 기술들에 기계 학습과 같은 지능화된 기술을 접목할 수 있다는 공감대를 다시 한 번 확인하는 자리가 되었다. 하지만 여전히 표준화 아이템을 선별하는 데에는 한계가 있었다. 이후 네트워크 관리 관련 기술을 주로 논의하는 IRTF NMRG (Network Management RG)에서 기계학습 뿐만 아니라 Artificial Intelligence Network을 접목하는 AI+Network 기술 아이템을 다루기로 결정하고 NMRG AI+Network 기술을 논의하는 중요한 RG가 되었다. 이번 제102 IETF 미팅의 NMRG에서는 별도의 시간을 마련하여 AI+Network 이라는 주제를 집중 논의하였다. 이 때 논의된 사항을 살펴보면 다음과 같다.

 

2. 주요 논의 내용

1시간동안의 집중 논의 주제를 한 마디로 요약하면 ‘Network for AI vs. AI for Network’라고 할 수 있다. 그동안 IETF에서 발표된 AI+Network 관련 기술들은 ‘AI for Network’이다. , 네트워크에서 발생하는 여러 가지 문제들, 예를 들어 네트워크 구성 자동화, 라우팅 최적화, 네트워크 상태 예지 진단, 네트워크 고장 진단 및 복구, 네트워크 공격 감지 및 방어 등에 AI 기술이 어떻게 활용될 수 있는지 사례 중심으로 기술발표가 있었다. 하지만, 3년 동안의 기술 발표 및 Research Group 제안에도 불구하고 IRTF 또는 IETF에서 정식 그룹이 결성되지 못하고 계속해서 논의가 맴도는 이유는 기술적 중요성에도 불구하고 논의할 내용이 광범위하고 정확한 표준화 이슈를 도출해내지 못했기 때문이다. 사실, AI+Network 기술은 AI 알고리즘 등의 적용 기법 자체에 관심이 있거나, 전반적인 시스템 구성에 치중한 연구가 지속되고 있었기 때문에 표준화 이슈를 도출하기가 쉽지 않다. 하지만, 기술 분야에서 일반적인 국제 표준이 가지는 중요성은 여전히 AI+Network 분야에서도 그대로 적용되기는 마찬가지이다. 예를 들어, 네트워크에서 발생하는 데이터를 AI 알고리즘의 학습 데이터로서 효율적으로 활용할 수 있도록 네트워크에서 발생하거나 교환되는 데이터 자료에 대한 표준 구조를 제시하는 연구는 중요할 수 있다. 하지만, 네트워크에서 발생하는 문제들은 매우 광범위하여 어떠한 네트워크 관련 데이터부터 논의해야 할지 결정하는 것 조차 어렵다고 볼 수 있다. 그래서, 논의를 진행할수록 문제의 어려움만 인식하고 쉽게 표준화를 진행하기가 어려웠다.

하지만, 이번 회의에서는 ‘Network for AI’라는 주제어가 제시되면서 논의를 초점을 변경하려는 시도가 있었다. 이 주제는 네트워크에서 발생하는 문제를 해결하기 위하여 AI를 어떻게 활용할지와 관련되는 것이 아니라, 거꾸로 AI를 효율적으로 운영하기 위하여 Network 관련 기능을 어떻게 지원하고 구성되어야 하는지와 관련된다. AI는 컴퓨팅(Computing) 관련 사항이다. , 효율적인 컴퓨팅을 위한 네트워크 기능과 구조를 다시 살펴보고 어떻게 변경되어야 하는지를 논의하는 것이다. 이와 관련된 주요 기술적 이슈는 중앙집중형 구조에서부터 분산형 구조까지 CPU, Memory, Energy, Sustainability, Federation/Synchronization 등에 관한 사항을 AI 효율을 높이는 데 맞추어 변경하는 것과 관련된다. 이번 NMRG에서 발표된 사항에 따르면 32개의 서버로 구성된 분산 컴퓨팅 환경에서 이미지 분류로 유명한 Deep Convolutional Neural Network VGG-16를 수행시키는데 약 42.08초 걸리던 것을 In-Network Computing 기술 및 Multicast 기술을 사용하여 1.43초 까지 줄일 수 있었다고 한다. 딥러닝이 수행되려면 박대한 양의 데이터가 다루어져야 하는데 32개의 서버 각각이 서로 데이터를 교환해야 하는 일이 발생된다면 네트워크 관련 기술이 그러한 학습 효율을 높이는 데에 매우 중요한 역할을 할 수 있다.

 

 [그림 1] 분산형 딥러닝 시스템 구조

 

특히 [그림 1]과 같은 분산형 딥러닝 시스템은 Parameter Devices라는 딥러닝 모델이 지니는 파라미터들을 저장 관리하는 요소를 지닌다. 이러한 Parameter Device와 각각의 딥러닝 학습 서버 Device들은 매우 많은 양의 데이터를 교환할 수 밖에 없다. 따라서, 이러한 Parameter Device와 수 많은 학습 서버 Device 들 간의 네트워크 구조 및 관련 기능들은 딥러닝 수행 효율을 높이는 데에 많은 역할을 할 수 있다. 이번 IETF NMRG에서는 앞으로 논의의 초점을 이렇게 딥러닝 수행 효율을 높일 수 있는 네트워크 구조 및 기능을 논의하는 쪽으로 방향을 맞추어 보면 어떠한가에 대한 논의가 있었으며 기술 논의의 시급성 및 중요도로 보았을 때 앞으로 이러한 ‘Network for AI’ 주제로 IETF/IRTF 논의가 맞추어질 가능성이 높다.

 

3. 맺음말

AI는 그 역사가 오래되었지만 이를 네트워크와 접목하여 지능적인 네트워크 관리 및 제어에 AI를 활용하는 기술 논의는 이제 초기단계라고 볼 수 있다. 현 시점의 AI+Network 연구결과들을 살펴보면 어느 정도 제한된 환경에서 연구 실험된 의미 있는 결과들은 제시되고 있지만, 실제 운영 중인 사업자 네트워크 환경에서 제대로 테스트된 연구 결과는 거의 없다. 게다가 분산되고 복잡한 네트워킹 요소들을 AI의 효율을 위해 변경하는 ‘Network for AI’에 대한 연구는 외국의 선진 연구 기관에서 선도적으로 수행하고 있는 실정이다. 향후 국내에서도 네트워크 운영 관리 분야에 AI를 접목하는 연구에 많은 관심이 요구된다.

한연희 (한국기술교육대학교 교수, yhhan@koreatech.ac.kr)

* 본 글은 저자의 의견일 뿐 TTA 기관의 입장과는 무관합니다.