Netsage 정리

1. NetSage

1.1 NetSage의 핵심 정체성

  • NetSage는 전 세계 연구 및 교육 네트워크를 오가는 거대한 과학 데이터의 흐름을 이해 및 분석, 최적화하기 위해 만들어진 플랫폼
  • 미국 구립과학재단(NSF)의 지원으로 개발

1.2 NetSage 3가지의 주요 기능

  • 통합성 (Unified)

    • 네트워크의 상태를 단편적으로 이해하는 것에 한계 존재

    • NetSage는 NetFlow, sFlow, IPFIX와 같은 플로우 데이터는 물론, 장비의 상태 정보를 알려주는 SNMP(장비 부하 상태), 그리고 실제 경로의 성능을 능동적으로 측정하는 perfSONAR 등 다양한 데이터를 하나의 플랫폼에서 통합하여 입체적인 분석 가능

      • 대용량 플로우가 발생하여 라우터 CPU가 급증했고, 그 결과 해당 경로의 패킷 손실률이 증가했다 등의 인과관계 분석 가능

  • 개방성 (Open)

    • NetSage는 투명성과 커뮤니티 협력 지향

    • 분석에 사용되는 소프트웨어는 오픈소스로 개발되어 누구나 그 원리를 들여다볼 수 있음

    • 분석된 데이터와 대시보드는 커뮤니티 포털을 통해 공개

  • 프라이버시 존중 (Privacy-Aware)

    • 수집 단계에서부터 개인 식별이 가능한 IP 주소의 마지막 8비트(마지막 옥텟)를 원천적으로 제거하고, 웹 서핑 등 작은 크기의 플로우는 필터링

    • 강력한 비식별화 조치로 민감한 개인정보 유출에 대한 우려 없이 기관의 트래픽 패턴을 분석하고 외부에 결과 공유 가능

1.3 기술 아키텍처

[데이터 수집 → 처리 및 강화 → 시각화]의 3단계 아키텍처를 통해 구현

  • 1단계: 데이터 소스 (Data Sources)

    • 기관의 경계 라우터나 스위치에서 NetFlow/sFlow/IPFIX, SNMP 기능 활성화

    • perfSONAR 장비는 별도 설치

  • 2단계: 데이터 수집 및 강화 (Data Ingest & Enrichment)

    • 생성된 데이터는 NetSage 파이프라인으로 전송

      • 비식별화

        • IP 주소 익명화 진행

      • 데이터 강화 (Enrichment)

        • NetSage는 비식별화된 IP 주소의 앞 24비트(192.168.1.xxx)를 미리 확보된 기관 및 위치 정보 데이터베이스와 매칭

          • 192.168.1.0/24 -> 기관: 서울대학교, 국가: 대한민국

          • 152.3.0.0/16 -> 기관: MIT, 국가: 미국

      • 과학 분야 태깅

        • 특정 IP 대역이 어떤 연구에 사용되는지(예: 고에너지 물리, 천문학) 등록된 정보를 바탕으로 과학 분야 태그를 붙임.

        • 예시: 단순한 IP 숫자의 나열이 "대한민국의 서울대학교에서 미국의 MIT로 고에너지 물리 데이터를 전송했다"는 정보로 재탄생
  • 3단계: 분석 및 시각화 (Analysis & Visualization) 

    • 데이터는 최종적으로 Grafana라는 강력한 오픈소스 시각화 도구를 통해 웹 대시보드로 구현

    • 사용자는 웹 브라우저만으로 이 모든 분석 결과를 손쉽게 조회하고 탐색 가능


1.4 NetSage가 제공하는 차별화된 장점 요약

  • '맥락(Context)' 중심의 분석: 단순 트래픽 양을 넘어, 과학 분야(Science Discipline)별 트래픽 분류를 통해 데이터의 목적과 의미를 이해하는 분석 가능

  • 거시적(Macro-level) 인사이트 제공: 개별 사용자가 아닌, 기관 대 기관, 국가 대 국가 간의 데이터 흐름 분석에 최적화되어, 글로벌 연구 생태계 내 우리 기관의 위상을 파악하는 데 중요한 단서 제공

  • 신뢰성과 투명성 기반의 협업: 데이터 처리 방식이 공개되어 신뢰도가 높고, 프라이버시가 보장되므로 해외 기관과 객관적인 데이터를 기반으로 신속하게 공동 문제 해결 가능



2. NetSage의 실용적 활용 시나리오

시나리오 1: 원인 불명의 성능 저하 문제 해결

  • 상황: 특정 연구 그룹이 해외 파트너 기관으로 대용량 데이터를 전송하는 데 평소보다 시간이 훨씬 오래 걸린다는 민원을 접수했습니다. SNMP 상으로는 회선 사용률이 포화 상태가 아니라 원인 파악이 어려운 상황입니다.

  • NetSage 활용

    1. [Flow Analysis Dashboard]에서 문제가 발생한 시간대와 해당 연구 그룹의 IP 대역을 필터링합니다.

    2. 해당 시간대에 평소와 다른 비정상적인 트래픽 패턴이 있었는지, 혹은 특정 목적지(기관, 국가)로 향하는 데이터 흐름이 급증했는지 확인합니다.

    3. [Individual Flows] 뷰를 통해 해당 목적지로 향하는 개별 플로우들의 상세 정보(지속 시간, 패킷량, 바이트 등)를 분석합니다. 이를 통해 병목 현상의 원인이 우리 기관의 내부 문제인지, 외부 인터넷 경로상의 문제인지, 아니면 수신 측 기관의 문제인지 범위를 좁혀 나갑니다.

  • 기대 효과: "네트워크가 느리다"는 막연한 불만을 "A 기관으로 향하는 국제 회선에서 간헐적인 패킷 손실이 발생하고 있음"과 같이 데이터에 기반한 구체적인 문제로 정의할 수 있습니다. 이를 통해 유관 부서나 해외 기관과 협력하여 신속하고 정확하게 문제를 해결할 수 있습니다.


시나리오 2: 데이터 기반의 인프라 투자 계획 수립

  • 상황: 내년도 예산 계획 수립을 위해 네트워크 회선 증설이 필요한지, 필요하다면 어느 구간을 얼마나 증설해야 하는지 객관적인 근거를 마련해야 합니다.

  • NetSage 활용

    1. [Bandwidth Dashboard]에서 지난 1년간의 주요 회선별 트래픽 추이를 분석하여 장기적인 증가율을 정량적으로 파악합니다.

    2. [Top Flows by Organization]과 [Flows by Science Discipline] 대시보드를 활용하여, 어떤 기관과의 데이터 교류가, 그리고 어떤 연구 분야의 데이터가 트래픽 증가를 주도하고 있는지 심층적으로 분석합니다.

    3. 기관의 중장기 연구 계획(예: 차세대 유전체 분석 프로젝트 착수)과 NetSage의 트래픽 데이터를 연계하여, 향후 1~2년 내 트래픽이 급증할 것으로 예상되는 구간을 정확히 예측합니다.

  • 기대 효과: "최근 1년간 B 연구소와의 유전체 데이터 교류량이 연평균 40%씩 증가하고 있으며, 내년 차세대 시퀀서 도입 시 현재 회선 용량으로는 감당이 어려울 것으로 예상되므로, 해당 구간의 회선 용량을 10Gbps에서 40Gbps로 증설해야 합니다."와 같이, 명확한 데이터에 근거하여 인프라 투자의 타당성을 입증하고 설득력을 높일 수 있습니다.


시나리오 3: 기관의 연구 경쟁력 및 기여도 보고

  • 상황: 기관장 및 이사회에 IT 인프라의 성과와 기여도를 보고해야 합니다. 단순한 장비 가동률 보고를 넘어, 네트워크가 기관의 핵심 미션에 어떻게 기여하는지 보여주고 싶습니다.

  • NetSage 활용

    1. [Top Flows by Country] 대시보드를 활용하여, 우리 기관이 전 세계 어느 국가와 가장 활발하게 데이터를 교류하는지 한 장의 시각화 자료로 만듭니다.

    2. Sankey 다이어그램을 이용하여 우리 기관을 중심으로 데이터가 오고 가는 주요 파트너 기관들의 관계망을 강물의 흐름처럼 직관적으로 표현하여 보고합니다.

    3. [Flows by Science Discipline] 데이터를 통해 우리 기관의 네트워크가 고에너지 물리, 생명 과학 등 핵심 연구 분야들을 얼마나 안정적으로 지원하고 있는지 정량적으로 제시합니다.

  • 기대 효과: "우리 기관의 네트워크는 지난 분기 총 10PB의 연구 데이터를 처리했으며, 이는 CERN, NASA 등 세계 최고 수준의 연구 기관과의 협력을 통해 이루어졌습니다"와 같이, 네트워크를 비용을 소비하는 부서(Cost Center)가 아닌, 기관의 연구 경쟁력에 직접적으로 기여하는 핵심 자산으로 포지셔닝할 수 있습니다.



3. 실제 사용 사례

ES-NET

출처: https://www.es.net/assets/pubs_presos/NETSAGEpaperFinal.pdf


NetSage에서 제공하는 사용 사례

출처: https://www.youtube.com/watch?v=gLOSak-Qtuw


실제 제공 라이브러리 사용

출처: https://all.netsage.global/grafana/d/-l3_u8nWk/individual-flows?var-dest=CERN%20-%20European%20Organization%20for%20Nuclear%20Research&var-src=KISTI&from=now-7d&to=now&orgId=2


배포주소

https://portal.netsage.global/grafana/d/000000003/bandwidth-dashboard?orgId=2