대용량 데이터 전송 기술의 이해와 활용

perfSONAR(Performance Service - Oriented Network monitoring ARchitecture)

  • 전 세계 연구 및 교육 네트워크에서 널리 사용되는 분산형 네트워크 성능 측정 및 모니터링 툴킷
  • 대규모 과학 데이터 전송과 같이 고성능 네트워크가 필수적인 환경에서 네트워크의 병목 현상이나 장애를 식별하고 해결하는데 중요한 역할


perfSONAR의 주요 기능

    • 대역폭 - iperf/iperf3 도구를 사용하여 네트워크가 최대로 전송할 수 있는 데이터 양 측정
    • 지연 시간 - owamp/twamp 와 같은 도구를 사용하여 데이터가 한 지점에서 다른 지점까지 도달하는 데 걸리는 시간 측정
    • 패킷 손실 - 전송 중 손실되는 데이터 패킷의 비율 측정
    • 경로 추적 - 데이터가 출발지에서 목적지까지 어떤 네트워크 경로를 거쳐가는지 추적
    • 지터 - 패킷 도착 시간의 변동성을 측정하여 실시간 통신에 미치는 영향 평가

perfSONAR 특징

    • 분산형 아키텍처 - 전 세계 수천개의 노드가 퍼져있어, 특정 경로의 문제뿐인 아닌 전역적인 네트워크 문제까지 파악 가능
    • 자동화된 측정 스케줄링 -  pscheduler와 같은 구성 요소를 통해 주기적으로 네트워크 성능 테스트 실행하도록 설정 가능, 네트워크 성능 변화 지속적으로 감시 가능
    • 데이터 아카이빙 및 시각화 - 측정된 데이터는 표준화된 형식으로 저장되며, 웹 기반 인터페이스를 통해 그래프, 맵 등의 형태로 시각화하여 쉽게 이해하고 분석이 가능
    • 문제 진단 및 해결 - 성능 저하가 감지될 경우, 어느 구간에서 문제가 발생하는지 빠르게 파악하여 네트워크 엔지니어가 신속하게 대응할 수 있도록 도움
    • 오픈 소스 - 오픈 소프 프로젝트로 개발되어 누구나 자유롭게 사용하고 기여 가능

Dark Fiber

  • 미사용 상태의 광섬유 케이블

주요 기능 및 특징

    • 완전한 제어 및 소유권에 준한 권한 - 프로토콜, 대역폭, 보안 정책 등을 완전히 자유롭게 설정 가능
    • 무제한에 가까운 확장성 - 이론적으로 무한대의 대역폭 제공 가능, 여러 개의 독립적인 파장 채널을 동시에 사용할 수 있기 때문, 필요에 따라 더 많은 광 송수신 장비를 추가하여 대역폭을 손쉽게 확장할 수 있고 미래의 데이터 수요 증가에 유연하게 대응할 수 있는 강력한 장점
    • 초고속 및 낮은 지연 시간 - 전용 회선이므로 네트워크 혼잡으로 인한 속도 저하 및 지연이 거의 발생하지 않음, 금융 거래, 클라우드 컴퓨팅, 대용량 데이터 백업 및 복구, 과학 연구 데이터 전송(Science DMZ)과 같이 실시간성과 낮은 지연 시간이 매우 중요한 어플리케이션에 이상적
    • 강화된 보안 - 공유 네트워크와 달리 물리적으로 분리된 전용 네트워크, 외부 공격이나 트래픽 간섭으로부터 훨씬 더 안전하며, 민감한 데이터를 전송하는 데 높은 수준의 보안을 제공
    • 비용 효율성 - 높은 비용이 발생하지만 대용량 데이터 전송이 지속적으로 필요한 경우 통신 사업자의 대역폭 서비스 요금을 지불하는 것보다 총소유비용이 훨씬  저렴해질 수 있음
    • 유연성 및 맞춤 설정 - 네트워크 아키텍처 , 프로토콜, 보안 정책 등 맞춤 설정 가능
    • 인프라 구축 시간 및 비용 절감 - 다크 파이버를 임대하는 것은 이미 설치된 인프라 활용, 네트워크 구축 시간 단축 및 인프라 구축 비용 절감


Internet Standards

  • RFC - Request for Comments, 인터넷 기술에 적용 가능한 새로운 연구, 혁신, 기법, 프로토콜 절차 등을 기술하고 제안하는 공식 문서 간행물
    • 인터넷 표준 발행 형식 - 모든 인터넷 표준은 RFC 문서의 형태로 발행되지만 모든 RFC가 인터넷 표준은 아님
    • 진화하는 문서- 처음에는 특정 아이디어나 제안에 대한 의견을 수렴하기 위해 작성, 논의와 검토를 거쳐 수정, 보완되며, 이 과정에서 새로운 RFC 번호로 다시 발행될 수도 있음
    • RFC는 표준 트랙과 비표준 트랙으로 분류
  • IETF - Internet Engineering Task Force
    • 인터넷의 운영, 관리, 개발에 대해 협의하고 프로토콜과 구조적인 사안들을 분석하여 인터넷 표준을 제장하는 국제적인 자발적 표준화 작업 기구
    • 개방형, 자발적 참여 - 특정 기업이나 정부에 소속된 단체가 아닌 전 세계의 네트워크 설계자, 운영자, 연구자 벤더 등이 자발적으로 참여하여 인터넷  기술에 대한 논의와 표준화 진행
    • 실용적 지향 - 실제 구현 가능성과 상호 운용성을 중요시 함, 단순한 이론적인 표준이 아닌, 실제로 동작하는 코드와 시스템을 통해 검증된 기술을 표준화하려는 경향이 강함
    • 워킹 그룹 - 특정 주제( ex - HTTP, IPv6, 보안 등)에 대한 워킹 그룹을 중심으로 진행, 각 워킹 그룹은 해당 분야의 전문가들이 모여 문제를 논의하고 솔루션을 개발하며 RFC 문서를 작성
    • IESG - IETF의 기술적인 활동과 표준 제정 절차를 관리하는 조직, 각 워킹 그룹에서 제안된 문서를 검토하고 RFC 발행을 승인하는 역할
    • 인터넷 아키텍처 위원회(IAB) - IETF의 상급 기관, 인터넷의 장기적인 아키텍처 방향을 제시하고 IETF와 다른 표준화 기구 간의 조정을 담당
  • RFC와 IETF의 관계
    • IETF는 인터넷 표준을 제장하는 조직, RFC는 IETF를 비롯한 인터넷 커뮤니티에서 제안된 기술들을 문서화하는 형식
    • IETF의 워킹 그룹에서 특정 기술에 대한 합의가 이루어지면, 해당 기술은 RFC 문서로 작성되어 발행, 발행된 RFC는 다시 커뮤니티의 피드백을 받고, 여러 단계를 거쳐 최종적으로 인터넷 표준으로 승격

Internet protocol stack

  • application → transport → network → link → physical

ESnet

  • The Science DMZ: A Network Design Pattern for Data-Intensive Science
  • 미국 에너지부 DOE 산하의 고성능 네트워크, 과학 연구를 지원하기 위해 특별히 설계되고 최적화된 네트워크 인프라
  • 주요 역할
    • 대규모 과학 데이터 전송 지원 - 현대 과학 연구는 천문학, 기후 모델링, 입자 물리학, 유전체학 등 다양한 분야에서 페타바이트를 넘어서는 대용량 데이터 생성, 이러한 방대한 데이터를 전 세계의 연구자, 슈퍼컴퓨팅 시설, 대형 과학 장비, 첨단 광원 간에 초고석으로 전송할 수 있도록 지원
    • 데이터 순환 시스템 역할 - 과학 데이터가 생성되는 곳부터 분석, 저장, 공유되는 모든 과정에서 핵심적인 연결 고리가 됨
    • 국제 연구 협력 촉진 - ESnet은 전 세계 270개 이상의 다른 연구 및 상업 네트워크와 연결되어 있어, 미국 에너지부의 지원을 받는 과학자들이 국제적인 파트너들과 빠르고 생산적으로 협력할 수 있도록 지원
  • 목적 
    • Science DMZ 모델 개발 및 보급
    • 고성능 네트워킹 기술 연구
    • 성능 모니터링 및 튜닝
    • 안정적이고 신뢰할 수 있는 서비스 제공

Science DMZ?

  • 대용량 과학 데이터의 고속 전송을 위해 설계된 네트워크 아키텍처
  • 캠퍼스나 연구소의 로컬 네트워크 경계 지점에 구축되는 네트워크틔 일부로, 장비, 구성, 보안 정책이 일반적인 업무용 시스템이나 기업용 컴퓨팅이 아닌 고성능 과학 애플리케이션에 최적화 되도록 설계
  • 고성능 애플리케이션 위해 명시적으로 설계된 네트워크 아키텍처 - 대용량 데이터 이동을 위한 전용 서버 및 장비 운영
  • 데이터 전송 전용 시스템 사용
  • 성능 측정 및 네트워크 테스트 시스템
  • 고성능 과학 환경에 맞춘 보안 정책 및 시행 메커니즘

 Motivation

  • 네트워크 데이터 집약형 과학 핵심 요소
    • 데이터 소스 데이터 분석에 연결
    • 협업자들간의 연결 지원
    • 데이터 및 분석 자원에 대한 머신이 사용할 수 있는 인터페이스 제공 → 자동화 및 확장성 실현

Science DMZ Design Pattern

  • Dedicated Systems for Data Transfer
  • Nerwork Architecture
  • Performance Tesring & Measurement

Abstract or Prototype Deployment

  • 기존 네트워크 추가 설치 가능
  • 구성 요소 및 기술 실험 용이
  • 범위가 제한적, 보안 정책 예외 적용 쉬움

Support For Multiple Projects

  • Science DMZ 아키텍처는 여러 프로젝트가 DTN을 배치할 수 있도록 지원
  • 내부 정책에 따라 작동할 수도 있고, 그렇지 않을 수도 있음

Major Data Site Deployment

  • 대규모 데이터 서비스가 주요 원인
  • 단일 파이프 방식 작동 X

Multiple Ingress Flows, Common Egress

  • 호스트는 자신이 가진 인터페이스 속도로 패킷을 전송
  • 대용량 데이터를 전송하는 호스트는 백투백 패킷을 전송
  • 마이크로 초 수준의 시간 스케일에서는 혼잡이 자주 발생

Router and Switch Output Queues

  • 인터페이스 출력 큐는 라우터나 스위치가 순간적인 혼잡 상황에서 패킷 손실을 방지할 수 있게 해줌
  • 네트워크 장비에서 큐는 비용과 밀접한 관련이 있음
  • 고가의 샷시 기반 장비는 큐가 충분히 있음
  • Science DMZ 아키텍처를 도입하는 요인 중 하나는 비용적 요소

Soft Network Failures - Hidden Problems

  • Hardware  Problem
    • Link down, System crash, Software crash
  • Software Problem
  • 독립적인 테스트만이 Software 장애를 찾을 수 있는 방법

Test Infrastructure

  • perfSONAR

Dedicated Systems -Data Transfer Node

  • DTN은 데이터 전송 전용 구성
  • 고성능 데이터 이동을 위해 구성
  • 기능과 범위의 제한은 오히려 강점
  • 보안에 용이

방화벽 외부 배치

  • Science DMZ 자원은 성능상의 이유로 엔테프라이즈 방화벽 외부에 위치
  • Science DMZ 트래픽은 방화벽의 Data 플레인을 통과하지 않음

단점

    • 방화벽 사용 필수 요구
    • 통합 엔터프라이즈 네트워크 보호 목적으로 방화벽 설계
    • 고성능 화학 구조에 방화벽은 적합 하지 않음

상태 테이블

  • 데이터 전송 과정에서 진행 상황, 오류 발생 여부, 재시도 횟수, 최종 완료 여부 등을 추적하고 관리하기 위해 사용되는 데이터 구조
  • 상태 테이블 이슈 - 상태 테이블을 정리하지 않으면 오버플로우 발생 확률 증가

기업 환경의 방화벽 제공 기능

  • 애플리케이션 계층 프로토콜 분석
  • 내장형 VPN