대용량 데이터 전송 기술의 이해와 활용
perfSONAR(Performance Service - Oriented Network monitoring ARchitecture)
- 전 세계 연구 및 교육 네트워크에서 널리 사용되는 분산형 네트워크 성능 측정 및 모니터링 툴킷
- 대규모 과학 데이터 전송과 같이 고성능 네트워크가 필수적인 환경에서 네트워크의 병목 현상이나 장애를 식별하고 해결하는데 중요한 역할
perfSONAR의 주요 기능
- 대역폭 - iperf/iperf3 도구를 사용하여 네트워크가 최대로 전송할 수 있는 데이터 양 측정
- 지연 시간 - owamp/twamp 와 같은 도구를 사용하여 데이터가 한 지점에서 다른 지점까지 도달하는 데 걸리는 시간 측정
- 패킷 손실 - 전송 중 손실되는 데이터 패킷의 비율 측정
- 경로 추적 - 데이터가 출발지에서 목적지까지 어떤 네트워크 경로를 거쳐가는지 추적
- 지터 - 패킷 도착 시간의 변동성을 측정하여 실시간 통신에 미치는 영향 평가
perfSONAR 특징
- 분산형 아키텍처 - 전 세계 수천개의 노드가 퍼져있어, 특정 경로의 문제뿐인 아닌 전역적인 네트워크 문제까지 파악 가능
- 자동화된 측정 스케줄링 - pscheduler와 같은 구성 요소를 통해 주기적으로 네트워크 성능 테스트 실행하도록 설정 가능, 네트워크 성능 변화 지속적으로 감시 가능
- 데이터 아카이빙 및 시각화 - 측정된 데이터는 표준화된 형식으로 저장되며, 웹 기반 인터페이스를 통해 그래프, 맵 등의 형태로 시각화하여 쉽게 이해하고 분석이 가능
- 문제 진단 및 해결 - 성능 저하가 감지될 경우, 어느 구간에서 문제가 발생하는지 빠르게 파악하여 네트워크 엔지니어가 신속하게 대응할 수 있도록 도움
- 오픈 소스 - 오픈 소프 프로젝트로 개발되어 누구나 자유롭게 사용하고 기여 가능
Dark Fiber
- 미사용 상태의 광섬유 케이블
주요 기능 및 특징
- 완전한 제어 및 소유권에 준한 권한 - 프로토콜, 대역폭, 보안 정책 등을 완전히 자유롭게 설정 가능
- 무제한에 가까운 확장성 - 이론적으로 무한대의 대역폭 제공 가능, 여러 개의 독립적인 파장 채널을 동시에 사용할 수 있기 때문, 필요에 따라 더 많은 광 송수신 장비를 추가하여 대역폭을 손쉽게 확장할 수 있고 미래의 데이터 수요 증가에 유연하게 대응할 수 있는 강력한 장점
- 초고속 및 낮은 지연 시간 - 전용 회선이므로 네트워크 혼잡으로 인한 속도 저하 및 지연이 거의 발생하지 않음, 금융 거래, 클라우드 컴퓨팅, 대용량 데이터 백업 및 복구, 과학 연구 데이터 전송(Science DMZ)과 같이 실시간성과 낮은 지연 시간이 매우 중요한 어플리케이션에 이상적
- 강화된 보안 - 공유 네트워크와 달리 물리적으로 분리된 전용 네트워크, 외부 공격이나 트래픽 간섭으로부터 훨씬 더 안전하며, 민감한 데이터를 전송하는 데 높은 수준의 보안을 제공
- 비용 효율성 - 높은 비용이 발생하지만 대용량 데이터 전송이 지속적으로 필요한 경우 통신 사업자의 대역폭 서비스 요금을 지불하는 것보다 총소유비용이 훨씬 저렴해질 수 있음
- 유연성 및 맞춤 설정 - 네트워크 아키텍처 , 프로토콜, 보안 정책 등 맞춤 설정 가능
- 인프라 구축 시간 및 비용 절감 - 다크 파이버를 임대하는 것은 이미 설치된 인프라 활용, 네트워크 구축 시간 단축 및 인프라 구축 비용 절감
Internet Standards
- RFC - Request for Comments, 인터넷 기술에 적용 가능한 새로운 연구, 혁신, 기법, 프로토콜 절차 등을 기술하고 제안하는 공식 문서 간행물
- 인터넷 표준 발행 형식 - 모든 인터넷 표준은 RFC 문서의 형태로 발행되지만 모든 RFC가 인터넷 표준은 아님
- 진화하는 문서- 처음에는 특정 아이디어나 제안에 대한 의견을 수렴하기 위해 작성, 논의와 검토를 거쳐 수정, 보완되며, 이 과정에서 새로운 RFC 번호로 다시 발행될 수도 있음
- RFC는 표준 트랙과 비표준 트랙으로 분류
- IETF - Internet Engineering Task Force
- 인터넷의 운영, 관리, 개발에 대해 협의하고 프로토콜과 구조적인 사안들을 분석하여 인터넷 표준을 제장하는 국제적인 자발적 표준화 작업 기구
- 개방형, 자발적 참여 - 특정 기업이나 정부에 소속된 단체가 아닌 전 세계의 네트워크 설계자, 운영자, 연구자 벤더 등이 자발적으로 참여하여 인터넷 기술에 대한 논의와 표준화 진행
- 실용적 지향 - 실제 구현 가능성과 상호 운용성을 중요시 함, 단순한 이론적인 표준이 아닌, 실제로 동작하는 코드와 시스템을 통해 검증된 기술을 표준화하려는 경향이 강함
- 워킹 그룹 - 특정 주제( ex - HTTP, IPv6, 보안 등)에 대한 워킹 그룹을 중심으로 진행, 각 워킹 그룹은 해당 분야의 전문가들이 모여 문제를 논의하고 솔루션을 개발하며 RFC 문서를 작성
- IESG - IETF의 기술적인 활동과 표준 제정 절차를 관리하는 조직, 각 워킹 그룹에서 제안된 문서를 검토하고 RFC 발행을 승인하는 역할
- 인터넷 아키텍처 위원회(IAB) - IETF의 상급 기관, 인터넷의 장기적인 아키텍처 방향을 제시하고 IETF와 다른 표준화 기구 간의 조정을 담당
- RFC와 IETF의 관계
- IETF는 인터넷 표준을 제장하는 조직, RFC는 IETF를 비롯한 인터넷 커뮤니티에서 제안된 기술들을 문서화하는 형식
- IETF의 워킹 그룹에서 특정 기술에 대한 합의가 이루어지면, 해당 기술은 RFC 문서로 작성되어 발행, 발행된 RFC는 다시 커뮤니티의 피드백을 받고, 여러 단계를 거쳐 최종적으로 인터넷 표준으로 승격
Internet protocol stack
- application → transport → network → link → physical
ESnet
- The Science DMZ: A Network Design Pattern for Data-Intensive Science
- 미국 에너지부 DOE 산하의 고성능 네트워크, 과학 연구를 지원하기 위해 특별히 설계되고 최적화된 네트워크 인프라
- 주요 역할
- 대규모 과학 데이터 전송 지원 - 현대 과학 연구는 천문학, 기후 모델링, 입자 물리학, 유전체학 등 다양한 분야에서 페타바이트를 넘어서는 대용량 데이터 생성, 이러한 방대한 데이터를 전 세계의 연구자, 슈퍼컴퓨팅 시설, 대형 과학 장비, 첨단 광원 간에 초고석으로 전송할 수 있도록 지원
- 데이터 순환 시스템 역할 - 과학 데이터가 생성되는 곳부터 분석, 저장, 공유되는 모든 과정에서 핵심적인 연결 고리가 됨
- 국제 연구 협력 촉진 - ESnet은 전 세계 270개 이상의 다른 연구 및 상업 네트워크와 연결되어 있어, 미국 에너지부의 지원을 받는 과학자들이 국제적인 파트너들과 빠르고 생산적으로 협력할 수 있도록 지원
- 목적
- Science DMZ 모델 개발 및 보급
- 고성능 네트워킹 기술 연구
- 성능 모니터링 및 튜닝
- 안정적이고 신뢰할 수 있는 서비스 제공
Science DMZ?
- 대용량 과학 데이터의 고속 전송을 위해 설계된 네트워크 아키텍처
- 캠퍼스나 연구소의 로컬 네트워크 경계 지점에 구축되는 네트워크틔 일부로, 장비, 구성, 보안 정책이 일반적인 업무용 시스템이나 기업용 컴퓨팅이 아닌 고성능 과학 애플리케이션에 최적화 되도록 설계
- 고성능 애플리케이션 위해 명시적으로 설계된 네트워크 아키텍처 - 대용량 데이터 이동을 위한 전용 서버 및 장비 운영
- 데이터 전송 전용 시스템 사용
- 성능 측정 및 네트워크 테스트 시스템
- 고성능 과학 환경에 맞춘 보안 정책 및 시행 메커니즘
Motivation
- 네트워크 데이터 집약형 과학 핵심 요소
- 데이터 소스 데이터 분석에 연결
- 협업자들간의 연결 지원
- 데이터 및 분석 자원에 대한 머신이 사용할 수 있는 인터페이스 제공 → 자동화 및 확장성 실현
Science DMZ Design Pattern
- Dedicated Systems for Data Transfer
- Nerwork Architecture
- Performance Tesring & Measurement
Abstract or Prototype Deployment
- 기존 네트워크 추가 설치 가능
- 구성 요소 및 기술 실험 용이
- 범위가 제한적, 보안 정책 예외 적용 쉬움
Support For Multiple Projects
- Science DMZ 아키텍처는 여러 프로젝트가 DTN을 배치할 수 있도록 지원
- 내부 정책에 따라 작동할 수도 있고, 그렇지 않을 수도 있음
Major Data Site Deployment
- 대규모 데이터 서비스가 주요 원인
- 단일 파이프 방식 작동 X
Multiple Ingress Flows, Common Egress
- 호스트는 자신이 가진 인터페이스 속도로 패킷을 전송
- 대용량 데이터를 전송하는 호스트는 백투백 패킷을 전송
- 마이크로 초 수준의 시간 스케일에서는 혼잡이 자주 발생
Router and Switch Output Queues
- 인터페이스 출력 큐는 라우터나 스위치가 순간적인 혼잡 상황에서 패킷 손실을 방지할 수 있게 해줌
- 네트워크 장비에서 큐는 비용과 밀접한 관련이 있음
- 고가의 샷시 기반 장비는 큐가 충분히 있음
- Science DMZ 아키텍처를 도입하는 요인 중 하나는 비용적 요소
Soft Network Failures - Hidden Problems
- Hardware Problem
- Link down, System crash, Software crash
- Software Problem
- 독립적인 테스트만이 Software 장애를 찾을 수 있는 방법
Test Infrastructure
- perfSONAR
Dedicated Systems -Data Transfer Node
- DTN은 데이터 전송 전용 구성
- 고성능 데이터 이동을 위해 구성
- 기능과 범위의 제한은 오히려 강점
- 보안에 용이
방화벽 외부 배치
- Science DMZ 자원은 성능상의 이유로 엔테프라이즈 방화벽 외부에 위치
- Science DMZ 트래픽은 방화벽의 Data 플레인을 통과하지 않음
단점
- 방화벽 사용 필수 요구
- 통합 엔터프라이즈 네트워크 보호 목적으로 방화벽 설계
- 고성능 화학 구조에 방화벽은 적합 하지 않음
상태 테이블
- 데이터 전송 과정에서 진행 상황, 오류 발생 여부, 재시도 횟수, 최종 완료 여부 등을 추적하고 관리하기 위해 사용되는 데이터 구조
- 상태 테이블 이슈 - 상태 테이블을 정리하지 않으면 오버플로우 발생 확률 증가
기업 환경의 방화벽 제공 기능
- 애플리케이션 계층 프로토콜 분석
- 내장형 VPN