결정적 Shuffle을 기반으로 한 물리적 탄력성 라우팅
AI 클러스터가 지속적으로 확장되고 데이터 센터가 빠른 속도로 확장됨에 따라 네트워크 아키텍처는 자연스럽게 기존 설계를 뛰어넘었습니다. 리프-스파인 및 드래곤플라이 토폴로지가 표준이 되고 있습니다. 서류상으로는 효율적이고 현대적으로 보입니다. 그러나 실제로 운영 팀은 다른 현실에 직면하는 경우가 많습니다.{4}}실제로 문제를 일으키는 것은 토폴로지 자체가 아니라 엄청난 양의 패치 코드입니다. 수천 개의 연결을 처리하게 되면 관리가 금방 어려워집니다. 그리고 단일 지점이 실패하면 전체 링크가 중단될 수 있습니다. 그런 종류의 위험은 무시하기 어렵습니다.
여기서 Infinity Shuffle OXC의 아이디어가 이해되기 시작합니다. 단일 경로가 모든 것을 전달하는 기존의-대{2}}모델-을 따르는 대신{4}}고속 채널을 분리하여 물리적 계층의 여러 Spine 경로에 배포합니다. 간단히 말해서 모든 계란을 한 바구니에 담는 것을 방지합니다. 장애가 발생하더라도 시스템이 완전히 붕괴되는 것은 아닙니다. 단지 약간 줄어든 용량으로 작동하며 서비스는 계속 실행됩니다.
1.6T 연결을 예로 들어보겠습니다. 이는 8개의 독립적인 200G 채널로 나누어지며, 각각은 서로 다른 경로를 통해 라우팅됩니다. 하나의 모듈이나 광섬유에 장애가 발생하면 대역폭의 일부({4}}약 12.5%-)만이 영향을 받습니다. AI 훈련 워크로드의 경우 이러한 종류의 저하는 일반적으로 관리 가능합니다. 완전한 중단보다는 약간의 속도 저하가 훨씬 더 바람직합니다.
운영 관점에서 이는 유지 관리의 리듬도 변화시킵니다. 결함이 있는 구성 요소에는 더 이상 긴급한 야간 개입이 필요하지 않습니다. 이는 예정된 유지 관리 기간 동안 처리할 수 있으며 이는 대규모 환경에서 훨씬 더 지속 가능합니다-. 동시에, 광학 모듈의 감소로 전체 시스템이 단순화되어 시스템이 복잡해지기보다는 안정성이 향상됩니다. 여러 면에서 이러한 분산 접근 방식은 이론적 완벽함보다는 실제{5}}엔지니어링 논리에 더 가깝게 느껴집니다.
물리적 계층에서 이 솔루션은 사전{0}}종단 처리된 고밀도 파이버 셔플 설계를 사용하여 삽입 손실을 약 0.05dB만큼 낮게 유지합니다. 이는 IEEE 802.3 표준에 따라 채널 스큐 및 격리를 유지하면서 충분한 광 예산으로 400G, 800G 및 1.6T 네트워크를 지원하도록 설계되었습니다. 지나치게 화려한 것은 없지만-실용적이고 일관되며 규모에 맞게 제작되었습니다.
대규모 AI 요구 사항을 위해 설계된 4가지 핵심 차원
1. 원활한 생태계 통합 및 유연한 배포 토폴로지
![]() |
![]() |
Infinity Shuffle OXC는 타사 어댑터 박스 없이 GPX 시리즈 배포 프레임(GPX51, GPX58, GPX59, GPX61, GPX62, GPX70)과 직접 통합됩니다.{6}} 기본적으로 MPO/MTP®, MMC, SN-MT 커넥터는 물론 직접 베어 파이버 연결도 지원합니다.
두 가지 배포 토폴로지를 사용할 수 있습니다.
인라인 셔플: 스파인 연결은 후면에서 들어오고(일반적으로 랙 스파인 스위치 상단-에 맞춰 정렬됨-) 리프 연결은 전면에서 나옵니다. 이 구성은 모듈식 카세트- 기반 설계와 전체 1RU/2RU 패널 형식을 모두 지원합니다. 이는 열기/냉기 통로를 명확하게 분리하고 결정적인 후면-에서-전면으로의 케이블 라우팅을 보장합니다.
나란히-옆으로-나란히 셔플: 모든 스파인 스위치 연결은 섀시 또는 패널의 왼쪽에 통합되고 리프 스위치 연결은 오른쪽에서 나옵니다. 이 레이아웃은 스파인과 리프 영역 사이의 수평 케이블 관리를 최소화해야 하는 중앙 집중식 FDF(광섬유 분배 프레임)에 특히 적합합니다.
두 토폴로지 모두 후면-액세스 직렬 연결과 전면-액세스 병렬 상호 연결을 지원하여 랙 공간 활용도를 크게 향상시키고 다양한 데이터 센터 케이블링 아키텍처에 적응합니다.
2. 비용 최적화 및 위험 완화
경제적 관점에서 볼 때, 400G, 800G 및 1.6T 수준의 통합은 필요한 스위치 수를 24개에서 8개로, 광 모듈 수를 1280개에서 320개로 줄입니다. 이는 전력 소비와 자본 지출을 직접적으로 낮추고 총 비용 절감 효과는 최대 40%에 이릅니다.
위험 관점에서 기존 번들 광케이블 시스템에는 단일 장애 지점이 발생합니다.-예를 들어 단일 MPO{10}}16 트렁크가 손상되면 전체 1.6T 링크가 즉시 손실될 수 있습니다. 이와 대조적으로 Shuffle 아키텍처는 8개의 독립적인 물리적 경로에 동일한 1.6T 용량을 분산합니다. 통계적으로 오류는 개별 채널로 격리되어 영향을 총 대역폭의 1/8로 제한합니다. AI 훈련 클러스터는 RDMA 연결을 유지하면서 대규모 네트워크 재수렴 이벤트를 방지하면서 약 87.5% 용량으로 계속 작동할 수 있습니다.
3. 산업용-등급 정밀 제조
각 OXC 장치는 기판 절단(±0.5mm), 생체 공학적 섬유 라우팅(±0.1mm) 및 정밀 분배(±0.5mm)를 통합하는 자동화된 제조 라인에서 생산됩니다.
생체 공학적 라우팅 설계는 엄격한 물리적 채널 격리를 보장하여{0}1.6T 링크 내의 8개 200G 채널 간의 혼선을 방지하고{3}}동일한 광섬유 길이를 유지하여 신호 왜곡을 제거합니다. 모든 장치는 배송 전에 포괄적인 광학 검증을 거쳐 현장 종료 오류의 위험을 제거하고 고속 PAM4 신호와 관련된 채널 불균형 문제를 방지합니다-.
4. 국제표준 준수
Infinity Shuffle OXC는 Telcordia GR-63, GR-1435(MPO), IEC 61300, IEC 61753-1 및 IEC 61754-7/TIA-604-5를 포함한 주요 국제 표준을 준수합니다.
유연한 광학 회로는 컨포멀 보호 코팅이 된 폴리이미드 필름 기판을 사용하여 최대 1000mm × 800mm의 크기를 지원합니다. 단일{3}}레이어 설계는 1,200개 이상의 파이버 코어를 수용할 수 있어 대규모 배포의 밀도 요구 사항을 충족합니다.
5. 다중-채널 신호 무결성
기판은 250μm 리본 섬유, 200μm 단일{2}}모드 섬유(G657.A1/A2) 및 차세대-180μm 섬유를 지원합니다.
광학 성능은 0.12dB 이하의 일반적인 삽입 손실(고-고품질 UPC/APC), 97% 무작위 매칭 0.25dB 이하, 반사 손실 65dB 이상(APC) 및 60dB 이상(UPC)으로 엄격하게 제어됩니다. 이는 1.6T 링크의 8개 채널 전체에 균일한 손실 분배를 보장하여 KP4 FEC 교정 요구 사항을 충족하고 규모에 맞게 전력 효율성을 유지합니다.
휴머나이저 단어가 충분하지 않습니다. Surfer 플랜을 업그레이드하세요.
세 가지 핵심 애플리케이션 시나리오에 정확하게 맞춰져 있음

1. 향상된 스파인 안정성으로 리프-스파인 최적화
AI 훈련 클러스터에서 Infinity Shuffle OXC는 Spine과 Leaf 레이어 간의 결정론적 교차 라우팅을{0}}가능하게 합니다. 직렬 인라인 셔플 구성으로 배포할 경우-후면에서 들어오는 스파인 연결과 전면에서 나가는 리프 연결-은 깔끔한 열기/냉기 통로 구조와 예측 가능한 케이블 레이아웃을 생성합니다.
이 디자인은 린(Lean) Spine 아키텍처와 자연스럽게 조화됩니다. 1.6T 링크는 8개의 Spine 스위치에 물리적으로 분산됩니다. 하나의 Spine 스위치-(예: Spine #3)에 유지 관리가 필요한 경우 단일 200G 채널(총 대역폭의 12.5%)만 ECMP를 통해 동등한 경로로 리디렉션됩니다. 나머지 용량은 계속 작동하므로 교육 워크로드가 중단 없이 약 1.4T의 처리량을 유지할 수 있습니다. 핵심 서비스에 영향을 주지 않고 유지 관리를 진행할 수 있습니다.
2. 물리적-레이어 분산을 통해 Dragonfly 토폴로지 단순화
수만 개의 노드가 있는 고성능 컴퓨팅(HPC) 환경에서 기존 Dragonfly 풀{1}}메시 토폴로지는 복잡한 내부 그룹 케이블링이 필요합니다.- Infinity Shuffle OXC를 사용하면 -그룹 간 광학 셔플링이 공장 수준에서 완료되어 -사이트 복잡성이 크게 줄어듭니다.
병렬 Shuffle 토폴로지를 사용하여 중앙 집중식 파이버 분산 프레임에 배포하는 경우 스파인 연결은 왼쪽에 통합되고 리프 연결은 오른쪽에서 라우팅됩니다. 이를 통해 네트워크 계층 간에 명확한 물리적 분리가 이루어집니다. 결정적 라우팅은 단일 1.6T 링크 내에서 8개의 200G 채널 모두가 서로 다른 스위치, 광섬유 및 커넥터에 걸쳐{4}}독립적인 물리적 경로를 따르도록 보장하여-번들 트렁크 링크와 관련된 상관 오류 위험을 효과적으로 제거합니다.
3. 미래-800G 이상을 위한 준비
네트워크 대역폭이 1.6T 및 3.2T(8 × 200G 또는 8 × 400G)로 발전함에 따라 Shuffle 아키텍처의 복원력 가치는 더욱 두드러집니다. Spine 스위치(16 × 200G)에 분산된 3.2T 배포에서는 단일 채널 오류로 인해 대역폭이 6.25%만 감소합니다.
Shuffle 광 인프라가 배포되면 향후 업그레이드에는 물리적 계층을 변경하지 않고 광 모듈 교체만 필요합니다. 기판은 기본적으로 차세대-180μm 초-미세 섬유를 지원하여 미래의 전체{4}}광 기술과의 호환성을 보장합니다. 전력 소비 및 장애 확률과 함께-채널 데이터 속도가 증가함에 따라-이 아키텍처는 안정적인 기반을 제공하여 800G 이상과 관련된 더 높은 위험을 효과적으로 흡수하는 동시에 중단 없는 서비스를 유지합니다.
수동 복잡성에서 결정론적 신뢰성으로
"셔플"의 개념은 무작위성에 관한 것이 아닙니다. 이는 물리적으로 독립적인 Spine 연결 전반에 걸쳐 고속 채널을 결정적으로 배포하는 것입니다.- 기존 작업에서는 수천 개의 광섬유 링크를 수동으로 관리해야 했습니다.-이러한 접근 방식은 비효율적이고 오류가 발생하기 쉽습니다-. 이와 대조적으로 이 아키텍처는 물리적 계층의 연결을 재구성하여 운영 명확성과 시스템 안정성을 모두 향상시킵니다.
8개의 Spine 스위치에 8개의 200G 채널을 고르게 분산함으로써 시스템은 -광 모듈, 광섬유 또는 스위치에서 발생하는 오류가-시스템 중단이 아닌 격리된 이벤트로 유지되도록 보장합니다. 이는 AI-기반 광 네트워크에서 대규모-중단을 근본적으로 방지합니다.
더 얇은 Spine 레이어로 Leaf-Spine 아키텍처를 최적화하든, 구조화된 케이블 연결을 통해 Dragonfly 배포를 단순화하든, 내결함성이 내장된-1.6T/3.2T 향후 확장을 준비하든 Infinity Shuffle OXC는 대규모 데이터 센터를 위한 고{4}}효율성, 높은-신뢰성 및 비용 효율적인{6}}케이블 연결 기반을 제공하여{7}}컴퓨팅 작업 부하가 유지되도록 보장합니다. 광 인프라 제약으로 인해 중단되지 않습니다.

