PR CENTER

PR센터

홈>PR센터>보도자료

보도자료

게시물 상세
[GIGABYTE] Solidigm SSD와 GIGABYTE 서버를 활용한 AI 학습 최적화
작성자 : 관리자(khkim@goak.co.kr)  작성일 : 2025.04.11   조회수 : 591
첨부파일 2025-04-11-g1.JPG
Solidigm 
 
Solidigm과 GIGABYTE가 최첨단 스토리지 및 시스템 통합을 통해 AI 학습 성능을 어떻게 재정의하는지 알아보세요. 지금 바로 AI 인프라를 업그레이드하여 새로운 차원의 효율성과 확장성을 경험하세요.
 
 
고객 과제
AI 애플리케이션이 점점 더 복잡해짐에 따라, 기업들은 GPU 활용도를 극대화하고 AI 학습 클러스터의 효율적인 데이터 처리량을 유지하는 데 있어 점점 더 많은 어려움에 직면하고 있습니다. 스토리지 시스템은 고성능 GPU에 맞춰 학습 데이터를 신속하게 제공하는 데 중요한 역할을 하지만, 네트워킹, 메모리 계층 구조, 데이터 전처리 파이프라인을 포함한 전반적인 시스템 아키텍처 또한 학습 효율성에 상당한 영향을 미칩니다. 이러한 과제를 전체적으로 해결하는 것은 병목 현상을 최소화하고, 하드웨어 활용도를 최적화하며, 운영 비용을 절감하는 데 필수적입니다.

AI 성능 확장을 목표로 하는 기업의 경우, 파트너십은 하드웨어 투자를 최대한 활용하고 학습 성능을 극대화하는 과제를 극복하는 데 도움이 됩니다. GIGABYTE의 집중적인 옵션과 Solidigm SSD를 통해 고객은 AI 학습 목표 달성을 위한 새롭고 향상된 방법을 찾을 수 있습니다.

기가바이트 서버 솔루션
GIGABYTE는 Solidigm과 협력하여 고성능 Solidigm D7-PS1010과 대용량 D5-P5336을 통합하여 이러한 과제를 해결했습니다. SSD를 활용하여 GPU 활용도와 전반적인 학습 효율성이 크게 향상되었습니다.

GIGABYTE와 Solidigm은 AI 워크로드의 스토리지 성능 평가를 위한 업계 선도적인 표준인 MLPerf Storage v1.0 벤치마크를 사용하여 Unet3D, ResNet50, CosmoFlow를 포함한 다양한 AI 모델에서 솔루션을 테스트했습니다. 특히 Solidigm D7-PS1010 PCIe 5.0 SSD는 타사 PCIe 5.0 SSD와, Solidigm D5-P5336 PCIe 4.0 SSD는 타사 PCIe 4.0 SSD와 비교했습니다.
 
 
활용된 벤치마크
MLPerf는 스토리지 시스템이 AI/ML 파이프라인 학습 데이터를 GPU에 얼마나 효율적으로 공급할 수 있는지 평가하도록 설계된 표준화된 벤치마크입니다. 학계, 업계 리더, AI 연구자들이 참여하는 협력 기관인 MLCommons에서 개발 및 관리하고 있습니다.

ML Perf 제품군 내에서 MLPerf 스토리지 벤치마크를 활용했습니다. 이 벤치마크는 스토리지 솔루션이 ML 모델 학습 중에 GPU와 같은 가속기를 효율적으로 활용할 수 있도록 데이터를 얼마나 효과적으로 공급할 수 있는지 측정하도록 설계되었습니다. 이 벤치마크는 최신 가속기 시뮬레이션을 포함하며, 다음 세 가지 주요 워크로드에 중점을 둡니다.
  • Unet3D : 체적 분할을 위해 설계된 모델로, 일반적으로 의료 영상에서 3D 스캔 내의 구조를 구분하는 데 사용됩니다.
  • ResNet50 : 50개의 레이어로 구성된 심층 잔여 네트워크로, 이미지 분류 작업에 널리 사용됩니다.
  • CosmoFlow : 우주론적 데이터에 적용된 3D 합성 신경망으로, 시뮬레이션 데이터로부터 우주의 물리적 매개변수를 예측하는 것을 목표로 합니다.

이러한 워크로드는 다양한 데이터 크기와 액세스 패턴을 포괄하여 다양한 ML 애플리케이션의 스토리지 성능을 평가하기 위한 강력한 프레임워크를 제공합니다. 가속기의 "생각 시간"을 시뮬레이션함으로써, 이 벤치마크는 실제 GPU 없이도 스토리지 수요를 정확하게 모델링할 수 있으므로 다양한 스토리지 솔루션을 평가하는 데 유용합니다.
AI 모델 용법 AU(가속기 활용)
유넷3D 의료 - 이미지 분할 > 90%
레스넷50 비전 - 이미지 분류 > 90%
코스모플로우 과학 - 우주론 매개변수 예측 > 70%
 

성능 및 효율성 향상
향상된 GPU 활용률
AI 모델 전반에 걸쳐 Solidigm SSD가 도입되면서 AI 학습 중 지원되는 GPU 수가 크게 증가했습니다. 예를 들어 ResNet50 예에서 Solidigm D7-PS1010은 92.68%의 가속기 활용률(AU)을 나타냈고 NVIDIA H100 시스템에서 70개의 GPU를 지원했지만 다른 브랜드는 90.33%의 AU만 나타냈고 58개의 GPU를 지원했습니다. Solidigm SSD는 값비싼 GPU 리소스가 최대한 활용되도록 하여 유휴 시간을 줄이고 모델 학습을 가속화합니다.

뛰어난 처리량 및 읽기 성능
GIGABYTE 시스템과 Solidigm SSD의 조합은 뛰어난 처리량과 읽기 속도를 제공했습니다. 예를 들어 Solidigm D7-PS1010은 NVIDIA H100 GPU가 있는 ResNet50에서 115,805개 샘플/초 및 12,663MB/s의 처리량을 달성하여 70개 GPU의 성능을 시뮬레이션했습니다. 이는 다른 브랜드의 드라이브보다 거의 24% 더 높은 성능을 보였습니다. 이러한 결과는 더 빠른 데이터 처리 모델 학습으로 이어집니다.
레스넷50
여러 AI 모델에서 효율성 향상
의료 영상용 Unet3D나 우주론 시뮬레이션용 Cosmoflow를 학습할 때 Solidigm SSD는 경쟁 솔루션보다 지속적으로 우수한 성능을 보였습니다. 예를 들어 Solidigm D5-P5336 SSD는 ResNet50 워크로드에서 다른 브랜드 드라이브보다 처리량이 22% 향상되었습니다.
유넷3D
코스모플로우
Gen5 SSD로 미래 지향적 설계
Solidigm D5-P5336 PCIe 4.0 SSD를 다른 브랜드의 PCIe 4.0 SSD와 비교한 현재 결과는 네트워크 연결 스토리지에서 용량 중심 솔루션에 인상적입니다. 이는 Solidigm이 AI에 대한 심층적인 지식을 지속적으로 사용하여 제품을 최적화하고, 성장하는 제품군 내에서 포트폴리오 전반에 걸쳐 솔루션의 가치를 실현하고 있음을 보여줍니다. 최근 출시된 Solidigm D7-PS1010 PCIe 5.0 SSD 제품군은 필요할 때 대기 시간을 줄이고 직접 연결 스토리지 요구 사항에서 데이터 흐름을 개선하여 훨씬 더 효율적인 AI 교육 클러스터를 위한 토대를 마련합니다.

실제 영향
이 협업의 결과로 이제 AI 중심 참여를 위해 Solidigm SSD로 선두를 달릴 수 있습니다. 입증된 성능 향상은 이미 BeeGFS, Mangoboost, NCHC와 같은 선도적인 기관의 관심을 끌었습니다.
 
 
추가 정보
이 협업에 대한 자세한 내용과 Solidigm과 Giga Computing이 어떻게 AI 인프라를 강화할 수 있는지 알아보려면 다음을 방문하세요.
Solidigm:  solidigm.com
Giga Computing:  gigacomputing.com
MLPerf 벤치마크 세부 정보:  mlcommons.org
 
 
Solidigm 소개
Solidigm은 혁신적인 NAND 플래시 메모리 솔루션을 제공하는 세계적인 선도 기업입니다. Solidigm의 기술은 고객의 무한한 데이터 잠재력을 활용하여 인류 발전에 기여할 수 있도록 지원합니다. 인텔의 NAND 및 SSD 사업부 매각을 계기로 설립된 Solidigm은 2021년 12월 반도체 업계 선두주자인 SK하이닉스의 미국 독립 자회사가 되었습니다. 캘리포니아주 랜초 코르도바에 본사를 둔 Solidigm은 전 세계 13개 지역에 있는 직원들의 창의력을 바탕으로 운영됩니다. 더 자세한 정보는 solidigm.com을 방문하시거나 트위터와 링크드인을 팔로우해 주세요. "Solidigm"은 SK하이닉스 NAND Product Solutions Corp.(상호명 Solidigm)의 상표입니다.
 
 
충수
MLPerf 스토리지 벤치마크 필수 지표를 다음과 같이 측정합니다.
처리량(MB/s): 스토리지에서 데이터 세트를 로드하는 속도입니다.
데이터 세트 크기(GB): 사용된 데이터 세트의 총 크기입니다.
가속기 사용률(%): 가속기 사용률(AU)은 시뮬레이션된 가속기가 소요한 시간을 전체 벤치마크 실행 시간 대비 백분율로 나타낸 것입니다. 높을수록 좋습니다.
AU(백분율) = (총 계산 시간/총 벤치마크 실행 시간) * 100.
다른 브랜드 결과에 사용된 서버 시스템 및 튜닝은 Solidigm + Giga Computing 설정과 다릅니다. 다른 브랜드 결과는 다음 링크에서 확인할 수 있습니다.  Micron의 NVMe SSD를 사용한 AI 시스템 최적화
섬기는 사람 기가바이트 R163-Z35
CPU AMD EPYC™ 9555P - 64코어 x1
메모리 M321R8GA0BB0-CQKMG - 삼성 - 64GB DDR5 x 12
OS 디스크 인텔 1.6TB x 2, U.2
테스트 대상 SSD 1 솔리다임 D5-P5336
테스트 대상 SSD 2 솔리디그 D7-PS1010
이전글 [GIGABYTE] DCIM x AIOps: AI 소프트웨어를 재편하는 차세대 빅 트렌드
다음글 [GIGABYTE] GIGABYTE 심층 분석: 업계를 선도하는 액체 냉각 솔루션을 구축한 방법