노르웨이 국립도서관, 2PB 화웨이 플래시로 자국어 LLM 훈련

원제: Norway's 2 petabytes of Huawei flash storage and LLM training

왜 중요한가

주권 AI 구축을 통한 언어적 자립과 자국 문화 보존의 중요성을 보여주는 사례

노르웨이 국립도서관이 노르웨이어를 이해하는 대형언어모델(LLM) 개발에 2PB 용량의 화웨이 OceanStor Dorado 플래시 스토리지를 활용하고 있다고 발표했다. 문화부 지시로 시작된 이 프로젝트는 20PB 규모의 고유 디지털 자료를 기반으로 진행된다.

노르웨이 국립도서관의 IT 플랫폼 책임자 마리우스 후스네스는 화웨이 ID 포럼 2026에서 자국어 LLM 개발 프로젝트를 소개했다. 그는 상업적 LLM 제공업체가 노르웨이어 모델을 개발하지 않고 있어, 영어 중심의 글로벌 LLM으로는 노르웨이 역사와 문화를 충분히 이해할 수 없다고 설명했다. 노르웨이 문화부는 국립도서관에 주권 AI 구축을 지시했으며, 도서관은 국내 최대 규모의 노르웨이어 디지털 컬렉션을 보유하고 있다. 2005년부터 디지털화를 시작해 3-2-1 방식으로 보관된 20PB 고유 데이터, 전체 60PB 규모의 자료를 축적했다. 훈련 시스템은 Nvidia DGX H200, 384코어 CPU 클러스터, 2PB 화웨이 OceanStor Dorado 플래시 어레이로 구성됐다. 데이터는 파이프라인 처리 후 448개 GPU와 64,512개 CPU 코어를 갖춘 국가 슈퍼컴퓨터 Sigma2 Olivia로 전송되어 실제 훈련이 진행된다.

출처

blocksandfiles.com — 원문 읽기 →