नॉर्वे की राष्ट्रीय लाइब्रेरी का 2 PB Huawei स्टोरेज और LLM प्रशिक्षण
मूल शीर्षक: Norway's 2 petabytes of Huawei flash storage and LLM training
यह क्यों महत्वपूर्ण है
स्थानीय भाषा AI मॉडल विकसित करने में बड़े पैमाने के डेटा स्टोरेज की भूमिका दिखाता है।
नॉर्वे की राष्ट्रीय लाइब्रेरी नॉर्वेजियन भाषा को समझने वाला बड़ा भाषा मॉडल विकसित कर रही है। इसमें 2 पेटाबाइट Huawei OceanStor Dorado फ्लैश स्टोरेज का उपयोग AI प्रशिक्षण डेटा पाइपलाइन में किया जा रहा है।
नॉर्वे की राष्ट्रीय लाइब्रेरी के IT प्लेटफॉर्म प्रमुख Marius Husnes ने Huawei के ID Forum 2026 में बताया कि कोई भी वाणिज्यिक LLM प्रदाता नॉर्वेजियन भाषा में स्थानीय LLM विकसित नहीं कर रहा था। उन्होंने कहा कि जिस भी देश की अपनी भाषा है लेकिन उसमें प्रशिक्षित संप्रभु LLM नहीं है, वह नुकसान में है। नॉर्वे की संस्कृति मंत्रालय ने राष्ट्रीय लाइब्रेरी को संप्रभु AI निर्माण का कार्य सौंपा। लाइब्रेरी के पास देश का सबसे बड़ा डिजिटल संग्रह है जिसमें नॉर्वेजियन पुस्तकें, समाचारपत्र और वेब पेज शामिल हैं। 2005 से डिजिटाइजेशन के कारण 20 PB यूनीक डेटा जमा हुआ है, जो 3-2-1 फॉर्म में स्टोर है। डेटा पाइपलाइन में Nvidia DGX H200 सिस्टम, 384 कोर CPU क्लस्टर और कुल 2 PB क्षमता के Huawei OceanStor Dorado ऑल-फ्लैश ऐरे का उपयोग किया गया। वास्तविक प्रशिक्षण के लिए डेटा को नॉर्वे के Sigma2 Olivia सुपरकंप्यूटर में भेजा जाता है।