AI मॉडल और API Jun 14 github.com

रियो का AI मॉडल दूसरे मॉडल का मिश्रण निकला

मूल शीर्षक: Rio de Janeiro's "homegrown" LLM appears to be a merge of an existing model

यह क्यों महत्वपूर्ण है

AI मॉडल विकास में पारदर्शिता और मौलिकता के मुद्दों को उजागर करता है।

ब्राजील के रियो डी जनेरियो की सरकार द्वारा विकसित बताया गया Rio-3.5-Open-397B मॉडल वास्तव में Nex-AGI के Nex-N2_pro और Qwen मॉडल का 0.6:0.4 अनुपात में मिश्रण है, स्वतंत्र प्रशिक्षण का कोई प्रमाण नहीं मिला।

GitHub पर Nex-AGI द्वारा उठाए गए मुद्दे के अनुसार, रियो डी जनेरियो की नगर सरकार के IplanRIO द्वारा विकसित बताया गया 397 अरब पैरामीटर का Rio-3.5-Open-397B मॉडल मूल नहीं है। दो स्वतंत्र तरीकों से साबित किया गया कि यह Nex-N2_pro और Qwen3.5-397B-A17B का प्रत्यक्ष element-wise मिश्रण है। पहले, जब Rio के हार्ड-कोडेड 'You are Rio' सिस्टम प्रॉम्प्ट को हटाया गया तो मॉडल ने 79% समय खुद को 'Nex, from Nex-AGI' बताया और 0% समय 'Rio' कहा। यह Nex-AGI की कंपनी की पूरी कहानी भी शब्दश: दोहराता है। दूसरे, सभी 60 layers और नेटवर्क के हर component में weight tensor हजारों standard deviations तक Nex और Qwen का वही 0.6/0.4 मिश्रण दिखाता है। Nex-AGI का दावा है कि अन्य finetunes को interpolation के रूप में नहीं समझाया जा सकता।

स्रोत

github.com — मूल लेख पढ़ें →

रियो का AI मॉडल दूसरे मॉडल का मिश्रण निकला

यह क्यों महत्वपूर्ण है

स्रोत

संबंधित लेख

सुनने के लिए लॉगिन करें