Kimi ने AI मॉडल सत्यापन टूल जारी किया
मूल शीर्षक: Kimi vendor verifier – verify accuracy of inference providers
यह क्यों महत्वपूर्ण है
ओपन-सोर्स AI मॉडल ecosystem में quality control और trust बढ़ाने के लिए महत्वपूर्ण पहल है।
Kimi ने K2.6 मॉडल के साथ Vendor Verifier (KVV) टूल ओपन-सोर्स किया है। यह AI इंफ्रेंस प्रोवाइडर्स की सटीकता सत्यापित करता है और छह महत्वपूर्ण बेंचमार्क के माध्यम से मॉडल implementation की गुणवत्ता जांचता है।
Kimi ने अपने K2.6 मॉडल रिलीज़ के साथ Kimi Vendor Verifier (KVV) प्रोजेक्ट को ओपन-सोर्स किया है। यह टूल ओपन-सोर्स मॉडल उपयोगकर्ताओं को अपने inference implementations की सटीकता सत्यापित करने में मदद करता है। कंपनी ने यह टूल K2 Thinking मॉडल की रिलीज़ के बाद कम्युनिटी से मिली feedback के आधार पर बनाया, जहां बेंचमार्क स्कोर में विसंगतियों की शिकायतें आ रही थीं। KVV छह महत्वपूर्ण बेंचमार्क का उपयोग करता है: Pre-Verification (API पैरामीटर सत्यापन), OCRBench (multimodal पाइपलाइन टेस्ट), MMMU Pro (विजुअल इनपुट preprocessing), AIME2025 (लॉन्ग-आउटपुट स्ट्रेस टेस्ट), K2VV ToolCall (JSON schema सटीकता), और SWE-Bench (कोडिंग टेस्ट)। टेस्टिंग के लिए दो NVIDIA H20 8-GPU सर्वर पर sequential execution में लगभग 15 घंटे का समय लगता है। Kimi का लक्ष्य infrastructure providers को deployment से पहले अपने stacks को validate करने में मदद करना है।