दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल उद्योग दिग्गजों को चुनौती देती है। अपने डीपसेक वी 3 मॉडल के लिए केवल $ 6 मिलियन पूर्व-प्रशिक्षण लागत का दावा करते हुए, एक नज़दीकी नज़र से कहीं अधिक पर्याप्त निवेश का पता चलता है।
छवि: ensigame.com
दीपसेक वी 3 अभिनव प्रौद्योगिकियों का लाभ उठाता है: मल्टी-टोकन भविष्यवाणी (एमटीपी) बढ़ी हुई सटीकता और दक्षता के लिए; विशेषज्ञों का मिश्रण (एमओई) , 256 तंत्रिका नेटवर्क (प्रति टोकन सक्रिय आठ सक्रिय) का उपयोग करना; और मल्टी-हेड लेटेंट ध्यान (एमएलए) बेहतर सूचना निष्कर्षण के लिए। ये प्रगति इसके प्रतिस्पर्धी प्रदर्शन में योगदान करती हैं।
छवि: ensigame.com
हालांकि, सेमियालिसिस ने डीपसेक के लगभग 50,000 एनवीडिया हॉपर जीपीयू के उपयोग को उजागर किया - एक महत्वपूर्ण निवेश जो कि सर्वर में लगभग 1.6 बिलियन डॉलर और परिचालन लागत में $ 944 मिलियन है। यह शुरुआती $ 6 मिलियन के दावे का खंडन करता है, जो केवल पूर्व-प्रशिक्षण GPU खर्चों को दर्शाता है। सच्ची लागत अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को शामिल करती है।
छवि: ensigame.com
डीपसेक की अनूठी संरचना, हाई-फ्लाइर हेज फंड की सहायक कंपनी के रूप में, चपलता और तेजी से नवाचार के लिए अनुमति देती है। इसके डेटा केंद्रों का मालिकाना हक अनुकूलन पर पूर्ण नियंत्रण प्रदान करता है। प्रतिभा में इसका पर्याप्त निवेश, कुछ शोधकर्ताओं ने सालाना $ 1.3 मिलियन से अधिक कमाई के साथ, इसकी प्रतिबद्धता को और अधिक रेखांकित किया।
छवि: ensigame.com
जबकि दीपसेक की "बजट-अनुकूल" कथा यकीनन फुलाया जाता है, इसकी सफलता अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनियों की क्षमता पर प्रकाश डालती है। तकनीकी सफलताओं और एक मजबूत टीम के साथ संयुक्त $ 500 मिलियन से अधिक का कुल निवेश, इसकी सफलता का सही चालक है। CHATGPT4 की $ 100 मिलियन प्रशिक्षण लागत बनाम R1 के लिए DeePseek के $ 5 मिलियन की तरह प्रतियोगियों की लागत के विपरीत, Stark बनी हुई है। अंततः, दीपसेक की कहानी दर्शाती है कि महत्वपूर्ण निवेश महत्वपूर्ण है, कुशल संसाधन प्रबंधन और नवाचार अभी भी प्रतिस्पर्धी परिणाम प्राप्त कर सकता है।