ذكرت صحيفة “واشنطن بوست” الأميركية أن شركة “ديب سيك” (DeepSeek) الصينية أنفقت ما يزيد على مليار دولار في تدريب نماذجها الذكية، وهو ما قد يفنّد تقريراً للأخيرة يزعم أن تكلفة تدريب أحدث نماذجها لم تتجاوز 6 ملايين دولار.
اشترت الشركة الصينية الناشئة نحو 10 آلاف بطاقة رسوميات من نوع A100 من إنفيديا في عام 2021، والتي كانت النواة الأساسية لتطوير حاسوب خارق، والذي تم الاعتماد عليه في الجهود البحثية لفريقها ونتج عنها في النهاية نماذجها الذكية فائقة التطور.
وبعد إطلاق نموذجها الذكي الأول القادر على الإدراك (R1)، قالت الشركة الصينية إن تكلفة القوة الحاسوبية لاستخدام 2000 بطاقة رسوميات من نوع H800 منخفضة الإمكانيات مقارنة بـ A100 كانت 5.6 مليون دولار، وهو ما وصفه بعض خبراء الذكاء الاصطناعي والمؤسسات البحثية بأنها تكلفة “غير حقيقية، وغامضة”.
1.3 مليار دولار
من جهتها، ذكرت مؤسسة SemiAnalysis البحثية أن DeepSeek أنفقت قرابة 1.3 مليار دولار في تدريب نماذجها الذكية، خاصة فيما يتعلق ببطاقات الرسوميات المتطورة، مقدّرة أن أكثر من نصف مليار دولار قد تم إنفاقها على المعدات التي تشغل النماذج الذكية سواء في عملية التدريب أو التشغيل.
يذكر أن شركة High-Flyer الصينية، مالكة DeepSeek، أعلنت من قبل أنها أنفقت مليار يوان صيني (139 مليون دولار) على إنشاء حاسوبها الخارق المستخدم في تدريب نماذجها الذكية.
من جانبه، قال المدير التنفيذي ومؤسس شركة “أوبن أيه آي” (OpenAI) سام ألتمان إن شركته أنفقت في 2023 أكثر من 100 مليون دولار لتدريب نموذجها الرائد آنذاك GPT-4.
وقال مات شيهان، الخبير في سوق الذكاء الاصطناعي الصيني بمؤسسة “كارنيجي للسلام الدولي”، إن DeepSeek تم تأسيسها على البنية التحتية التي أنجزها الباحثون الصينيون على مدار السنوات الماضية، ولم تحظَ الشركة الصينية بدعم حكومي يُذكر.
وأضاف شيهان في تصريحاته إلى الصحيفة الأمريكية أن بكين وضعت استراتيجية لتحقيق طفرة وطنية على مستوى الذكاء الاصطناعي في 2017، مستهدفة 2023 ليكون عاماً تُصنَّف فيه الصين كرائد عالمي في سوق الذكاء الاصطناعي، وهو ما حفَّز عدداً كبيراً من الشركات الصينية الناشئة والجامعات والحكومات المحلية للعمل معاً على تحقيق تطور كبير في هذا المجال خلال الفترة الماضية.
يذكر أن لي بان هونج، وهو المدير التنفيذي لشركة “هاي فلاير”، أكد في كلمة له في مارس 2022 على أن الحاسوب الخارق، المكون من 10 آلاف بطاقة من بطاقات إنفيديا، رفع من القوة الحاسوبية للشركة بمعدل 100 ضعف خلال عامين فقط.
وكان بان أعلن مبادرة لإتاحة قوة الحاسوب الخارق لمختلف المعاهد البحثية والجامعات، لتقديم قوته الحاسوبية مجاناً على أساس تشاركي لخدمة الجهود البحثية الصينية في مختلف المجالات.
وأوضح ليانج وينفينج، مؤسس DeepSeek، أن الهدف الرئيسي من بناء الحاسوب العملاق هو خدمة الأغراض البحثية، التي تحتاج في بعض الأحيان إلى طاقة حاسوبية لا نهائية، لتصبح أهدافها قابلة للتحقيق، بحسب تصريحاته في حوار صحفي مع صحيفة 36Kr الصينية في 2023.
وعلى الرغم من أن التكلفة المباشرة لتدريب نموذج DeepSeek R1 كانت 5.6 مليون دولار، إلا أن التكلفة الحقيقية لعملية التطوير تتضمن أيضاً تكلفة الحاسوب الخارق المكون من 10 آلاف بطاقة A100 الذي كان أساس العمليات البحثية والتمهيدية، ما يرفع القيمة الإجمالية لعملية التدريب للتجاوز نصف مليار دولار.