أحدثت شركة الذكاء الاصطناعي الصينية DeepSeek صدمة في كل من وادي السيليكون وول ستريت من خلال إطلاق نموذج ذكاء اصطناعي ينافس أفضل النماذج الأمريكية ولكنه تم تطويره بجزء بسيط من التكلفة. وعلى الرغم من أن هذا الخبر أدى إلى بيع واسع النطاق للأسهم التكنولوجية ودفع المستثمر المخضرم مارك أندريسن إلى وصف النتائج بأنها "لحظة سبوتنيك للذكاء الاصطناعي" – مما يشير إلى أن التقدم الذي أحرزته الصين في الذكاء الاصطناعي كان مفاجأة للكثيرين في عالم التكنولوجيا – إلا أن هذا النموذج مفتوح المصدر ليس ثوريًا كما يبدو.
أداء نموذج DeepSeek R1 كان مماثلًا لنموذج OpenAI o1 في العديد من معايير الرياضيات والبرمجة، ومع ذلك كان تدريبه أرخص بما يتراوح بين 20 إلى 50 مرة، كما أنه استهلك طاقة حسابية أقل بكثير. وكما هو الحال مع سلسلة o من OpenAI، فإن R1 هو نموذج يُعرف باسم "نموذج الاستدلال المبكر"، وفقًا لمايلز بروندج، الباحث في سياسات الذكاء الاصطناعي الذي عمل سابقًا لدى OpenAI. هذه الأنظمة قادرة على التعامل مع مهام أكثر تعقيدًا من النماذج اللغوية الكبيرة الأخرى، لأنها تقوم بتقسيم المشكلات إلى أجزاء ومعالجة كل جزء على حدة. لكن هذا يعني أيضًا أنها تستهلك طاقة حسابية أكبر، مما يجعل تطبيقاتها العملية مكلفة.
قد يساعد وجود طريقة أكثر كفاءة لتحقيق نفس النتائج – أي نموذج R1 – المزيد من المؤسسات، وليس فقط الشركات الأكثر ثراءً، على الاستفادة من خدمات الذكاء الاصطناعي. كما أن كونه مفتوح المصدر ومتاحًا مجانًا قد يجبر المنافسين الأمريكيين على خفض أسعارهم.
أداء نموذج DeepSeek R1 كان مماثلًا لنموذج OpenAI o1 في العديد من معايير الرياضيات والبرمجة، ومع ذلك كان تدريبه أرخص بما يتراوح بين 20 إلى 50 مرة، كما أنه استهلك طاقة حسابية أقل بكثير. وكما هو الحال مع سلسلة o من OpenAI، فإن R1 هو نموذج يُعرف باسم "نموذج الاستدلال المبكر"، وفقًا لمايلز بروندج، الباحث في سياسات الذكاء الاصطناعي الذي عمل سابقًا لدى OpenAI. هذه الأنظمة قادرة على التعامل مع مهام أكثر تعقيدًا من النماذج اللغوية الكبيرة الأخرى، لأنها تقوم بتقسيم المشكلات إلى أجزاء ومعالجة كل جزء على حدة. لكن هذا يعني أيضًا أنها تستهلك طاقة حسابية أكبر، مما يجعل تطبيقاتها العملية مكلفة.
قد يساعد وجود طريقة أكثر كفاءة لتحقيق نفس النتائج – أي نموذج R1 – المزيد من المؤسسات، وليس فقط الشركات الأكثر ثراءً، على الاستفادة من خدمات الذكاء الاصطناعي. كما أن كونه مفتوح المصدر ومتاحًا مجانًا قد يجبر المنافسين الأمريكيين على خفض أسعارهم.
ومع ذلك، لا يزال من غير الواضح تمامًا مدى قدرة R1 على منافسة النماذج الأمريكية الرائدة في الذكاء الاصطناعي. كانت DeepSeek شفافة إلى حد ما في نشر نتائج R1 على اختبارات المعايير المختلفة، لكننا لا نعرف ما إذا كانت الشركات التقنية الأمريكية قد حققت نتائج أكثر إثارة للإعجاب مع أنظمة أخرى رائدة – مثل أحدث نموذج o3 من OpenAI – بينما تبقيها سرية وغير منشورة. علاوة على ذلك، فإن المعايير التي تم اختبارها حتى الآن لا تعكس النطاق الكامل لقدرات نموذج الذكاء الاصطناعي.
وقال بروندج: "الناس يقرؤون في الأمر أكثر مما ينبغي، فهذه مجرد خطوة مبكرة في نموذج جديد وليست نهاية هذا النموذج".
قد تكون هناك أيضًا قيود أخرى لنموذج DeepSeek. فهو يحتوي على بعض التحيزات المضمنة من تدريبه، والتي تهدف إلى الامتثال لقيود الحكومة الصينية، مثل تجنب مناقشة معاملة أقلية الأويغور العرقية والالتزام بالخط الرسمي للحزب الشيوعي الصيني بشأن الوضع السياسي لتايوان.
قد يكون نموذج R1 قادرًا على تقديم نتائج بكفاءة عالية مع استخدام طاقة حسابية أقل مقارنة بالنماذج المماثلة، لكن DeepSeek لا تزال تمتلك قوة حسابية كبيرة ربما ساعدت في تطوير النموذج، كما كتب لينارت هايم من مؤسسة RAND، وهي مركز أبحاث مقره كاليفورنيا، وسيهاو هوانغ من جامعة أكسفورد في منشور على مدونة.
وأشار الباحثان إلى أن DeepSeek لديها إمكانية الوصول إلى أحد أكبر تجمعات شرائح الذكاء الاصطناعي في آسيا، بالإضافة إلى موارد حسابية صينية وأجنبية مخزنة في السحابة – وهي موارد لا تخضع للقيود التي فرضتها الولايات المتحدة للحد من استخدام الرقائق الأمريكية في الصين. وربما ساعدت هذه الموارد DeepSeek في اكتشاف تقنيات نماذج أكثر كفاءة من خلال إنشاء بيانات تدريب اصطناعية أولًا، ثم إتاحة فرص واسعة للتجربة والخطأ.
وعلى الرغم من تلك القيود التي فرضتها الولايات المتحدة على الصادرات، كان لدى الشركة أيضًا إمكانية الوصول إلى جيل حديث من شرائح الذكاء الاصطناعي. وقال هايم وهوانغ إن أحدث القيود على التصدير تم تنفيذها في أكتوبر 2023، لذا لم تؤثر بشكل كامل بعد على جهود تطوير الذكاء الاصطناعي في الصين. وأشارا إلى أن DeepSeek درّبت نماذج الذكاء الاصطناعي الخاصة بها على شرائح NVIDIA H800، التي تم تصميمها للتحايل على قيود التصدير الأمريكية القديمة والأقل فاعلية.
وكتب الباحثان: "الصين لا تزال تدير مراكز بيانات ما قبل القيود، والتي تحتوي على عشرات الآلاف من الشرائح، بينما تقوم الشركات الأمريكية ببناء مراكز بيانات تحتوي على مئات الآلاف منها. الاختبار الحقيقي سيأتي عندما تحتاج هذه المراكز إلى التحديث أو التوسع—وهي عملية ستكون أسهل بالنسبة للشركات الأمريكية ولكنها تمثل تحديًا للشركات الصينية في ظل القيود الأمريكية على التصدير."
إذا لم تكن DeepSeek ستُحدث تحولًا جذريًا في عالم الذكاء الاصطناعي الأمريكي، فلماذا أثارت الذعر في سوق التكنولوجيا الأمريكية وبين المستثمرين؟ السبب ليس في أنها غيرت سباق الذكاء الاصطناعي بشكل نهائي، ولكنها بالتأكيد خفضت التوقعات غير الواقعية في هذا المجال. فقد شهدت السنوات الأخيرة فقاعة من الترويج المبالغ فيه للذكاء الاصطناعي، مما أدى إلى تقييمات مبالغ فيها لشركات التكنولوجيا. وقد يعكس التحول في أسعار الأسهم تقديرات أكثر واقعية للقيمة الاقتصادية للذكاء الاصطناعي.
كانت "لحظة سبوتنيك" الأصلية حدثًا فاجأ الولايات المتحدة عندما تمكن الاتحاد السوفيتي من إطلاق أول قمر صناعي إلى الفضاء، لكن الحقيقة أن الولايات المتحدة كانت على قدم المساواة مع الاتحاد السوفيتي في تكنولوجيا الفضاء وكانت على دراية بتقدمه، لكن الجمهور الأمريكي لم يكن على علم بذلك بسبب سرية الحكومة الأمريكية.
هناك جانب واحد يشبه هذه اللحظة بعصر سبوتنيك: قد يكون هذا موقفًا يتم فيه تضخيم القصة، مما يؤدي إلى رد فعل مبالغ فيه من الجمهور، ويدفع الولايات المتحدة إلى زيادة الإنفاق على الذكاء الاصطناعي.
المصدر: NewScientist