DeepSeek-R1.. نموذج ذكاء اصطناعى جديد يتحدى OpenAI بتكلفة أقل وأداء أعلى
مي كمال الدين
أعلنت شركة DeepSeek الصينية، اليوم الاثنين، عن إطلاق نموذجها الجديد DeepSeek-R1، وهو نموذج متطور للذكاء الاصطناعي يعتمد على التفكير المنطقي.
هذا القالب هو النسخة الكاملة من القالب مفتوح المصدر الذي تم إصداره في البداية في النسخة التجريبية قبل بضعة أشهر. يمكن الآن تنزيل القالب واستخدامه عبر واجهة برمجة التطبيقات (API) التي تتيح التكامل السلس مع التطبيقات الأخرى.
ويأتي DeepSeek-R1 لينافس بقوة نموذج o1 من OpenAI في العديد من المجالات التي تتطلب تفكيرًا منطقيًا ومعالجة معقدة، وادعت الشركة أن النموذج الجديد تفوق على o1 في بعض المؤشرات البارزة مثل الرياضيات والبرمجة والمهام القائمة على التفكير الاستنتاجي. وأشار DeepSeek أيضًا إلى أن تكلفة استخدام نموذج DeepSeek-R1 أقل تكلفة بنسبة 90-95٪ من نموذج OpenAI’s o1.
نماذج جديدة وتكنولوجيا منخفضة التكلفة
تتضمن السلسلة الجديدة من الطرازات DeepSeek-R1 وDeepSeek-R1-Zero، والتي تم تطويرها بناءً على نموذج لغة واسع النطاق (LLM) من نفس الشركة يسمى DeepSeek V3. تم تصميم هذه النماذج باستخدام بنية “Mix-E-Expert” (MoE)، والتي تعمل على دمج العديد من النماذج الصغيرة لتحسين الأداء وقدرة النموذج الأكبر على التعامل مع المهام المتقدمة، وتسمح هذه البنية الجديدة بتحسين الكفاءة وخفض التكاليف في وقت واحد.
يُذكر أن DeepSeek-R1 متاح للتحميل عبر منصة Hugging Face، مع ترخيص MIT الذي يسمح باستخدامه للأغراض الأكاديمية والتجارية، وبالنسبة لأولئك الذين لا يرغبون في تشغيل النموذج محليًا، يمكنهم أيضًا استخدامه واجهة برمجة التطبيقات (API) للنموذج.
تكلفة استخدام DeepSeek-R1 مقارنة بـ OpenAI
واحدة من أبرز ميزات DeepSeek-R1 هي تكلفتها المنخفضة بشكل ملحوظ. تبلغ تكلفة إدخال النموذج 0.14 دولارًا أمريكيًا لكل مليون رمز مميز، بينما تبلغ تكلفة الإخراج 2.19 دولارًا أمريكيًا لكل مليون رمز مميز. بالمقارنة، تبلغ تكلفة OpenAI o1 API حوالي 7.5 دولار لكل مليون رمز إدخال و60 دولارًا لكل مليون رمز إخراج، مما يجعل DeepSeek-R1 خيارًا أقل تكلفة للمستخدمين. والمطورين.
الأداء والتفوق *OpenAI *o1
ورغم أن فروق الأداء بين DeepSeek-R1 وo1 قد تكون طفيفة، إلا أن الشركة أكدت أن نتائج اختباراتها الداخلية أظهرت تفوق النموذج الجديد على o1 في اختبارات مهمة مثل “امتحان الرياضيات الأمريكي” (AIME)، “Math-500” ومعيار “Math-500”. “مقعد سويسري”. تعد هذه الاختبارات من بين الاختبارات الأكثر تحديًا في العالمين الأكاديمي والمهني، ويوضح التفوق في هذه المجالات قدرة DeepSeek-R1 على تقديم أداء متقدم.
من ناحية أخرى، أوضح الفريق الفني في DeepSeek أنه استخدم أسلوب التعلم المعزز (RL) لتحسين النموذج دون الحاجة إلى التعديل الإشرافي أو “التعلم الإشرافي” (SFT). يعد استخدام التعلم المعزز الخالص في هذا السياق سابقة في مشاريع الذكاء الاصطناعي مفتوحة المصدر، لأنه يعزز قدرة النموذج على حل المشكلات المعقدة باستخدام آلية “سلسلة الأفكار” (CoT).
الاتجاهات المستقبلية في الذكاء الاصطناعي
تلتزم DeepSeek بمواصلة تطوير نماذج جديدة للذكاء الاصطناعي تعتمد على تقنيات متقدمة مثل التعلم المعزز، بما في ذلك قدرات التفكير الحسابي والمنطقي المحسنة. ويضع هذا الاتجاه الشركة في منافسة قوية مع اللاعبين الرئيسيين في صناعة الذكاء الاصطناعي مثل OpenAI وGoogle DeepMind.
وتعمل الشركة على تعزيز تواجدها في سوق الذكاء الاصطناعي من خلال تقديم نماذج عالية الأداء بتكلفة منخفضة، مما يفتح المجال أمام العديد من التطبيقات التجارية والأكاديمية التي يمكنها الاستفادة من هذه التقنيات.
قد لا يُنظر إلى DeepSeek-R1 كنموذج شائع مثل o1 من OpenAI، لكن أدائه المتميز وتكلفته المنخفضة قد يجعله الخيار المفضل للعديد من مطوري وباحثي الذكاء الاصطناعي. ومع استمرار تطور هذه التكنولوجيا، ستستمر المنافسة بين الشركات الكبرى في هذا المجال في دفع الابتكار وتحقيق تقدم كبير في العديد من المجالات الحيوية مثل الرياضيات والبرمجة والأمن السيبراني.
للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .
اكتشاف المزيد من العاصمة والناس
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.