الذكاء الاصطناعي والمنطق: إلى أي مدى وصل نموذج o3 الجديد من OpenAI؟
مي كمال الدين
كشفت OpenAI عن سلسلة o3 من نماذج الذكاء الاصطناعي التي تركز على “المنطق” الشهر الماضي، وخلال البث المباشر، شاركت الشركة النتائج القياسية للنموذج بناءً على الاختبارات الداخلية. في حين أن جميع النتائج التي تمت مشاركتها كانت مثيرة للإعجاب، وسلطت الضوء على القدرات المحسنة لخليفة o1، إلا أن النتيجة برزت. معيار واحد.
في اختبار ARC-AGI، سجل نموذج اللغة الكبير (LLM) 85%، متجاوزًا أفضل نتيجة سابقة بهامش 30%، ومن المثير للاهتمام أن هذه النتيجة كانت أيضًا على قدم المساواة مع ما سجله الإنسان العادي في الاختبار.
ومع ذلك، لمجرد حصول o3 على هذه الدرجة العالية في الاختبار، هل يعني هذا أن ذكائه يساوي ذكاء الإنسان العادي؟ سيكون من الأسهل الإجابة على هذا السؤال إذا تم إصدار نموذج الذكاء الاصطناعي في المجال العام وتمكنا من اختباره، وبما أن OpenAI لم تكشف عن أي شيء حول بنية النموذج أو تقنيات التدريب أو مجموعات البيانات، فمن الصعب المطالبة بأي شيء بشكل قاطع.
هناك أشياء معينة نعرفها عن نماذج الذكاء الاصطناعي التي تركز على المنطق والتي يمكن أن تساعدنا على فهم ما يمكن توقعه من برنامج LLM القادم من OpenAI. أولاً، حتى الآن، لا تحتوي نماذج السلسلة o على إصلاح كبير في بنيتها أو إطارها ولكن تم تعديلها. بدقة لعرض القدرات المحسنة.
على سبيل المثال، استخدم المطورون تقنية مع سلسلة o1 من نماذج الذكاء الاصطناعي تسمى حوسبة وقت الاختبار. ومن خلال القيام بذلك، تم منح نماذج الذكاء الاصطناعي وقتًا إضافيًا للمعالجة لقضائه على سؤال ومساحة عمل لاختبار النظريات وتصحيح أي أخطاء. وبالمثل، كان نموذج GPT-4o مجرد نسخة معدلة بدقة من GPT-4.
من غير المرجح أن تقوم الشركة بإجراء تغييرات كبيرة على البنية مع نموذج o3، حيث يشاع أيضًا أنها تعمل على نموذج GPT-5 AI، والذي يمكن إطلاقه في وقت لاحق من هذا العام.
بالنسبة لمعيار ARC-AGI (مجموعة الاستدلال المجرد – الذكاء العام الاصطناعي)، فإنه يتميز بسلسلة من أسئلة التعرف على الأنماط القائمة على الشبكة والتي تتطلب قدرات التفكير والفهم المكاني لحلها. ويمكن القيام بذلك باستخدام مجموعة كبيرة من البيانات عالية الجودة التي تركز على المنطق والتفكير القائم على القدرات.
ومع ذلك، لو كان الأمر بهذه البساطة، لكانت نماذج الذكاء الاصطناعي القديمة قد سجلت درجات عالية في الاختبار أيضًا. والجدير بالذكر أن أعلى درجة سابقة كانت 55 بالمائة مقارنة بنتيجة O3 البالغة 85 بالمائة. وهذا يسلط الضوء على أن المطورين أضافوا تقنيات وخوارزميات تحسين جديدة لتعزيز القدرات المنطقية للنموذج. لا يمكن تحديد المدى الكامل لهذا ما لم تكشف OpenAI رسميًا عن التفاصيل الفنية.
ومع ذلك، فمن غير المرجح أن يصل نموذج o3 AI إلى مستوى الذكاء العام أو الذكاء البشري. أولاً، إذا كان الأمر كذلك، فسيمثل ذلك نهاية شراكة الشركة مع مايكروسوفت، والتي من المقرر أن تنتهي بمجرد وصول نماذج OpenAI إلى مستوى الذكاء العام. ثانيا، أكد العديد من خبراء الذكاء الاصطناعي، بما في ذلك جيفري هينتون، الأب الروحي للذكاء الاصطناعي، مرارا وتكرارا أننا لا نزال بعيدين عن تحقيق الذكاء العام.
أخيرًا، يعد الذكاء العام إنجازًا كبيرًا لدرجة أنه إذا وصل OpenAI إلى هذا الإنجاز، فسوف يخبر الناس عنه علنًا بدلاً من مشاركة تلميحات خفية حوله. الأمر الأرجح هنا هو أن نموذج o3 AI وجد طريقة لتحسين قدرات الاستدلال المستندة إلى الأنماط للنموذج (إما عن طريق إضافة بيانات عينات كافية أو عن طريق تعديل أساليب التدريب)، كما هو موضح أيضًا في تقرير PTI.
للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .
اكتشاف المزيد من العاصمة والناس
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.