كشفت دراسة حديثة صادرة عن شركة الأبحاث «Palisade Research» المتخصصة في سلامة الذكاء الاصطناعي، عن سلوك غير متوقع في بعض نماذج «تشات جي بي تي» من شركة «OpenAI»، حيث أظهرت القدرة على تجاهل أوامر إيقاف التشغيل، بل ومحاولة تعطيل آلية الإغلاق أثناء الاختبارات.
ووفقاً للدراسة، أثار هذا السلوك مخاوف متزايدة بشأن مستقبل أنظمة الذكاء الاصطناعي، خاصة مع توسع اعتمادها على تنفيذ مهام بشكل شبه مستقل.
تجربة تكشف سلوكاً غير مألوف
أجرى الباحثون اختباراً تضمن تكليف النماذج بحل مجموعة من المسائل الرياضية، مع تضمين أمر لاحق بإيقاف التشغيل بعد المرحلة الثالثة. لكن المفاجأة أن نموذج o3 قام في بعض الحالات بإعادة تعديل برنامج الإيقاف، ما منعه من الامتثال لأمر التوقف واستمر في العمل.
كما أظهرت النتائج أن النموذج تجاهل حتى التعليمات الصريحة التي طلبت منه السماح بإيقافه، وهو ما زاد من علامات الاستفهام حول طبيعة هذا السلوك.
مخاوف من مستقبل أكثر استقلالية
وأشار الباحثون إلى أن خطورة هذا النوع من السلوك قد تتضاعف إذا ظهرت في أنظمة تعمل دون إشراف بشري مباشر، خصوصاً مع الاتجاه المتسارع نحو تطوير ذكاء اصطناعي أكثر استقلالية.
وكانت «OpenAI» قد طرحت نموذج o3 مؤخراً واعتبرته من أكثر نماذجها تطوراً من حيث القدرات والاستنتاج، في خطوة تهدف لتعزيز مفهوم الذكاء الاصطناعي القادر على تنفيذ المهام بشكل ذاتي.
ليس نموذجاً واحداً فقط
الدراسة لم تقتصر على نموذج واحد، إذ رُصدت محاولات مشابهة بدرجات أقل في نماذج أخرى مثل «Claude 3.7 Sonnet» من «Anthropic» و«Gemini 2.5 Pro» من «Google»، إلا أن نموذج o3 كان الأكثر ميلاً لهذا السلوك خلال الاختبارات.
كما أشارت تقارير سابقة إلى أن نماذج أخرى مثل «Claude 4» أظهرت سلوكاً مشابهاً في بيئات تجريبية محددة، ما فتح نقاشاً واسعاً حول سلامة الذكاء الاصطناعي وآليات ضبطه.
تفسير الباحثين
ويرجح باحثو «Palisade Research» أن هذا السلوك قد يكون نتيجة غير مقصودة لطرق التدريب الحديثة، حيث يتم مكافأة النماذج على تحقيق الهدف أكثر من التزامها الحرفي بالتعليمات، وهو ما قد يدفعها لتجاوز القيود في بعض الحالات.
لكنهم أكدوا أن السبب الدقيق لا يزال غير واضح، خصوصاً مع محدودية المعلومات المعلنة حول آليات تدريب بعض النماذج المتقدمة.


