بدأت شركة أبحاث الذكاء الاصطناعي (أوبن أي آي) OpenAI تطوير أداة جديدة تشرح سلوكيات نماذج اللغة الكبيرة التي يقوم عليها روبوت الدردشة الذائع الصيت (شات جي بي تي) ChatGPT.
وغالبًا ما يُقال إن نماذج اللغات الكبيرة تمثل صندوقًا أسود يُخفي الكثير من الأسرار، إذ يصعب حتى على علماء البيانات معرفة السبب وراء اختيار النموذج الاستجابة بطريقة معينة.
وفي محاولة لتفسير آلية عمل نماذج اللغة الكبيرة، تعمل (أوبن أي آي) OpenAI على تطوير أداة لتحديد أجزاء نموذج اللغة الكبير المسؤولة تلقائيًا عن سلوك بعينه.
ويؤكد المهندسون الذين يعملون على الأداة أنها لا تزال في مراحلها المبكرة، ولكن الشفرة التي تُشغِّلها متاحة الآن بصورة مفتوحة المصدر في منصة (جيت هب) GitHub.
وقال (ويليام سوندرز)، مدير فريق التفسير في (أوبن أي آي)، لموقع (تك كرنش) TechCrunchفي مقابلة عبر الهاتف: «نحاول تطوير طرق لتوقّع ما ستكون عليه مشكلات نظام الذكاء الاصطناعي. ونريد حقًا أن نصل إلى الاعتقاد بإمكانية الوثوق بما يفعله النموذج وبالإجابة التي ينتجها».
وتحقيقًا لهذه الغاية، تستخدم أداة (أوبن أي آي) نموذجًا آخر للغة لمعرفة وظائف المكونات الخاصة بنماذج اللغة الأخرى الأبسط من الناحية المعمارية، وهي تستخدم على وجه التحديد نموذج (جي بي تي-2) GPT-2.
يُذكر أنه يمكن تشبيه نماذج اللغة الكبيرة بالدماغ، فهي مكونة من «الخلايا العصبية»، التي تلاحظ نمطًا معينًا في النص يؤثر فيما «سيقوله» النموذج بعد ذلك.
وتستغل أداة (أوبن أي آي) OpenAI هذا التكوين لتقسيم النماذج إلى قطع فردية. فتُشغِّل الأداة أولًا تسلسلات نصية من خلال النموذج الذي يُقيَّم، وتنتظر الحالات التي «تُنشَّط» فيها خلية عصبية معينة بصورة متكررة.
وبعد ذلك «تُظهر» الأداة لـ (جي بي تي-4)، وهو نموذج اللغة الكبير الأحدث من (أوبن أي آي) OpenAI، هذه الخلايا العصبية النشطة للغاية، وتجعل النموذج يولد تفسيرًا لذلك.
ولتحديد مدى دقة التفسير، توفر الأداة لنموذج (جي بي تي-4) تسلسلات نصية، وتتنبأ أو تحاكي كيف ستتصرف الخلايا العصبية، ثم تقارن سلوك الخلية العصبية التي حُوكِيَت بسلوك الخلية العصبية الفعلية.
وقال (جيف وو)، الذي يعمل أيضًا على الأداة: «باستخدام هذه المنهجية، يمكننا أساسًا التوصل إلى نوع من التفسير الطبيعي الأولي لما تفعله كل خلية عصبية فريدة، وكذلك الحصول على درجة لمدى توافق هذا التفسير مع السلوك الفعلي».
وأضاف: «نحن نستخدم (جي بي تي-4) كجزء من العملية لإنتاج تفسيرات لما تبحث عنه الخلية العصبية، ومن ثم تحديد مدى تطابق هذه التفسيرات مع حقيقة ما تفعله».
وتمكّن الباحثون من إنشاء تفسيرات لخلايا نموذج (جي بي تي-2) العصبية جميعها البالغ عددها 307,200 خلية، التي جمعوها في مجموعة للبيانات أُصدرت إلى جانب الشفرة الخاصة بالأداة.
ويقول الباحثون إنه يمكن استخدام أدوات مثل هذه يومًا ما لتحسين أداء نماذج اللغة الكبيرة لتقليل التحيز أو السلبيات الأخرى. لكنهم يُقرون بأن أمام الأداة طريق طويلة قبل أن تكون مفيدة حقًا.
وبحسب الباحثين، فقد كانت الأداة واثقة بتفسيراتها لزهاء 1,000 من تلك الخلايا العصبية، وهو جزء صغير من العدد الكلي للخلايا.
ومع ذلك، قال (وو): «تسجل معظم التفسيرات نتائج سيئة جدًا أو لا تفسر الكثير من سلوك الخلايا العصبية الفعلية».
وأضاف: «ينشط الكثير من الخلايا العصبية، على سبيل المثال، بطريقة يصعب فيها للغاية معرفة ما يحدث، مثل أنها تنشط في خمسة أو ستة أشياء مختلفة، ولكن لا يوجد نمط يمكن تمييزه في تلك الأشياء. وفي بعض الأحيان يوجد نمط يمكن تمييزه، لكن (جي بي تي-4) غير قادر على العثور عليه».