مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

48 خبر
  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان
  • مونديال 2026
  • تبادل الضربات بين إسرائيل وإيران
  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

  • مونديال 2026

    مونديال 2026

  • تبادل الضربات بين إسرائيل وإيران

    تبادل الضربات بين إسرائيل وإيران

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

"الأمن القومي" بالبرلمان الإيراني: سنرد على استهداف الضاحية.. ترقبوا سماء الأراضي المحتلة الليلة

السعودية.. سماع دوي انفجارات وبيان عاجل من منصة الإنذار المبكر في حالات الطوارئ

ترامب يكشف تفاصيل الاتفاق المرتقب مع إيران و"مصير" مجتبى خامنئي

الحرس الثوري يهدد دول المنطقة: اللعبة الخطيرة ستطال كل مواقع الطاقة

بعد الهجوم الإيراني نتنياهو أمام أخطر اختبار: رد قاس أو ثمن سياسي باهظ

موقع إيراني: وقعنا في الفخ

بأوامر من نتنياهو وكاتس.. دمار كبير جراء استهداف الضاحية الجنوبية لبيروت (فيديوهات)

غضب إسرائيلي متصاعد: الليلة إيران أنهت دور إسرائيل في المنطقة وحولتها لـ"ملطشة" الشرق الأوسط

"خاتم الأنبياء" يتوعد إسرائيل: ردنا سيكون مدمرا في حال قصفتم إيران.. سنوجه ضربة ساحقة لتل أبيب

مخاوف إسرائيلية من صفقات عسكرية مصرية تركية قد تغير موازين القوى في المتوسط

نتنياهو يعقد اجتماعا عاجلا لبحث تهديد إيران بضرب إسرائيل الليلة

المنفذ السعودي.. حلول خليجية لإدارة أزمات المضائق في ظل مشكلة هرمز

لبنان لحظة بلحظة.. وقف إطلاق نار شكلي بين "الحزب" وإسرائيل وضحايا بينهم ضباط لبنانيون

الحرس الثوري: العدو الصهيوني استهداف مواقع داخل إيران بصواريخ باليستية جوية

إسرائيل تترقب ردا إيرانيا وشيكا وتستعد لهجوم صاروخي محتمل واسع على تل أبيب خلال ساعات

ضوء أخضر أمريكي.. تناقض في إسرائيل حول "الهدف الثمين" في الضاحية الجنوبية لبيروت (فيديو)

مسؤول أمريكي يكشف تفاصيل مكالمة ترامب مع نتنياهو

تحول استراتيجي إسرائيلي.. البنية التحتية الإيرانية في خطر

الجيش الإسرائيلي يعلن تنفيذ غارات على أهداف عسكرية في غرب ووسط إيران

عراقجي يبحث مع نظرائه في فرنسا وبريطانيا وتركيا وقائد الجيش الباكستاني قصف إيران لإسرائيل