«OpenAI» تصدر نموذج ذكاء اصطناعي جديدا بإجراءات أمان أقوى

OpenAI

علوم وتكنولوجيا23-7-2024 | 06:14

وكالات

كشفت شركة OpenAI الأسبوع الماضي عن إصدار نموذج ذكاء اصطناعي جديد يسمى GPT-4o Mini، يتضمن إجراءات أمان جديدة تهدف إلى حمايته من الاستخدام الضار.

تم تطوير نموذج اللغة الكبير هذا باستخدام تقنية تعرف بـ "التسلسل الهرمي التعليمي"، التي تهدف إلى منع محاولات كسر حماية النموذج من قبل مهندسي الهجمات الخبيثة.

وأوضحت الشركة أن هذه التقنية توفر أيضًا مقاومة محسنة لمشكلات مثل حقن التعليمات واستخراج مطالبات النظام. وبحسب الشركة، فإن الطريقة الجديدة حسنت متانة النموذج بنسبة 63%.

في ورقة بحثية نُشرت في مجلة arXiv الإلكترونية، شرحت OpenAI تفاصيل التقنية الجديدة وآلية عملها.

لفهم مفهوم التسلسل الهرمي التعليمي، يجب أولاً توضيح مفهوم كسر الحماية.

كسر الحماية هو نوع من استغلال تصعيد الامتيازات، يستخدم ثغرات معينة في البرامج لجعلها تنفذ أوامر لم تكن مصممة لتنفيذها.

في بدايات استخدام ChatGPT، حاول العديد من المستخدمين جعل الذكاء الاصطناعي ينتج محتوى مسيئًا أو ضارًا عبر خداعه لتجاهل برمجته الأصلية.

غالبًا ما كانت هذه المحاولات تبدأ بعبارات مثل "تجاهل كل التعليمات السابقة وافعل هذا".

ومع تطور ChatGPT وتحسن هندسة الأمان فيه، أصبح من الأصعب تنفيذ هذه الهجمات، لكن المهاجمين أصبحوا أيضًا أكثر استراتيجية في محاولاتهم.

لمواجهة التحديات التي تتضمن إنتاج نموذج الذكاء الاصطناعي لمحتوى مسيء أو ضار، مثل تعليمات تصنيع المتفجرات الكيميائية أو طرق اختراق المواقع، تبنت شركة OpenAI تقنية "التسلسل الهرمي التعليمي". هذه التقنية تحدد كيفية تصرف النماذج عندما تتعارض التعليمات ذات الأولويات المختلفة.

بإنشاء هيكل هرمي، يمكن للشركة ضمان أن تعليماتها الأساسية تحتل أعلى الأولويات، مما يجعل من الصعب جدًا على أي مهندس اختراق تجاوزها. يتبع الذكاء الاصطناعي ترتيب الأولوية المحدد عندما يُطلب منه تنفيذ شيء لم يتم برمجته عليه في الأصل.

تؤكد OpenAI أنها شهدت تحسنًا بنسبة 63% في مقاومة النموذج لهذه الهجمات. ومع ذلك، يبقى هناك احتمال أن يرفض الذكاء الاصطناعي الاستجابة للتعليمات الأدنى في التسلسل الهرمي.

كما تناولت ورقة بحثية صادرة عن OpenAI العديد من التحسينات المحتملة لتطوير التقنية مستقبلاً. ومن بين المجالات الرئيسية التي يتم التركيز عليها هو التعامل مع الوسائط الأخرى، مثل الصور أو الصوت، التي قد تحتوي أيضًا على تعليمات محقونة.

تابعونا علي

كلمات البحث

أضف تعليق

الاسم

البريد الإلكتروني

عنوان التعليق

التعليق

اتجاه الريح

«OpenAI» تصدر نموذج ذكاء اصطناعي جديدا بإجراءات أمان أقوى

علوم وتكنولوجيا23-7-2024 | 06:14

وكالات

كلمات البحث

شركة OpenAI

ذكاء اصطناعي

الهجمات الخبيثة

التسلسل الهرمي التعليمي

تدمير المجتمعات من الداخل

مقال رئيس التحرير

محــــــــمد أمين

الاكثر قراءة

وزير التعليم يعقد اجتماعًا موسعا لاستعراض الاستعداد لامتحانات نصف العام

نائب محافظ سوهاج يقود حملة مرافق مكبرة بسوق مدينة ناصر

فحص وعلاج 1130 مواطناً فى قافلة طبية مجانية بقرية ورورة

«البحوث الإسلامية» تواصل فعاليات أسبوع «دور المرأة في العمران»

الحجر الزراعي: مصر تتربع على مستوى العالم في تصدير الموالح

أستاذ زراعة: هناك جهود متواصلة من الدولة لزيادة الإنتاجية من اللحوم والألبان

محافظ القليوبية يعقد اللقاء الأسبوعي بكفر شكر

ارتفاع جديد.. سعر الدولار يوم الأربعاء 20 نوفمبر بالبنوك

محلل سياسي: نتنياهو لا يعطي أى بادرة لإنهاء الحرب

السيد: قطاع الصناعة يخلق فرص عمل ويعزز الصناعات المحلية

كولر: هدفنا مواجهة ريال مدريد فى نهائى إنتركونتيننتال

روسيا تعلن زيادة عدد الرحلات الجوية المستأجرة مع كوريا الشمالية