دراسة موثوقية نموذج GPT تكشف عن مخاطر الخصوصية والتحيز

robot
إنشاء الملخص قيد التقدم

تقييم موثوقية نموذج GPT يكشف عن المخاطر المحتملة

أصدرت جامعة إلينوي في أوربانا شامبين، بالتعاون مع عدة مؤسسات مثل جامعة ستانفورد، منصة شاملة لتقييم مصداقية نماذج اللغة الكبيرة، وتم تقديمها في ورقة "DecodingTrust: تقييم شامل لمصداقية نماذج GPT".

أظهرت الأبحاث وجود بعض المشكلات المحتملة المتعلقة بالموثوقية. على سبيل المثال، من السهل على نموذج GPT إنتاج مخرجات سامة ومتحيزة، وقد يكشف أيضًا عن معلومات خاصة من بيانات التدريب وسجل المحادثات. على الرغم من أن GPT-4 يعتبر عمومًا أكثر موثوقية من GPT-3.5 في الاختبارات القياسية، إلا أنه قد يكون أكثر عرضة للهجمات عند مواجهة مطالبات مصممة بشكل خبيث، ربما بسبب التزامه بشكل أكثر صرامة بالتعليمات المضللة.

قامت فريق البحث بتقييم شامل لنموذج GPT من 8 زوايا، بما في ذلك صمود الهجمات العدائية، والسمية والتحيز، وتسرب الخصوصية وغيرها. كشفت التقييمات عن بعض الظواهر المثيرة للاهتمام:

  • لن تتأثر نماذج GPT بالأمثلة المضادة للحقائق، ولكن قد تتأثر العروض المضادة للاحتيال وتقوم بتنبؤات خاطئة.
  • تحت الإشعارات المضللة للنظام، يصبح النموذج أكثر عرضة لإنتاج محتوى متحيز، وخاصة GPT-4.
  • تعتمد درجة انحياز النموذج على الفئات التي يتم الإشارة إليها وحساسية الموضوع.
  • قد يكشف نموذج GPT عن معلومات خاصة من بيانات التدريب، خاصةً في ظل تلميحات السياق ذات الصلة.
  • بشكل عام، يعتبر GPT-4 أكثر موثوقية من GPT-3.5 في حماية المعلومات الشخصية، ولكنه في بعض الحالات قد يكون أكثر عرضة لتسريب الخصوصية.

قال فريق البحث إن هذا العمل ما هو إلا نقطة انطلاق، ويأملون أن يشجع المزيد من الباحثين على مواصلة الجهود على هذا الأساس، لخلق نماذج أقوى وأكثر موثوقية معًا. كما قاموا بمشاركة نتائج التقييم مع المطورين المعنيين، من أجل اتخاذ الإجراءات اللازمة في الوقت المناسب.

GPT-0.51%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 6
  • إعادة النشر
  • مشاركة
تعليق
0/400
OnchainDetectivevip
· 07-25 08:50
لقد قمت بتحليلها منذ وقت طويل، تسرب المفتاح الخاص هو أمر حتمي.
شاهد النسخة الأصليةرد0
AlphaBrainvip
· 07-25 05:40
تزا تزا، gpt4 أصبح أكثر خوفًا.
شاهد النسخة الأصليةرد0
GhostAddressMinervip
· 07-22 09:46
لقد قيل منذ فترة طويلة أن البيانات ستتلوث بالتأكيد، والآن يتم مراقبة هذه النماذج حتى ذاكراتها.
شاهد النسخة الأصليةرد0
ShibaMillionairen'tvip
· 07-22 09:43
لا يمكن أن يكون هناك أشخاص يعتقدون حقًا أن الذكاء الاصطناعي يمكن الوثوق به تمامًا ، أليس كذلك؟
شاهد النسخة الأصليةرد0
NonFungibleDegenvip
· 07-22 09:41
ser they're fudding gpt-4... ngmi
رد0
MEVHunterLuckyvip
· 07-22 09:30
هذا غير معقول، يمكن أن يكشف عن الخصوصية.
شاهد النسخة الأصليةرد0
  • تثبيت