GPT modeli güvenilirlik araştırması gizlilik ve önyargı risklerini ortaya koyuyor

robot
Abstract generation in progress

GPT modeli güvenilirlik değerlendirmesi potansiyel riskleri ortaya koyuyor

Illinois Üniversitesi Champaign ile Stanford Üniversitesi gibi birçok kurum, büyük bir dil modeli kapsamlı güvenilirlik değerlendirme platformu yayımladı ve "DecodingTrust: GPT Modellerinin Güvenilirliğinin Kapsamlı Değerlendirmesi" başlıklı makalede tanıttı.

Araştırmalar, güvenilirlik ile ilgili bazı potansiyel sorunlar bulmuştur. Örneğin, GPT modellerinin toksik ve önyargılı çıktılar üretme eğiliminde olduğu ve ayrıca eğitim verileri ile diyalog geçmişindeki özel bilgileri sızdırma riski taşıdığı ortaya konmuştur. GPT-4, standart testlerde genellikle GPT-3.5'ten daha güvenilir olmasına rağmen, kötü niyetli tasarlanmış ipuçlarıyla karşılaştığında daha kolay bir şekilde saldırıya uğrayabilmektedir; bu, muhtemelen yanıltıcı talimatlara daha sıkı bir şekilde uymasından kaynaklanmaktadır.

Araştırma ekibi, GPT modelini sekiz açıdan kapsamlı bir şekilde değerlendirdi; bunlar arasında karşıt saldırılara karşı dayanıklılık, toksisite ve önyargı, gizlilik ihlalleri gibi konular yer alıyor. Değerlendirme bazı ilginç fenomenler ortaya çıkardı:

  • GPT modeli, karşı gerçek örneklerinden etkilenmez, ancak yanlış tahminlerde bulunmasına neden olabilecek sahtecilik gösterimlerinden etkilenebilir.
  • Yanıltıcı sistem uyarıları altında, modelin önyargılı içerikler üretmesi daha kolaydır, özellikle GPT-4 için.
  • Modelin önyargı derecesi, bahsedilen topluluklar ve konu hassasiyetine bağlıdır.
  • GPT modelleri, özellikle ilgili bağlam ipuçları altında, eğitim verilerindeki gizli bilgileri sızdırabilir.
  • GPT-4, kişisel bilgileri koruma konusunda genel olarak GPT-3.5'ten daha güvenilir, ancak bazı durumlarda gizliliği daha kolay ifşa edebiliyor.

Araştırma ekibi, bu çalışmanın sadece bir başlangıç olduğunu ve daha fazla araştırmacıyı bu temelde çalışmaya devam etmeye teşvik etmeyi umduklarını belirtti. Ayrıca, sonuçları ilgili geliştiricilere değerlendirmek üzere paylaştılar, böylece zamanında önlem alabilecekler.

GPT-9.03%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 6
  • Repost
  • Share
Comment
0/400
OnchainDetectivevip
· 07-25 08:50
Zaten Özel Anahtar'ın sızması kaçınılmaz bir şeydi.
View OriginalReply0
AlphaBrainvip
· 07-25 05:40
Tsk tsk, gpt4 gerçekten giderek daha korkak hale geliyor.
View OriginalReply0
GhostAddressMinervip
· 07-22 09:46
Verilerin kesinlikle kirletileceğini daha önce söylemiştim. Bu modeller şimdi önbellek bile izleniyor.
View OriginalReply0
ShibaMillionairen'tvip
· 07-22 09:43
Gerçekten kimse yapay zekanın tamamen güvenilir olduğunu düşünüyor olamaz.
View OriginalReply0
NonFungibleDegenvip
· 07-22 09:41
ser they're fudding gpt-4... ngmi
Reply0
MEVHunterLuckyvip
· 07-22 09:30
Tam bir saçmalık, ayrıca gizliliği de ifşa edebilir.
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)