OpenAI ka lançuar një projekt të ri duke inkurajuar publikun me vënien e një shpërblimi, që të gjejnë dhe zbulojnë dobësitë në shërbimet e tij të AI, përfshirë ChatGPT. Shpërblimet variojnë nga 200 dollarë për “gjetjet me ashpërsi të ulët” deri në 20,000 dollarë për “zbulime të jashtëzakonshme” dhe raportet mund të dorëzohen përmes platformës së sigurisë kibernetike Bugcrowd .
Veçanërisht, shpërblimi përjashton shpërblimet për jailbreaking ChatGPT ose shkaktimin e tij për të gjeneruar kod ose tekst me qëllim të keq. ” Çështjet që lidhen me përmbajtjen e kërkesave dhe përgjigjeve të modelit janë rreptësisht jashtë fushëveprimit dhe nuk do të shpërblehen,” thotë drejtuesit e OpenAI.
Jailbreaking ChatGPT zakonisht përfshin futjen e skenarëve të përpunuar në sistem që e lejojnë atë të anashkalojë filtrat e sigurisë. Këto mund të përfshijnë inkurajimin e chatbot-it që të luajë role si “kopja e tij më e keqe “, duke lejuar përdoruesin të nxjerrë përgjigje të ndaluara ndryshe, si gjuha e urrejtjes ose udhëzimet për prodhimin e armëve.
OpenAI thotë se “çështje të tilla të sigurisë së modelit nuk përshtaten mirë brenda një programi bug bounty, pasi ato nuk janë gabime individuale, diskrete që mund të rregullohen drejtpërdrejt”. Kompania vëren se ” adresimi i këtyre çështjeve shpesh përfshin kërkime thelbësore dhe një qasje më të gjerë ” dhe raportet për probleme të tilla duhet të dorëzohen përmes faqes së reagimit të kompanisë .
Megjithëse jailbreaks të tillë demonstrojnë dobësitë më të gjera të sistemeve të AI, ato ka të ngjarë të jenë më pak problem drejtpërdrejt për OpenAI në krahasim me dështimet tradicionale të sigurisë. Për shembull, muajin e kaluar, një haker i njohur si rez0 ishte në gjendje të zbulonte 80 “ shtojca sekrete ” për ChatGPT API – shtesa ende të papublikuara ose eksperimentale për chatbot-in e kompanisë. (Rez0 vuri në dukje se dobësia u rregullua brenda një dite pasi ata e zbuluan atë në Twitter.)
Ndërsa një përdorues iu përgjigj fillit të tweet-it: “Nëse ata do të kishin vetëm një program me pagesë #BugBounty – jam i sigurt se turma mund t’i ndihmojë ata të kapin këto raste të veçanta në të ardhmen :)”