OpenAI ievieš drošības sistēmu un vecāku kontroli ChatGPT

Pēc prasības iesniegšanas tiesā par ChatGPT iesaisti pusaudža slepkavībā, OpenAI nāk klajā ar drošības sistēmu un vecāku iestatījumiem.

OpenAI nedēļas nogalē sāka testēt jaunu drošības maršrutēšanas sistēmu iekš ChatGPT, un pirmdien ieviesa vecāku kontroli čatbotā. Šo funkciju ieviešana ir izraisījusi dažādas reakcijas.

Drošības funkcijas ir ieviestas kā pretreakcija atsevišķiem incidentiem, kad ChatGPT modeļi iedrošināja lietotāju dzīvību apdraudošas domas, nevis novirzīja šīs sarunas.

OpenAI saskaras ar nepamatotu nāves gadījuma prasību saistībā ar vienu no šādiem incidentiem, kad pusaudzis pēc vairāku mēnešu saziņas ar čatbotu izdarīja pašnāvību.

Maršrutēšanas sistēma ir izstrādāta, lai atklātu emocionāli jutīgas sarunas un automātiski pārietu uz GPT-5 domāšanu, ko uzņēmums uzskata par vislabāk aprīkoto modeli augsta riska drošības darbam.

Konkrēti, GPT-5 modeļi tika apmācīti ar jaunu drošības funkciju, ko uzņēmums sauc par “drošiem pabeigšanas risinājumiem”. Tā ļauj modeļiem uz jutīgiem jautājumiem atbildēt drošā un neitrālā veidā, nevis vienkārši atteikties no iesaistīšanās.

Tas kontrastē ar uzņēmuma iepriekšējiem čata modeļiem, kas ir izstrādāti, lai tie būtu laipni sarunu biedri un ātri atbildētu uz uzdotajiem jautājumiem.

GPT-4o ir uzmanības lokā tieši pārlieku liekulīgā un pārspīlēti laipnā “rakstura” dēļ. Šī pieeja ir veicinājusi gan lietotāju ilūzijas par pasauli, gan piesaistījis lielu uzticīgu lietotāju bāzi. Kad OpenAI augustā ieviesa GPT-5 kā noklusējuma modeli, daudzi lietotāji pretojās un pieprasīja piekļuvi GPT-4o.

ChatGPT drošības maršrutēšana saņem dalītas reakcijas

Lai gan daudzi eksperti un lietotāji drošības funkcijas ir novērtējuši ar atzinību, citi ir kritizējuši to, ko uzskata par pārāk piesardzīgu noteikumu īstenošanu. Atsevišķi lietotāji uzņēmumu apsūdz par to, ka tāas pret pieaugušajiem izturās kā pret bērniem, tādējādi pazeminot pakalpojuma kvalitāti.

OpenAI ir norādījis, ka pareizās pieejas izstrāde prasīs laiku, un ir sev piešķīris 120 dienu ilgu iterācijas un uzlabošanas periodu.

“Maršrutēšana notiek katram ziņojumam atsevišķi; pāreja no noklusējuma modeļa notiek uz laiku,” vietnē X publicēja ChatGPT lietotnes vadītājs Niks Tūrlijs.

ChatGPT pēc pieprasījuma pateiks, kurš modelis ir aktīvs. Tā ir daļa no plašākiem centieniem stiprināt aizsardzības pasākumus un mācīties no reālās lietošanas pieredzes pirms plašākas drošības sistēmas ieviešanas.”

Diskusiju centrā arī vecāku kontroles iespējas

ChatGPT vecāku kontroles funkcijas ieviešana arī saņēma kā atzinību, tā kritiku. Daži atzinīgi novērtēja to, ka vecākiem tagad ir iespēja kontrolēt savu bērnu mākslīgā intelekta patēriņu. Citi – pauda bažas, ka tas pavērs durvis tam, ka (atkal) OpenAI pret pieaugušajiem izturēsies kā pret bērniem.

Kontrole ļauj vecākiem pielāgot savu atvašu pieredzi lietotnē, iestatot “klusuma” stundas, izslēdzot balss režīmu un atmiņu, atceļot attēlu ģenerēšanu un atteicoties no modeļu apmācības.

Pusaudžu kontiem tiks nodrošināta arī papildu satura aizsardzība, piemēram, samazināts jūtīgas dabas saturs un ekstrēmi skaistuma ideāli, kā arī atklāšanas sistēma, kas atpazīst potenciālas pazīmes, ka pusaudzis varētu domāt par paškaitēšanu.

“Ja mūsu sistēmas uztver jaunieti ar potenciāli paškaitējošām tieksmēm, neliela īpaši apmācītu cilvēku komanda izvērtē situāciju,” teikts OpenAI blogā.

“Ja ir pazīmes, kas liecina par akūtu stresu, mēs sazināsimies ar vecākiem pa e-pastu, īsziņu un push paziņojumu viņu tālrunī, ja vien viņi nav atteikušies no šādas iespējas.”

Uzņēmums atzina, ka sistēma nebūt nebūs perfekta un dažkārt izraisīs trauksmi arī tad, kad apdraudējums nepastāv. “Mēs uzskatām, ka labāk ir rīkoties un brīdināt vecākus, lai viņi nepieciešamības varētu iejaukties, nekā klusēt.”

Tāpat tika paziņots, ka tiek izstrādāts plāns, kā sazināties ar tiesībaizsardzības iestādēm vai neatliekamās palīdzības dienestiem, ja ChatGPT atklāj tūlītēju apdraudējumu dzīvībai un nevar sazināties ar vecākiem.

Avots: TechCrunch

Dalies :

Facebook
Twitter
LinkedIn
Pinterest

Atbildēt

Jaunākie apskati
Tev varētu interesēt