OpenAI Operator- MI aģents, kas autonomi veic uzdevumus

OpenAI nāk klajā ar Operator priekšskatījumu – vispārējas nozīmes MI, kas patstāvīgi var veikt darbības un kontrolēt tīmekļa pārlūkprogrammu.

OpenAI vadītājs Sems Altmans šā gada sākumā bloga ierakstā paziņoja, ka 2025. gads būs nozīmīgs mākslīgā intelekta (MI) aģentiem – rīkiem, kas var automatizēt uzdevumus un veikt darbības jūsu vārdā.

Tagad mēs redzam OpenAI pirmo reālo mēģinājumu. Ceturtdien uzņēmums paziņoja, ka uzsāk pētniecisku priekšskatījumu par Operator. Tas ir vispārējas nozīmes MI aģents, kas var pārņemt tīmekļa pārlūkprogrammas kontroli un patstāvīgi veikt noteiktas darbības.

Šis MI aģents vispirms tiks piedāvāts ASV lietotājiem, kuri izmanto ChatGPT Pro abonēšanas plānu. Uzņēmums apgalvo, ka ar laiku šo funkciju plāno piedāvāt arī citiem lietotājiem, proti, Plus, Team un Enterprise līmeņos.

“[Operator] drīzumā būs arī citās valstīs,” OpenAI vadītājs Sems Altmans ceturtdien sacīja tiešraidē. “Eiropai diemžēl tas prasīs laiku.”

Sākotnējais izpētes priekšskatījums ir pieejams vietnē operator.chatgpt.com (šobrīd nav pieejama Latvija). Tomēr uzņēmums apgalvo, ka drīzumā vēlas integrēt Operator visos ChatGPT pakalpojumu sniedzējos.

Foto: OpenAI

Ko sagaidīt no Operator?

Operator sola automatizēt tādus uzdevumus kā, piemēram, naktsmītņu un restorānu rezervēšanu un iepirkšaoss tiešsaistē, norāda OpenAI. MI aģenta saskarnē ir vairākas uzdevumu kategorijas, no kurām lietotāji var izvēlēties, tostarp iepirkšanās, piegādes, ēdināšanas un ceļošanas uzdevumi, kas ļauj veikt dažādus automatizācijas veidus.

Kad ChatGPT lietotāji aktivizē Operator, parādīsies neliels logs, kurā būs redzams īpašs tīmekļa pārlūks, ko aģents izmanto uzdevumu izpildei. Tāpat pieejami būs arī skaidrojumi par konkrētām darbībām, ko aģents veic. Lietotāji joprojām var kontrolēt savu ekrānu, kamēr šis aģents darbojas, jo aģents izmanto savu īpašo pārlūkprogrammu.

OpenAI apgalvo, ka jaunais MI aģents darbojas ar datoru izmantojošu aģentu jeb CUA. Tas apvieno uzņēmuma GPT-4o modeļa redzes spējas ar OpenAI attīstītāko modeļu spriešanas spējām.

CUA ir apmācīts mijiedarboties ar tīmekļa vietņu front-end. Tas nozīmē, ka tam nav jāizmanto izstrādātājiem paredzētās API, lai piekļūtu dažādiem pakalpojumiem. Citiem vārdiem sakot, CUA var izmantot pogas, pārvietoties pa izvēlnēm un aizpildīt veidlapas tīmekļa vietnē – līdzīgi kā to darītu cilvēks.

OpenAI apgalvo, ka sadarbojas ar tādiem uzņēmumiem kā DoorDash, Instacart, Priceline, StubHub un Uber, lai nodrošinātu, ka operators ievēro šo uzņēmumu pakalpojumu līgumu noteikumus.

Foto: OpenAI

“CUA modelis ir apmācīts pieprasīt lietotāja apstiprinājumu pirms uzdevumu ar ārējiem blakus efektiem pabeigšanas, piemēram, pirms pasūtījuma iesniegšanas, e-pasta nosūtīšanas u. c., lai lietotājs varētu vēlreiz pārbaudīt modeļa darbu, pirms tas kļūst pastāvīgs,” rakstīts OpenAI TechCrunch sniegtajos materiālos. “[Tas] jau ir izrādījies noderīgs dažādos gadījumos, un mūsu mērķis ir paplašināt šo uzticamību plašākā uzdevumu klāstā.”

Taču uzņēmums brīdina, ka CUA nav ideāls. Uzņēmums apgalvo, ka “[negaida], ka CUA vēl uzticami darbosies visos scenārijos.”

Potenciāli ierobežojumi

Piesardzības labad OpenAI arī pieprasa uzraudzību dažiem uzdevumiem, piemēram, banku darījumiem, kurus CUA un operators varētu veikt pilnīgi patstāvīgi. Piemēram, lai ievadītu kredītkartes informāciju, lietotājiem būs jāuzņemas pārraudzība. Uzņēmums apgalvo, ka Operator neievāc un neveic ekrānšāviņus.

“Īpaši jutīgās tīmekļa vietnēs, piemēram, e-pasta vietnēs, Operator ir nepieciešama aktīva lietotāja uzraudzība, nodrošinot, ka lietotāji var tieši pamanīt un novērst jebkādas iespējamās kļūdas, ko modelis varētu pieļaut,” teikts OpenAI atbalsta materiālos.

Tas, protams, ierobežo MI aģenta lietderību, bet arī nodrošina, ka aģents nesapņo un, teiksim, neiztērē jūsu hipotekāro maksājumu par akcenta krēsliem. Google izmantoja līdzīgu pieeju ar savu Project Mariner MI aģentu, kas arī neaizpilda tādu informāciju kā kredītkaršu numuri.

Gaidāma “aģentiska” nākotne

Salīdzinājumā ar konkurentiem, OpenAI MI aģentu ir izstrādājis diezgan lēni. Šis temps, iespējams, ir saistīts ar drošības riskiem, kas saistās ar šo tehnoloģiju.

Ja MI sistēma var veikt darbības tīmeklī, tas paver iespējas daudz bīstamākiem ļaunprātīgu dalībnieku izmantošanas gadījumiem. Varētu automatizēt MI aģentus, lai tie organizētu pikšķerēšanas krāpšanu vai izplatītu pakalpojumu atteikuma (pazīstams kā DDoS) uzbrukumus, vai arī lai tie izķertu biļetes uz koncertu, pirms to izdarītu kāds cits.

Tik plaši izmantotam rīkam kā ChatGPT ir svarīgi, lai uzņēmums novērstu šīs kļūdas, pirms tās ir radušās. Tomēr OpenAI šķiet, ka Operator ir pietiekami drošs, lai to publiskotu – vismaz kā pētniecisku priekšskatījumu.

Operator ir līdz šim drosmīgākais OpenAI mēģinājums izveidot MI aģentu. Pagājušajā nedēļā uzņēmums izlaida programmu Tasks, kas ChatGPT nodrošina vienkāršas automatizācijas funkcijas, piemēram, iespēju iestatīt atgādinājumus un ieplānot palūgumu izpildi noteiktā laikā katru dienu.

Tasks nodrošināja ChatGPT lietotājiem dažas pazīstamas, bet nepieciešamas funkcijas, lai ChatGPT būtu tikpat praktiski lietojams kā Siri vai Alexa. Tomēr Operator demonstrē iespējas, ko iepriekšējās paaudzes virtuālie asistenti nekad nespēja izmantot.

MI aģenti tiek uzskatīti par nākamo “lielo lietu” MI jomā – jaunu tehnoloģiju, kas mainīs veidu, kā cilvēki izmanto internetu un personālos datorus. Tā vietā, lai vienkārši sniegtu un apstrādātu informāciju, aģenti teorētiski var veikt darbības un darīt lietas.

Tā kā OpenAI publicē savu pirmo konkrēto pieeju aģentiem, drīz kļūs skaidrs, cik reālistiska ir šī vīzija.

Avots: TechChurch

Dalies :

Facebook
Twitter
LinkedIn
Pinterest

Atbildēt

Jaunākie apskati
Tev varētu interesēt