Kāpēc atsevišķas prasmes MI apgūst labāk nekā citas?

MI mūsdienās veic lērumu dažadu funkciju – programmēšana, e-pastu rakstīšana, video ģenerēšana -, tomēr progress nav vienmērīgs. Kāpēc?

Mākslīgā intelekta (MI) programmēšanas rīki uzlabojas izteikti ātri, tomēr, ja neizmantojat šos konkrētos rīkus, var rasties iespaids, ka jaunu prasmju apgūšana stagnē.

Piemēram, ja izmantojat MI, lai rakstītu e-pastus, efektivitāte pēdējā gada laikā nav mainījusies teju nemaz. Neskatoties uz to, ka jaunie čatbotu modeļi kļūst arvien labāki un labāki, gala rezūltāts pārāk nemainās. Sevišķi tērzētavu gadījumā tas ir īpaši aktuāli, jo šie rīki veic lērumu dažādu darbību vienlaikus.

Šī joma, protams, joprojām plaukst un zeļ, tomēr progress vairs nav tik vienmērīgs kā iepriekš. Tomēr šo atšķirību var viegli pamatot. Iepriekš minētie programmēšanas rīki gūst labumu no miljardiem viegli izmērāmu tesu, kas var tos apmācīt radīt darboties spējīgu kodu.

To dēvē par pastiprinātu mācīšanās procesu (RL), kas, iespējams, ir lielākais MI attīstības virzītājspēks pēdējo sešu mēnešu laikā, turklāt – tas kļūst arvien sarežģītāks.

Pastiprināto mācīšanos var veikt ar cilvēku vērtētāju starpniecību, tomēr tā darbojas vislabāk, ja ir skaidrs “apgūts/neapgūts” rādītājs, tādejādi apmācības var atkārtot n-tās reizes. Pie šādiem nosacījumiem nav nepieciešama arī cilvēku iesaiste.

Tā kā nozare arvien vairāk paļaujas uz pastiprināto mācīšanos, lai uzlabotu savus produktus, ir iespējams novērot reālu atšķirību starp prasmēm, ko ir iespējams novērtēt un starp tādām, ko nevar.

RL procesam draudzīgas iemaņas, piemēram, kļūdu labošana (bug fixes) un augstākā matemātika, tiek uzlabotas konstanti, turklāt ar manāmiem rezultātiem. Tomēr, piemēram, rakstīšanas spējas ievērojami stagnē.

Īsumā – pastāv tā dēvētā pastiprinājuma plaisa (reinforcment gap). Tieši šis ir primārais faktors, kas nosaka, ko MI sistēmas varu un ko nevar darīt.

Kāpēc MI lielā “atpaliek”?

Atseviškos aspektos programmatūras izstrāde ir ideāls subjekts pastiprinātajam mācīšanās procesam. Vēl pirms MI, pastāvēja vesela apakšnozare, kas nodarbojās ar programmatūras izturības pārbaudēm spiediena apstākļos. Tas ir galvneokārt tādēļ, ka izstrādātājiem bija jāpārliecinās, ka, pirms tā ieviešanas, viņu kods nebūs kļūdains.

Tāpēc pat šķietami vislabākais kods joprojām ir jāpakļauj vienības pārbaudei, integrācijas testēšanai, drošības testēšanai utt. Izstrādātāji šos testus izmanto regulāri, lai gūtu

Izstrādātāji šos testus izmanto regulāri, lai aptiprinātu savu kodu, un, kā nesen lēsa Google vecākais direktors izstrādes rīku jomā, tie ir tikpat noderīgi arī MI ģenerētā koda apstiprināšanai. Turklāt tie ir noderīgi arī pastiprinātajai apmācībai, jo jau ir sistematizēti un atkārtojami lielā mērogā.

Nav viegli pārbaudīt labi uzrakstītu e-pastu vai labu čatbota atbildi – šīs prasmes ir subjektīvas un grūtāk mērāmas lielā apjomā. Taču ne visus uzdevums var vienkārši iedalīt kategorijās “viegli pārbaudāms” vai “grūti pārbaudāms”.

Mums nav gatava testēšanas komplekta ceturkšņa finanšu pārskatiem, bet labi kapitalizēts grāmatvedības start-up uzņēmums, iespējams, varētu izveidot tādu no nulles.

Daži testēšanas komplekti, protams, darbosies labāk nekā citi, un daži uzņēmumi savā pieejā šai problēmai būs gudrāki. Bet pamatprocesa testējamība būs izšķirošais faktors, vai pamatprocess var tikt pārvērsts funkcionālā produktā, nevis tikai aizraujošā demo versijā.

Sora 2 veiksmes stāsts

Atsevišķi procesi ir vieglāk pārbaudāmi nekā tas var sākotnēji šķist. Piemēram, OpenAI jaunā video ģenerēšanas Sora 2 modeļa sasniegumi liecina, ka konkrēti veiksmīga video ģenerēšana nav tik izaicnoša, kā sākumā var likties.

Konkrēti šajā modelī modeļi neparādās vai neizzūd no zila gaisa. Cilvēku sejas nemaina savu formu, izskatoties pēc konkrēta cilvēka nevis lērumam dažādu seju vienkopus. Sora 2 ģenerētais materiāls ciena fizikas likumus gan uzskatāmos, gan ne tik uzskatāmos veidos.

Iespējams, ka, ja mums būtu iespēja noskaidrot, kas “lācītim vēderā”, varētu atrast spēcīgu pastiprinātas mācīšanās sistēmu katrai no šīm īpašībām. Kopā tās veido atšķirību starp fotoreālismu un izklaidējošu halucināciju.

Lai būtu skaidrs, tas nav stingrs un nemainīgs MI likums. Tas ir rezultāts tam, ka pastiprinātā mācīšanās ieņem centrālo lomu MI attīstībā, kas var viegli mainīties, attīstoties modeļiem.

Bet kamēr RL ir galvenais instruments šo produktu laišanai tirgū, pastiprinājuma plaisa tikai palielināsies – ar nopietnām sekām gan start-up uzņēmumiem, gan ekonomikai kopumā.

Piemēram, jautājums par to, kurus veselības aprūpes pakalpojumus var apmācīt RL, ir ļoti svarīgs ekonomikas attīstībai nākamajos 20 gados. Un, ja veiksmes stāsti kā Sora 2 kļūs par standartu, iespējams, atbilde uz šo jautājumu nebūs jāgaida ilgi.

Avots: TechCrunch

Dalies :

Facebook
Twitter
LinkedIn
Pinterest

Atbildēt

Jaunākie apskati
Tev varētu interesēt