Microsoft, kas ir investējis miljardus ģeneratīvajā MI kā OpenAI, apgalvo, ka lielās sistēmas patiesībā nav tas, ko vajag visiem. Top Phi-3.
Tehnoloģiju uzņēmumi sākuši pievērsties mazākām mākslīgā intelekta (MI) tehnoloģijām, kas nav tik jaudīgas, taču ir lētākas. Daudziem klientiem tā varētu būt lieliska ziņa.
Otrdien Microsoft iepazīstina ar trīs mazākiem MI modeļiem, kas ir daļa no Phi- 3 tehnoloģiju ģimenes. Uzņēmums apgalvo, ka pat mazākais no trim sniedz līdzīgu veiktspēju kā GPT-3.5. OpenAI ChatGPT sistēma ir daudz lielāka un satracināja pasauli 2022. gadā.
Mazākais Phi-3 modelis ietilpst pat viedtālrunī, to var izmantot bez interneta pieslēguma. To spēj darbināt mikroshēmas, kas atrodamas parastos datoros, nevis dārgie varianti kā Nvidia.
Tāpēc, ka mazie modeļi nepieprasa tik lielu jaudu, tehnoloģiju nodrošinātāji var likt tiem daudz mazāku cenu zīmi. Tas ir, ar cerību, ka vairāk patērētāju izmantos MI tur, kur lielie un jaudīgie modeļi šķituši pārāk dārgi. Lai gan Microsoft minēja jauno modeļu pieejamību, īpašas detaļas netika sniegtas.
Mazākas sistēmas nav tik jaudīgas, tādējādi tās var būt mazāk precīzas vai izklausīties neveikli. Taču Microsoft un citi tehnoloģiju uzņēmumi paredz, ka klienti spēs piedot misēkļus, jo beidzot varēs atļauties MI.
Klientu iztēle, kā izmantot MI, ir plaša, bet ar lielākām sistēmām “viņi domā, ak, bet ziniet, tās var kļūt padārgas,” sacīja Ēriks Bojds. Microsoft vadītājs. Mazāki modeļi – pēc definīcijas – ir lētāk izvietojami, viņš sacīja.
Mr. Bojds sacīja, ka daži klienti kā ārsti vai nodokļu sagatavotāji, varētu attaisnot lielāku, precīzāku MI sistēmu izmaksas, jo viņu laiks ir ļoti vērtīgs. Taču daudziem uzdevumiem nav nepieciešams tik augsts precizitātes līmenis. Tiešsaistes reklāmdevēji, piemēram, uzskata, ka mērķētas reklāmas var uzlabot mākslīgais intelekts, nepieprasot daudz līdzekļu.
“Es vēlos, lai mans ārsts nekļūdās,” saka Bojds. “Citās situācijās, kad es apkopoju tiešsaistes lietotāju atsauksmes, ja ir nelielas kļūdas, tas nav pasaules gals.”
MI sistēmu izveide
Tērzēšanas robotus darbina lielo valodu modeļi, matemātiskas sistēmas, kas pavada nedēļas analizējot digitālas grāmatas, Wikipedia rakstus, ziņas, sarakstes un cita veida rakstisku materiālu no interneta. Atrodot likumsakarības tekstā, robots iemācas to ģenerēt pats.
Kamēr tehnoloģiju giganti kā OpenAI un Anthropic fokusējas uz lielo MI sistēmu uzlabošanu, viņi arī sacenšas, izstrādājot mazākus modeļus, piedāvājot zemākas cenas. Meta un Google, piemēram, jau pagājušogad laida klajā mazos modeļus.
Meta un Google arī “atvēruši” šos modeļus, tāpēc jebkurš interesents var tos izmantot un modificēt bez maksas. Tas ir veids, kā uzņēmumi gūst palīdzību no ārpuses, lai uzlabotu savu programmatūru un iedvesmotu industrijas izmantot viņu tehnoloģijas. Microsoft atvērs arī savus Phi-3 modeļus.
Kad OpenAI laida klajā ChatGPT, Sams Altmans sacīja, ka katras sarakstes izmaksas ir “viencipara centi” – tie ir milzīgi izdevumi, ņemot vērā, ka populāri tiešsaistes pakalpojumi kā Wikipedia to dara par mazām centa daļām.
Microsoft Phi-3
Pētnieki saka, ka viņu mazie modeļi var tikai vismaz nedaudz pietuvoties vadošo tērzēšanas robotu, piemēram, ChatGPT un Google Gemini, veiktspējai. Tātad – sistēmas tik un tā var analizēt lielus datu apjomus, bet uzglabāt identificētās likumsakarības mazākā veidolā.
Modeļu izveide ir kompromiss starp jaudu un izmēru. Sebastiens Bubeks, Microsoft pētnieks un viceprezidents, sacīja, ka uzņēmums būvējis mazos modeļus, uzlabojot tajos ievadītos datus, lai nodrošinātu, ka modeļi mācās no augstas kvalitātes teksta.
Microsoft ir izveidojis trīs mazākus modeļus: Phi-3-mini, Phi-3-small un Phi-3-medium. Phi-3-mini, kas ir pieejams no otrdienas, ir mazākais un lētākais, taču ar vismazāko jaudu. Phi-3-medium, kas vēl nav pieejams, ir visjaudīgākais, taču lielāks un dārgāks.
Sistēmas, kas ir pietiekami mazas, lai ietilptu viedtālrunī vai personīgajā datorā, “padarīs tās daudz ātrākas un daudz lētākas,” sacīja Džils Luria, D.A Davidson investīciju bankas analītiķis.
Avots: NYTimes