Google iepazīstina ar Imagen 3, savu labāko MI text-to-image modeli. Tam ir uzlabotas detaļas un reālisms, bet striktāki ierobežojumi.
Google ASV ir laiduši klajā jaunāko mākslīgā intelekta (MI) text-to-image ģeneratoru: Imagen 3. Attēlu ģenerēšanas rīks ir pieejams caur Google ImageFX platformu un tam var piekļūt iekš Google AI Test Kitchen. Par rīku pirmo reizi tika paziņots Google I/O maijā un pirms tam bija pieejams tikai konkrētam skaitam Vertex AI lietotāju.
“Imagen 3 ir mūsu augstākās kvalitātes text-to-image modelis. Tas ģenerē iespaidīgu detalizācijas līmeni, radot fotoreālistiskas, dzīvīgas bildes ar daudz mazāk uzmanību novērsošiem vizuāliem artefaktiem,” saka Google.
Uzlabotais attēlu ģenerators var izveidot bildes, pamatojoties uz lietotāju uzvednēm. Lietotāji arī var rediģēt attēlu izceļot kādu zonu un norādot MI, lai tas veic vēlamās izmaiņas. Rīkam gan ir ierobežojumi, piemēram, nevar izveidot attēlus ar publiskām personām vai ieročiem. Kā arī – lai gan tas neveido attēlus ar minētajiem tēliem, lietotāji tapāt var apiet sistēmu, sniedzot vizuālu raksturojumu ar vēlamo personu.
Google arī ir publicējuši pētījumu, kas skaidro tehnoloģiju. Atsaucoties uz ziņām, daži Reddit lietotāji spēja piekļūt Imagen 3 jau pagājušajā nedēļā.
Google MI ģeneratora laišana klajā iekrīt vienā laikā ar xAI konkurentspējīgo sistēmu: Grok-2. Kad lietotāji atklāja, ka Google Gemini AI tērzēšanas robots rada vēsturiski neprecīzus attēlus, Google apturēja Gemini attēlu ģenerēšanas funkciju.
Avots: BusinessStandard