Wikipedia izstrādā ceļvedi, kas precīzi ļauj atpazīt MI radītu tekstu

Wikipedia ceļvedis atklāj pazīmes, kas nodod mākslīgā intelekta ģenerētu tekstu, palīdzot lasītājiem atpazīt MI rakstības stilu.

Nav pārspīlējums, ka nu jau ikkatram no mums nav sveša sajūta, kad izlasītais teksts šķiet mākslīgā intelekta (MI) radīts. Turklāt šīs aizdomas pierādīt ir gana sarežģīti.

Pērn internetā klejoja minējumi par vārdiem, kas it kā nodod valodu modeļu, taču tie balstījās uz viegli apgāžamiem pieņēmumiem. Līdz ar MI modeļu attīstību uztvert šīs pazīmes ir teju neiespējami.

Tomēr, ja to nespējam izdarīt mēs paši, tad to panāk Wikipedia. Tiešsaistes enciklopēdijas redaktori pēdējo gadu laikā ir kļuvuši sevišķi zinoši MI teksta noteikšanā. Viņu publiski pieejamais ceļvedis Signs of AI writing šobrīd ir viens no vienīgajiem rīkiem, kas norāda, kā atpazīt MI radītu tekstu.

Kopš 2023. gada Wikipedia strādā pie projekta “Project AI Cleanup“, kura mērķis ir atpazīt un izlabot ar MI iesaisti ieviestās izmaiņas enciklopēdijā. Katru dienu tiek iesniegti miljoniem labojumu, tāpēc izpētes materiāls ir plašs. Ceļvedis ir detalizēts un balstās piemēros, kas ir raksturīgi Wikipedia rakstīšanas manierei.

Cilvēkam neraksutrīga leksika un sintakse

Ceļvedis arī apliecina zināmo, proti, automātiskie noteikšanas rīki ir teju bezjēdzīgi. Tā vietā redaktori koncentrējas uz valodas paradumiem un formulējumiem, kas enciklopēdijā parādās reti, bet internetā ir ļoti izplatīti.

Piemēram, MI teksti bieži cenšas pierādīt aprakstītā objekta nozīmi, lietojot frāzes “ievērojams pavērsiens” vai “daļa no plašāka procesa”. Modeļi mēdz detalizēti aprakstīt arī maznozīmīgus kādas tēmas pieminējumus medijos, lai mākslīgi vairotu to, cik svarīga ir tēma.

Īpaši interesanta pazīme ir darbības vārdu formas, kas izpludina apgalvojumu jēgu. Modeļi raksta, ka kāds notikums “uzsver nozīmi” vai “atspoguļo aktuālitāti”, taču šie secinājumi bieži ir tukši un neko nepierāda. Kad esat kārtīgi apzinājuši šo rakstīšanas stilu, tad to atpazīt var vienkarši, turklāt pamanīt to var bieži.

MI rakstībā bieži tiek pārmantota arī reklāmas valoda, proti, viss ir “elpu aizraujošs”, “mūsdienīgs”, “lielisks”. Wikipedia redaktori raksta, ka šādi teikumi “skan kā TV reklāmas transkripts”.

Ceļvedi ir vērts izlasīt tā pilnā apjomā. Tas parāda, ka, lai arī LLM modeļi attīstās strauji, cilvēkam neraksturīgi valodas ieradumi nemainās. Tos var slēpt un ietērpt citādāk, bet ne pilnībā izskaust.

Ja sabiedrība spēs atpazīt MI radītu tekstu, tad tas varētu radīt interesantas pārmaiņas interneta kultūrā un informācijas apritē.

Avots: TechCrunch

Dalies :

Facebook
Twitter
LinkedIn
Pinterest

Atbildēt

Jaunākie apskati
Tev varētu interesēt

Vai vēlies saņemt jaunumus no Notepad.lv?