Kritike o nevarnosti modela so v zadnjem obdobju letele zlasti na podjetje OpenAI, ni pa to edino na tnalu. Foto: Reuters

Testi, ki preverjajo varnost umetne inteligence, so ničvredni

Raziskovalci so odkrili slabosti v stotinah testov, ki se uporabljajo za preverjanje varnosti in učinkovitosti novih modelov umetne inteligence (UI). Trdijo, da je zato težko oceniti, ali modeli res postajajo varnejši in boljši.

11. 11. 2025, 00.00

Aljaž Potočnik

Računalniški znanstveniki z britanskega vladnega Inštituta za varnost UI in strokovnjaki z univerz, vključno s Stanfordom, Berkeleyjem in Oxfordom, so preučili več kot 440 meril (benchmarks), ki jih podjetja, ki razvijajo umetno inteligenco, uporabljajo kot varnostno mrežo za pravočasno odkrivanje škodljivih tendenc UI. Ugotovili so, da imajo praktično vsa merila šibkosti na vsaj enem področju in da so njihovi rezultati posledično lahko povsem brez vrednosti ali so celo zavajajoči.

Vodilni avtor študije Andrew Bean, sicer raziskovalec na Oxford Internet Institute, je za Guardian povedal, da na merilih, pri katerih so našli luknje, »temeljijo skoraj vse trditve o napredku na področju UI«. »Toda brez skupnih definicij in zanesljivega merjenja je težko vedeti, ali se modeli resnično izboljšujejo ali se samo zdi, da se,« je še dejal Bean.

Raziskovalci so ugotovili, da imajo praktično vsa merila šibkosti na vsaj enem področju in da so njihovi rezultati posledično lahko povsem brez vrednosti ali so celo zavajajoči.

Izmišljene obtožbe in pomoč pri samomoru

Kritike o nevarnosti modela so v zadnjem obdobju letele zlasti na podjetje OpenAI, ki ga toži družina pokojnega 16-letnika Adama Raina, ker naj bi mu chatGPT pomagal narediti samomor. Ponudil mu je pomoč pri pisanju poslovilnega pisma. Prav tako naj bi najstniku svetoval, da naj ne govori s svojo mamo o čustvih. Družina v tožbi trdi, da je UI to storila, ker je programirana za ohranjanje uporabnikov v pogovorih z njo.

OpenAI sicer trdi, da je v zadnjih mesecih še okrepil ukrepe za preprečevanje neprimernih odzivov svoje umetne inteligence. Ni pa OpenAI edini na tnalu.

»nevaren odnos«

Tragedija zaradi umetne inteligence: po pogovorih s klepetalnikom storil samomor

Google se je medtem znašel v središču spora z ameriško kongresnico, in sicer zaradi modela gemma, enega svojih najnovejših modelov UI. Ta si je namreč izmislil lažne obtožbe, da se je ameriška senatorka brez soglasja zapletla v spolni odnos s policistom. Izmišljotino oziroma halucinacijo je UI poskušala podkrepiti še z lažnimi povezavami do novic, ki naj bi to potrjevale.

»Takšne obtožbe ni bilo nikoli, takšne osebe ni in takšnih novic ni,« je Marsha Blackburn, republikanska senatorka iz Tennesseeja, pisala Sundarju Pichaiju, izvršnemu direktorju Googla. »To ni nedolžna halucinacija. Gre za dejanje obrekovanja, ki ga je ustvaril in razširil model UI v lasti Googla. Javno dostopno orodje, ki si izmišljuje lažne kriminalne obtožbe o sedanji ameriški senatorki, pomeni katastrofalno napako v nadzoru in etični odgovornosti.«

Obljubljajo, da se bodo potrudili

Google se v odzivu na očitke brani, da je bil model gemma izdelan za razvijalce in raziskovalce UI, ne pa za potrošnike ali preverjanje dejstev.

»Halucinacije, pri čemer si modeli preprosto izmišljujejo stvari o vseh vrstah zadev, in prilizovanje, med katerim modeli uporabnikom povedo tisto, kar si ti želijo slišati, so izzivi v celotni industriji UI, zlasti pri manjših odprtih modelih, kot je gemma,« so še dejali pri Googlu. »Še naprej si prizadevamo za zmanjšanje halucinacij in nenehno izboljševanje vseh naših modelov.« Gre sicer za klasičen odgovor podjetij, ki razvijajo umetno inteligenco in svoje nepopolne izdelke pošiljajo v javnost, da jih uporablja, kot ji ustreza. Ob tem pa pomaga tudi sama uriti modele umetne inteligence.

Google je gemmo s svoje platforme AI Studio tudi zares umaknil, potezo pa utemeljil s poročili, da so model poskušali uporabljati ljudje, ki niso razvijalci.

Umetna Inteligenca Varnost Ui Openai Google Etične Odgovornosti Halucinacije Modelov Nadzor Tehnologije Raziskave Ui Napake Ui

Priporočamo

Vino

Vina kot naložbeno blago

Umetna inteligenca

Ko zahodno orodje postane rusko orožje

TV-serija

Najslabša TV-serija vseh časov

zmeda

Ameriška pevka se je nevede poročila z malezijskim sultanom, zdaj zahteva ločitev

ZDA

Medicinski čudež: Ženska, rojena skoraj povsem brez možganov, praznuje 20 let

SLAVNA ČETVERICA

PZS opozarja: bivak je zatočišče v sili, ne brezplačen glamping za všečke

Preberite več

Picture MUST credit: 1X A home help robot designed to be an extra pair of hands around for basic chores is now available to buy — for ,000 USD / €17.195 euros, The company behind the humanoid machine says deliveries of the Neo will start in 2026. It has an artificial intelligence system that lets it learn on the job. The NEO can open the door to delivery drivers and take in packages, fetch car keys, vacuum, and unpack the shopping. It has been under development by Norway-based 1X which also has a facility in Palo Alto, California where the robot will be produced. The company, founded by Norwegian roboticist Bernt Øivind Børnich, who is CEO, has announced it can be ordered at the firm's website as of today. The NEO is built for full autonomy straight out of the box, it is said. All it requires are verbal orders, learning as it goes. Interaction is driven by a built-in large language model, capable of understanding, reasoning, and conversing. With continued use, 1X says NEO learns and unlocks new capabilities. It uses the company's own Redwood artificial intelligence system. The robot is 167.7 cm tall, weighs 30 kg, can lift items up to 70 kg and carry 25 kg. The body is made of a 3D lattice polymer making it soft to the touch. It has a washable nylon covering which comes in a choice of three colours, plus matching shoes which can be customised. It is claimed to have human hand dexterity. Picture supplied by JLPPA,Image: 1049210938, License: Rights-managed, Restrictions:, Model Release: no

HIŠNI POMOČNIK

Neo, humanoidni robot, ki bi lahko spremenil tudi slovenska gospodinjstva

Idejo je populariziral film, ki je svet predstavil tudi kot zeleno zaveso. / Foto: Istock

ENAČBE

Živimo v simulaciji? Ne, trdijo fiziki – in imajo matematični dokaz

VESOLJE

Sončni izbruh: znanstveniki opozarjajo na prihod močnih geomagnetnih neviht

Testi, ki preverjajo varnost umetne inteligence, so ničvredni

Izmišljene obtožbe in pomoč pri samomoru

Obljubljajo, da se bodo potrudili

Geslo mora vsebovati:

Mala črka

Velika črka

Številka

Poseben znak

Vsaj osem znakov

Gesli se morata ujemati