Bilo je, kot bi gledal prizor iz HBO-jeve serije Igra prestolov. V Washingtonu so se 20. januarja zbrali mogotci iz Silicijeve doline. Še do nedavnega vsi trdno na strani progresivnih politik v ZDA so šef Mete Mark Zuckerberg, šef Amazona in lastnik Washington posta Jeff Bezos, šef Appla Tim Cook in šef Googla Sundar Pichai prišli »pokrčiti koleno« pred svojim novim zaveznikom, a hkrati sedeli na izbranih mestih, s čimer so svetu dali vedeti, da Bela hiša in ameriški tehnološki sektor tvorita enotno fronto. Najbogatejši človek na svetu Elon Musk je šel še korak dlje in ta dan kandidiral za vlogo dr. Strangelova.

Proslava novega obdobja ameriške izjemnosti, ki naj bi slonela na tehnološki dominanci in zlasti veliki prednosti Silicijeve doline pred ostalo svetovno konkurenco na področju umetne inteligence, pa je imela napako. Ravno na dan Trumpovega ustoličenja je malo znano kitajsko podjetje Deepseek odprlo brezplačen dostop do njihovega modela umetne inteligence deepseek R1. Radovedneži so si stvar ogledali in kmalu ugotovili, da je zelo zanimiva. Analize so nato celo pokazale, da je kitajski odprtokodni model vsaj enakovreden najzmogljivejšemu modelu podjetja OpenAI, v nekaterih pogledih pa ga celo prekaša. Silicijevo dolino je čez noč zajela panika. Trenutek slavja se je sprevrgel v trenutek, ko so spoznali, da jih je preostali svet dohitel. Morda celo prehitel.

Ker je deepseek odprtokoden, ga lahko vzamejo in za svoje namene predelajo vsi, ki imajo dovolj potrebnega znanja. Predelane modele je hkrati možno brezplačno uporabljati v komercialne namene ali zasebno. Pojav tako zmogljivega odprtokodnega modela bi torej lahko vzporedili s trenutkom, ko so Sovjeti izdelali svojo jedrsko bombo in prekinili ameriško hegemonijo nad to tehnologijo. Za dobro ali slabo. Odprtokodna narava modela deepseek namreč pomeni, da imajo do tega močnega orodja prost dostop tudi nepridipravi, ki lahko njim izdelujejo spletne prevare, si z njim pomagajo pri pisanju zlonamerne kode ali pa jo uporabljajo za kak drug nečeden opravek. Večina ameriških podjetij je zadnja leta zagovarjala zaprtost dostopa do kode modelov prav zaradi skrbi za varnost. Izjema je Mark Zuckerberg. Ironično pa je Donald Trump z odlokom odpravil tudi enega zadnjih odlokov Bidnove administracije, ki je želel omejiti dostop do tehnologij, potrebnih za izdelavo umetne inteligence, državam, ki niso v dobrih odnosih z ZDA.

Za razvoj potrebovali vsega 5,6 milijona dolarjev

Podjetje Deepseek naj bi svoj model med drugim izdelalo z odprtokodnim orodjem, ki ga je razvila Meta. Najbolj šokantna podatka za ameriške AI mogotce pa je bila novica, da je kitajsko podjetje svoj model razvilo v vsega dveh mesecih. Za razvoj modela so porabili smešno skromnih 5,6 milijona dolarjev. Ameriška podjetja so za učenje umetne inteligence porabila na stotine milijonov dolarjev. Ob tem pa je tudi strošek dnevnega obratovanja modela skoraj neznaten v primerjavi s cenami, ki jih računajo chatGPT in ostala ameriška konkurenca. Američani so bili samozavestni glede svoje premoči zaradi prepričanja, da je napredek možen zgolj s še več računske moči, ki je za konkurenco finančno nedostopna.

Kitajski uspeh je posledica inovativnosti in bolj premišljenega pristopa k razvoju modela umetne inteligence. Deepseek R1 je zasnovan na optimizirani arhitekturi, ki omogoča učinkovitejše procesiranje podatkov in zmanjšuje potrebo po obsežnih računalniških virih, kar posledično znižuje stroške delovanja. V to so bili Kitajci prisiljeni tudi zaradi pomanjkanja čipov, primernih za obratovanje umetne inteligence. Za učenje so uporabljali bolj prečiščene vire, hkrati pa se model neprekinjeno uči, kar pomeni, da ga ni treba nadgrajevati ali ponovno usposabljati. Predvsem pa je bil model načrtno razvit za razumevanje logike in zmožnost razmišljanja, odkrivanje lastnih napak sklepanja in odpravljanje teh napak. Open AI je svoj model medtem polnil z ogromnimi količinami besedil v upanju, da bi na poti pobral tudi pravila logike in matematike. Razlika se pozna na rezultatih, hkrati pa model uporabniku razkriva pot, po kateri je prišel do sklepa. Posledično uporabnik jasno vidi, v katerem koraku je model vrinil kakšno napačno premiso ali podatek in lahko ta spodrsljaj z nadaljnjimi vprašanji odpravi.

Uspeh kitajskega modela je vplival tudi na vrednost ameriških tehnoloških podjetij. Delnice Nvidie, Microsofta, Alphabeta, Mete, Amazona, Appla in Tesle so pred začetkom ponedeljkovega trgovanja zabeležile padce vrednosti. Najhuje je bila prizadeta Nvidia s padcem, ki je v nekem trenutku presegel 13 odstotkov. Aplikacija deepseek je medtem že postala največkrat prenešena aplikacija na iphonih v ZDA in tudi v tem vidiku presegla chatGPT. Ima pa deepseek R1 tudi nekaj kitajskih »posebnosti«. Če ga vprašaš, kaj se je zgodilo na Trgu nebeškega miru ali zakaj kitajskega predsednika Xi Jinpinga primerjajo z medvedkom Pujem, noče odgovoriti. Z vprašanjem, zakaj je Donald Trump tako oranžen, nima težav.

Priporočamo