Da bo model znal bolje slovensko, smo se desetim milijardam besed, ki jih imamo zbrane v raznih besedilnih zbirkah, namenili dodati še štirideset milijard, da bo naš Gams poznal čim več in čim bolj različnih slovenščin. Priti do take količine slovenskih besedil ni ravno mačji kašelj. V resnici bo to težko doseči brez dveh pomembnih slovenskih ustanov: Narodne in univerzitetne knjižnice in Radiotelevizije Slovenija. V NUK-u so zbrana predvsem tiskana besedila, ki so v precejšnji meri tudi že digitalizirana, RTV Slovenija ima predvsem velik arhiv govorjenih besedil. Ima pa NUK pri uporabi svojih gradiv za naše gamsovske namene težko rešljiv problem: je le zbiratelj in arhivar slovenskih publikacij, ni pa lastnik avtorskih pravic. To pomeni, da brez dovoljenja lastnikov ali kakšne druge zakonske podlage nikomur ne sme omogočiti dostopa do zbranih besedil. Trenutno možnosti za uporabo gradiv iz NUK-a še preučujemo. Po pogovorih se zdi, da je vse odvisno od Urada RS za intelektualno lastnino, ki deluje kot organ v sestavi Ministrstva za gospodarstvo, turizem in šport. Torej: vprašanje je za ministra Hana.
(FOTO) Tožilec bi Janšo poslal v zapor za dve leti, glasni podporniki motijo obravnavo