Objavljeno: 27.10.2020 | Monitor November 2020

Splet kot vir vsega znanja

Vseznala umetna inteligenca se uči tako, da nenehno prebira splet .

Will Heaven, MIT Technology Review

Julija je najnovejši jezikovni model raziskovalnega laboratorija OpenAI, imenovan GPT-3, osupnil s svojo zmožnostjo sestavljanja zakonov, ki bi jih na prvi pogled lahko napisal človek. Ljudje so začeli razkazovati tudi to, kako bi GPT-3 lahko samodejno dopolnjeval kod in izpolnjeval prazne okvirčke v razpredelnicah.

Paul Katsen, ki je zaposlen pri Twitterju, je objavil pohvalo o funkciji razpredelnice, s katero GPT-3 samostojni izpolnjuje stolpce in povleče podatke za ameriške zvezne države: prebivalstvo Michigana dosega 10,3 milijona, Aljaska je država postala leta 1906 in tako naprej.

Vendar GPT-3 včasih prodaja tudi meglo. V Michiganu namreč nikoli ni živelo 10,3 milijona ljudi in Aljaska je država postala leta 1959.

Jezikovni modeli, kot je GPT-3, so osupljivi posnemovalci, vendar ne premorejo pravega zavedanja, kaj pravzaprav govorijo. »Odlični so v sestavljanju zgodb o samorogih,« je povedal Mike Tung, direktor zagonskega podjetja Diffbot iz Stanforda. »Niso pa naučeni, da morajo upoštevati resnična dejstva.«

Kar je seveda težava, če želimo, da je umetna inteligenca tudi verodostojna. V Diffbotu so se zato odločili za drugačen pristop. Razvijajo umetno inteligenco, ki prebere vsako stran na celotnem javnem spletu, in to v več jezikih, nato pa s teh strani izlušči čim več dejstev.

Tako kot GPT-3 se tudi Diffbotov sistem uči tako, da sesa ogromne množine besedil, ki so jih napisali ljudje in objavili na spletu. A namesto da bi s temi podatki učili jezikovni model, prebrano pretvorijo v serijo tridelnih faktoidov – iz osebka, glagola in predmeta –, ki podatke povezujejo med seboj.

Iz mojega življenjepisa je Diffbot razbral, da je Will Douglas Heaven novinar, da je zaposlen pri MIT Technology Review, da je to medijska družba in tako naprej. Vse te faktoide je povezal z milijardami drugih v nastajajoči, medsebojno povezani mreži dejstev. Temu rečemo graf znanja.

Grafi znanja niso nekaj novega, znani so že desetletja in so na začetku raziskav umetne inteligence veljali za enega osnovnih konceptov. A grafe znanja so običajno sestavljali in vzdrževali ročno, kar je zahtevno. Tim Berners-Lee ravno zato ni razmišljal o semantični mreži, kot je to poimenoval sam, v katero bi bili vključeni tako podatki za naprave kot za ljudi, da bi roboti lahko rezervirali naše letalske polete, opravili nakupe in na vprašanja odgovarjali pametneje od iskalnikov.

Pred nekaj leti je tudi Google začel uporabljati grafe znanja. Če v okence vnesete Katy Perry, boste poleg glavnih zadetkov iskanja zagledali tudi okence s podatki, da je Katy Perry ameriška pevka in avtorica, da so njene pesmi na voljo na Youtubu, Spotifyju in Deezerju. Hitro lahko ugotovite tudi, da je poročena z Orlandom Bloomom, da je stara 35 let in da njeno bogastvo znaša 125 milijonov dolarjev in tako naprej. Google vam ne ponudi seznama povezav na strani o Katy Perry, temveč vrsto dejstev, ki jih strne iz svojega grafa znanja.

Google se tako potrudi le pri najpogostejših iskalnih pojmih, cilj Diffbota pa je, da bi tak okvirček izdelal za vse. S popolno avtomatizacijo sestavljanja mu je uspelo izdelati morda največji graf znanja v zgodovini.

Diffbot, Google in Microsoft so edina tri ameriška podjetja, ki prečesavajo celotni javno dostopni splet. Victoria Lin, raziskovalka v podjetju Salesforce, ki se ukvarja z obdelavo naravnega jezika in prezentacijo znanja, je prepričana, da je pregledovanje spleta smiselno. »V nasprotnem primeru se lahko preveč energije namenja velikim zbirkam znanja.« Heiko Paulheim z univerze v Mannheimu se strinja: »Avtomatizacija je edini način za sestavljanje obsežnih grafov znanja.«

Superdeskar

Diffbotova umetna inteligenca med zbiranjem podatkov prebira splet, kot bi ga človek, le veliko hitreje. Z bliskovito hitro različico brskalnika Chrome pregleduje gole piksle na spletni strani in z algoritmi za prepoznavo podob stran uvrsti v eno od dvajsetih kategorij, na primer video, slika, članek, dogodek ali pogovorna nit. Nato razbere ključne elemente na strani, kot so naslov, avtor, opis izdelka, cena, in z obdelavo naravnega jezika strne podatke iz kateregakoli besedila.

Vsak tridelni faktoid se nato doda v graf znanja. Diffbot dejstva bere na straneh, izdelanih v različnih jezikih, kar pomeni, da lahko iskalcu, ki v okence vnese iskalni pojem Katy Perry, na primer, postreže z dejstvi iz člankov v kitajščini in arabščini, tudi če v njih ni samega imena pevke.

Ko umetna inteligenca brska po spletu kot človek, lahko vidi ista dejstva kot on. To hkrati pomeni, da se je morala naučiti uporabljati splet tako kot ljudje. Umetna inteligenca se mora znati pomikati navzdol, skakati med zavihki in s klikom ugasniti pojavna okna. »Umetna inteligenca mora splet uporabljati tako, kot bi igrala video igro, če hoče sploh dobiti občutek za strani,« je pojasnil Tung.

Diffbot se nenehno potika po spletu in svoj graf znanja osveži vsake štiri do pet dni. Kot je povedal Tung, umetna inteligenca vsak mesec doda od sto do sto petdeset milijonov pojmov, saj se pojavljajo novi ljudje, odpirajo se nova podjetja in na trg prihajajo novi izdelki. Z več algoritmi za strojno učenje nova dejstva združuje s starimi, ustvarja nove povezave in popravlja zastarele. Diffbot mora zaradi razraščanja grafa znanja v svojem podatkovnem središču tudi dodajati novo strojno opremo.

Raziskovalci lahko do Diffbotovega grafa znanja dostopajo brezplačno, ima pa tudi okoli 400 naročnikov, ki za to plačujejo. Iskalnik DuckDuckGo ga uporablja za ustvarjanje lastnih okvirčkov s podatki, podobnih Googlovim. Snapchat ob njegovi pomoči dela izvlečke najpomembnejših novic. Priljubljena aplikacija za načrtovanje poroke Zola uporabnikom olajša sestavljanje seznama povabljenih in išče slike ter cene. Nasdaq, ki nudi podatke o borzi, pa ga uporablja za finančne raziskave.

Ponarejeni čevlji

Družbi Adidas in Nike ta graf znanja uporabljata celo za iskanje ponarejenih copat na spletu. Iskalnik pripravi dolg seznam strani, ki omenjajo Nikove copate, Diffbot pa omogoča poizvedovanje za stranmi, ki dejansko prodajajo njegove izdelke, ne da jih samo omenjajo.

Za zdaj morajo podjetja z Diffbotom sodelovati z uporabo koda. A Tung namerava dodati vmesnik z naravnim jezikom, njegov končni cilj pa je univerzalni faktoidni sistem vprašanj in odgovorov, kot je to poimenoval sam: umetna inteligenca, ki bi lahko odgovorila na skoraj vsako vprašanje in to podkrepila z viri.

Tung in Linova se strinjata, da takšne umetne inteligence ni mogoče razviti samo z jezikovnimi modeli. Še bolje pa bi bilo, če bi kombinirali tehnologije, in sicer na podlagi jezikovnega modela, kot je GPT-3, s katerim bi izdelali človeku podobnega vseznalega robota za sporazumevanje z uporabniki.

Kakorkoli že, tudi umetna inteligenca s preverjenimi podatki ni nujno brihtna. »Ne poskušamo določiti, kaj je inteligenca, ali česa podobnega,« je poudaril Tung. »Razviti želimo le nekaj uporabnega.«

Copyright Technology Review, distribucija Tribune Content Agency

Zakup člankov

Za plačilo lahko uporabite plačilno kartico, PayPal, Apple Pay ali Google Pay:

Najprej se morate prijaviti.
V kolikor še nimate svoje prijave, se lahko registrirate.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Splet kot vir vsega znanja

Zakup člankov

Komentirajo lahko le prijavljeni uporabniki

Najnovejša številka revije