Spletno podjetje iz kalifornijskega Mountain Viewa napreduje na vseh področjih. Vendar je najbolj konkurenčno ravno na področju nadzora, usmerjanja in iskanja spletnih podatkov, s čimer so se začeli ukvarjati ob vzponu spleta v drugi polovici devetdesetih. Zadnje čase se pri njih kopičijo tudi elektronske knjige, s katerimi poskuša Google skočiti v zelje preostalim konkurentom, še posebej Amazonu.
Podjetje, ki sta ga ustanovila Larry Page in Sergej Brin leta 1998, že nekaj let pospešeno digitalizira vse knjige. V zadnjem času v podjetju poskušajo med drugim tudi ugotoviti, koliko knjižnih naslovov sploh obstaja. Z izdelavo posebnega algoritma jima je uspelo ugotoviti, da naj bila ta številka natančno 129.864.880.
Pri Googlu pojasnjujejo, kako jim je to uspelo. Najprej so morali določiti, kaj sploh šteje kot knjižni naslov. Prvi skupni imenovalec vsem knjigam naj bi bila mednarodna standardizirana koda ISBN (mednarodni standard knjižnega oštevilčenja). Vendar se je pri izračunavanju elementov z označbo ISBN takoj pokazal problem, saj je standard v uporabi šele od šestdesetih let prejšnjega stoletja, pa še omejen je v glavnem na zahodno literaturo in ne zaobjema velikega števila starejših in tujih knjig.
Zato so se pri Googlu znašli in preskočili omejitev ISBN ter s spleta vzeli 'metapodatke' (digitalne lastnosti arhiviranih podatkov knjig) z več kot 150 viri. Med slednjimi so različne knjižnice, mednarodne knjižnične baze World Cat (vsebuje podatke o knjigah iz 71.000 knjižnic po svetu), nacionalnih knjižnih katalogov in komercialnih virov. Tako so pridobili okrog 600 milijonov naslovov. Po selekciji in odstranitvi podvojenih rezultatov, mikrofilmov, zemljevidov in zvočnih zapisov so prišli do številke 129.864.880 naslovov knjig. Nekaj od teh ste jih zagotovo prebrali, kajne?
KOMENTARJI (2)
Opozorilo: 297. členu Kazenskega zakonika je posameznik kazensko odgovoren za javno spodbujanje sovraštva, nasilja ali nestrpnosti.
PRAVILA ZA OBJAVO KOMENTARJEV