15.5.2024 | Svátek má Žofie


INTERNET: Jak velké je webové nepřehledno

25.2.2012

Světový web nemá žádnou centrální autoritu. Proto lze stěží říci, kolik webových stránek ode dne, kdy se objevila ta první (kdy to bylo - i to je otázka), vůbec vzniklo.

Nedávné dvacáté výročí přístupu Československa k internetu připomnělo, že internet tu máme a funguje a používáme ho a zároveň o něm moc nevíme. Sám jsem se účastnil televizní debaty a jeden posluchač se zeptal (přes internet), kolik je na světě těch webových stránek. Kromě mě, laika, tam ve studiu sedělo několik odborníků a nikdo neznal přesnou odpověď.

Důvodů k té neznalosti je několik, napadají mě hned dva. Jeden je snad diskutabilní, je to informace nepraktická, žádnému odborníkovi nepomůže a nemá důvod, proč se po ní pídit. Závažnější je důvod druhý. Množina webových stránek, a tahle džungle se mnohdy s pojmem internet chybně ztotožňuje, se neustále rozpíná, takže otázka má asi takový smysl, jako kdyby se někdo deset vteřin po velkém třesku ptal, jak velký je vesmír. Nicméně i sama nezodpověditelnost té otázky ukazuje na podstatu věci. Základem webové struktury je absence nějaké centrální autority, která by ji registrovala, řídila, určovala a posléze omezovala a dusila, jak už to ústřední autority dělávají. Jak na to Na zapeklitost otázky mě upozornila webová stránka Webarchiv.cz, která se analýzou webu soustavně zabývá. Poměrně snadno se dopracujeme k nejstarším webovým stránkám. Ta první údajně vznikla 15. března 1985 pod názvem Symbolics.com, dodnes existuje a hned v záhlaví se chlubí svým historickým prvenstvím. Ale i tato stránka je dobrou ukázkou, jak věci fungují. Chlubí se 26 lety existence, přičemž jí silně táhne na 27 a dále se chlubí 453 tisíci návštěv, což za čtvrt století věru není důvod k pýše. No a jsou na ní české reklamy, to je důkaz, že reklamní systémy dovedou opravdu prosáknout i do hodně zastrčených zákoutí webu. Mezi dalšími nejstaršími deseti doménami najdeme i věhlasné značky, jako jsou Xerox nebo HP, to dává smysl. Údaj je to pochybný, Tim BernersLee uvádí jako první webovou stránku tu svoji, info.cern.ch, a zveřejnil ji 6. srpna 1991. Ne, opravdu to není jednoduché!

Kromě velkých čísel ale web zná i malá. Do této kategorie spadá počet domén prvního řádu. Co to je? Když se podíváte na doménové jméno lidovky.cz, tak to jméno se skládá ze dvou jmen a bere se to odzadu. To "cz" je doména prvního řádu, v daném případě je to národní doména. Němci mají "de", Francouzi "fr" a tak dále.

Slovo "lidovky" je doména druhého řádu. Nuže, těch domén prvního řádu je na celém světě jen 324... podle jednoho zdroje. Celkem jednoduše se spočtou národní domény, pak jsou univerzálně užívané domény, jako je com, net, biz, info a org, ale přibývá generických domén prvního řádu, jako je museum (musíte prokázat, že jste muzeum, abyste ji mohli používat) nebo xxx (copak to asi může znamenat?). Buď jak buď, počet domén prvního řádu bude vždy poměrně malý a poměrně přehledný. Na jednu doménu prvního řádu se může navěsit obrovské množství domén druhého a třetího a entého řádu, což se vskutku děje a vede to k explozi srovnatelné s velkým třeskem. To vše se děje takřka neorganizovaně. Ovšem jsou tu instituty (nikoli instituce), které nad tímbdí, jsou to především katalogizační stránky, jako je náš Seznam nebo internacionální Google. Antonio Gulli z katedry informatiky na univerzitě v Pise analyzoval výsledky indexů Googlu, MSN, Yahoo! a Ask/Teoma a došel k počtu jedenácti a půl miliardy webových stránek... v roce 2005.

Na stránce Worldwidewebsize.com se průběžně zveřejňují analýzy Googlu, Bing a Yahoo!. V současnosti tu najdeme odhad v řádu 8,21 miliardy webových stránek. To je číslo výrazně nižší, než k jakému došli v Pise... před sedmi lety. Takže dám k lepšímu vyšší číslo. Google před čtyřmi lety oznámil, že jeho automatické vyhledávací systémy zjistily, že na světě je jeden bilion indexovatelných webových stránek, bilion míněno jako číslo s dvanácti nulami. Odborníci berou toto zjištění s rezervou, protože významný díl tohoto množství je vytvářen automaticky, bez obsahu, který by dával velký smysl.

Nicméně Webarchiv upozorňuje, že existuje povrchový web, a to je ten, který je přístupný vyhledávači, a hluboký web, zanořený do struktury a skrytý před vyhledávači. Michael K. Bergmann se ve své studii Bright Planet hlubokým webem zabývá a v roce 2009 odhadl jeho počet na 550 miliard stránek.

Jsou to čísla závratná a samozřejmě vedou k divokým úvahám o tom, zdali zde nevzniká zárodek nějakého celosvětového megavědomí, z vnějšku nekontrolovatelného. Arthur C. Clarke vydal už před půl stoletím povídku "... a ozve se Frankenstein". Předpokládá v ní, že v celosvětové soustavě telefonních ústředen vznikne cosi jako autonomní vědomí. Vychází z předpokladu, že v mozku je patnáct miliard neuronů. "Přibližně v šedesátých letech měly už všechny automatické telefonní ústředny na světě větší počet jednotlivých spojů. Dnes jich je asi pětkrát tolik," říká jedna z postav povídky. Dnes ústředny, jaké popisoval Clarke, snad už ani neexistují. Počet spojů digitálních ústředen a kapacita počítačů propojených internetem je cosi neodhadnutelného. Clarke to viděl pesimisticky. "Pro druh homo sapiens už telefonní zvonek odezněl," zní poslední věta povídky.

Jeho přístup k věci je pro člověčí náturu typický. Rádi se bojíme něčeho, co je očividně užitečné, ať je to telefon, atomová elektrárna, nebo World Wide Web. Bojíme se tím spíš, když tomu nerozumíme a ani to neumíme spočítat. Přitom ten další šok je už za dveřmi, totiž hlasová komunikace s počítačem. Zatím v tom webovém nepřehlednu bloudíme pomocí klávesnice a myši. Zítra to bude oboustranná mluvená komunikace. Pak už nikdy nebudeme sami, k dobrému i zlému. Takže si užívejme, že na nás web nemluví.

Zatím.

LN, 23.2.2012