Weblog pro webmastery a webdesignéry
22. 07. 2003
Ontologie - základ sémantického Webu
Pokud vám zatím stále nebylo jasné, co v souvislosti s Webem a informační architekturou je (jsou) ontologie, třeba u vás se svým výkladem uspěje David Bureš. Jeho článek Sémantický web - ontologie (DigiWeb, 21.7.03) má tu výhodu, že je na rozdíl od většiny ostatních česky (nebo alespoň skoro česky).
Trochu mne překvapuje, že David ve výčtu praktických aplikací RDF opoměl Open Directory (dmoz.org). Tento katalog je totiž na RDF postaven a v tomtéž jazyce od něj přebírají data stovky dalších serverů, včetně Googlu.
Jak lépe krmit Googlebota
GoogleGuy dal včera v diskusním fóru WebmasterWorld k dobrému pět doporučení, jak povzbudit Google k lepšímu indexování webu:
- Ujistěte se, že váš server používá HTTP hlavičku If-Modified-Since. Pokud ano, Google zaindexuje ochotněji více stránek.
- V robots.txt můžete použít znak * zastupující libovolný počet libovolných znaků a znak $ označující konec názvu. Snadněji tak označíte Googlu soubory, které indexovat nechcete.
- Googlebot akceptuje v robots.txt i direktivu Allow. Pokud jsou v konfliktu dvě direktivy, Googlebot si vybere tu delší, resp. konkrétnější.
- Vyhýbejte se ID sezení (session ID). Mějte v dynamických URL co nejméně parametrů a raději nepoužívejte parametr nazvaný id.
- Ujistěte se, že je každá stránka webu dostupná textovým prohlížečem, jako je Lynx.
Plný text GoogleGuyova příspěvku v GoogleGyu Says.
Další příspěvky weblogu
- Předcházející den: 21. 07. 2003
- Následující den: 23. 07. 2003
- Celý měsíc
- Posledních pět dní


