Celosvětová síť Internet se neustále rozvíjí a množství informací, které jsou v současné době na webu publikované prostřednictvím služby WWW dosahuje obrovských čísel. Tato skutečnost se negativně podepisuje pod zahlcení tohoto digitálního světa širokou škálou různých informací, jež není jednoduché nejen vyhledat a následně se v nich orientovat, ale také dochází k dlouhým časovým odezvám, které mají za důsledek nevyhovující přístup k tomuto druhu informací. Hledání na Internetu se tudíž lehce může stát nepříjemnou a únavnou činností. Tento stav je paradoxně způsoben hlavní předností samotného webu, který funguje jako svobodný komunikační a informační nástroj obecně nabízející přístup k informacím bez omezení, ať už z hlediska obsahu nebo vzdálenosti. Každým dnem se na Internetu objeví velké množství nových informací, zároveň však zaniká mnoho jiných a starých zdrojů. Navíc na Internetu nejsou přesně definována žádná závazná pravidla pro způsob publikace informací. Proto vzniká spousta stránek, které svojí formou nedodržují ani nepsaná pravidla elektronického publikování. To vše znesnadňuje zpracování a vyhledávání těchto stránek.
Velké množství dokumentů na Internetu postrádá informaci o datu svého zveřejnění příp. poslední revize. Dalším problémem je problematické určení, zda informace obsažená na vyhledané stránce je původního charakteru nebo se jedná o informaci převzatou z jiného zdroje. Aby bylo možné orientovat se v rozsáhlém prostoru, který WWW pokrývá, byly vytvořeny vyhledávací služby, které se záhy staly velmi oblíbenými a často používanými. Každý uživatel Internetu by měl vědět, jak při hledání různého typu informací postupovat a kterou vyhledávací strategii zvolit, aby dosáhl pokud možno co nejuspokojivějšího výsledku. Podívejte se na obrázek , který nabízí zobecněný a zjednodušený pohled na princip vyhledávání informací v síti Internet.
Dokumenty, které jsou publikované a dostupné prostřednictvím služby WWW lze rozdělit do dvou základních skupin. Informace přístupné vyhledávacím strojům představují tzv. viditelný web (visible web). Druhou skupinu tvoří informace, které jsou mimo dosah vyhledávačů resp. nejsou jim přístupné. V souvislosti s dokumenty obsahujícími tyto informace hovoříme o tzv. neviditelném webu (invisible web). Jedná se o dokumenty, které jsou často jiného formátu než HTM(L). Může se jednat například o stránky vytvořené prostřednictvím aplikace Macromedia (Adobe) Flash nebo o soubory typu PDF, které slouží především k publikaci různých výzkumných zpráv nebo údajů. Existují však vyhledávací stroje, které dokáží pracovat i s různými souborovými formáty (např. Google). Vyhledávacím serverům mohou být neviditelné také stránky, které pojmenováváme jako tzv. „samotáře“. Jsou to stránky, které neobsahují odkaz na jiné stránky ani na ně neexistuje odkaz z jiných stránek. Neviditelný web je také tvořen stránkami, které jsou chráněny heslem.
Pokud chceme vyhledávat informace rychle a přesně, musíme mít na paměti několik základních zásad efektivního vyhledávání:
Přehled nejznámějších českých vyhledávačů a katalogů nabízí obrázek . Obrázek
obsahuje naopak přehled nejpoužívanějších světových vyhledávačů a katalogů.
Jak už tedy bylo řečeno, negativní stránka informací obsažených v síti Internet zahrnuje zejména jejich nepřehlednost a neuspořádanost. Jelikož neexistuje jednotné závazné pravidlo pro elektronické publikování, dochází zde k rozmanitým způsobům prezentace informací. V důsledku tohoto stavu si každý uživatel při své návštěvě webu musí zákonitě položit otázku typu: „Jakým způsobem se co nejrychleji a nejefektivněji dostanu k tomu typu informací, které mě právě zajímají?“ Odpovědět by vám měly následující studijní články v této kapitole.