czwartek, 31 marca 2011

Co Google źle oblicza?

Rozwiązanie paradoksu googlowego, o którym była mowa ostatnio, może okazać się proste. Niewykluczone, że na każdej ze znalezionych stron wyszukiwane wyrażenie występowało więcej niż raz. Problem w tym, że rozbieżność między liczbą wyników wyszukiwania a liczbą wskazanych stron wynosi 12:1. Oznacza to, że na każdej stronie musiałoby paręnaście razy wystąpić połączenie "czytam blog". Sprawdziłem kilka przypadków, wniosek jest taki, że to raczej niemożliwe.
Konkluzja: Google nasz nieoceniony coś tam liczy źle. A co?

wtorek, 15 marca 2011

Wyników dużo, ale mało, czyli paradoks googlowy

Dziś o paradoksie googlowym, czyli rozbieżności między liczbą wyszukań podawaną przez tę wyszukiwarkę a liczbą faktycznie wyszukanych stron.
Żeby paradoks googlowy wykryć, trzeba odważyć się na przeglądanie następnych stron z wynikami, nie tylko pierwszej. Jest to rzadko spotykane działanie wśród z natury niecierpliwych internautów, więc problem jest – zdaje się – nieznany.
Na konkretnym przykładzie wygląda to tak, że wpisujemy jakąś frazę, np. "czytam blog", po czy dowiadujemy się, że mamy „około 9690 wyników”. Wielkie to bogactwo zaraz zniknie w oczach, wystarczy powędrować do ostatniej strony z wynikami. W tym wypadku będzie to strona 40., a na niej się dowiemy, że wyniki tak naprawdę były 393.
Co prawda dowiadujemy się też, że „Aby pokazać najbardziej trafne odpowiedzi, pominięto kilka bardzo podobnych stron do tych już wyświetlonych”.
Można więc powtórzyć szukanie, co też zrobiłem. Tym razem dostałem wiadomość o 9610 wynikach, tyle że wyświetliwszy je po 10, ostatnie wyszukane linki znalazłem na stronie 80.
Na razie zgłaszam tylko wykrycie tego paradoksu googlowego, bo nie mam zadowalającej odpowiedzi, skąd aż taka rozbieżność. Apeluję do Czytelników o zgłaszanie propozycji jego rozwiązania.