Googlanie, czyli szukanie w Internecie

wtorek, 15 stycznia 2013

Kontent zduplikowany, czyli co nie wychodzi Google’owi

W poprzednim tekście zapowiadałem zamiar zweryfikowania utrwalonych poglądów o zasadach optymalizacji stron dla wyszukiwarek internetowych. Wiadomo stąd, że na początek zajmę się problemem powielania treści (duplicate content).

Jako autor blogu o imionach badam czasem, jaką drogą trafiają do mnie czytelnicy. Widzę więc, że jaką taką skutecznością wykazuje się fraza „wszystko o imionach”. Wpisałem ją do Googlowego okienka. Na czele listy pełno stron z chomikuj.pl (nieźle się pozycjonują, pomyślałem złośliwie). Otwieram jednego chomikuja. Mam plik, który – jak wynika z jego nazwy – opisuje „wszystkie imiona żeńskie”.

OK. Otwieram, w środku nie ma nawet 10% wszystkich żeńskich imion, ale co tam. Treść: czary mary, bzdury nieopisane w stylu „Antoni ma skłonność do łysienia, Klara jest dobrą matką” (a może odwrotnie), ale trudno, skoro ma to wzięcie w Internecie, niech będzie. Postanowiłem jednak zbadać, skąd wiesia3232 z chomikuja te idiotyzmy ściągnęła. Skopiowałem fragment tego tekstu, taki oto: „Osoba je nosząca jest zdolna do wielu nadzwyczajnych czynów” (nieważne o kim to, bo taką charakterystykę ma tam niejedno imię).

Wklejam to Google’owi, bez cudzysłowu, żeby nie wymuszać na nim wyszukiwania tego zdania w całości. Zlecam mu szukanie. I mam wyniki.

Tekst o „wszystkich imionach żeńskich” został odnaleziony na ponad 200 (dwustu!) stronach internetowych. To może skrajność, ale przykładów powielania treści na mniejszą skalę (najczęściej chodzi o kopiowanie z Wikipedii) można znaleźć tysiące. I z reguły są one na czołowych pozycjach wyników wyszukiwania.

Z czego wnioskuję, że powielanie treści się opłaca. Pozdrawiam zaś tych, którzy tworzą wyłącznie treści oryginalne.

sobota, 15 grudnia 2012

Duplicate content, czyli powielanie treści

W blogu o wyszukiwaniu internetowym musi być też o tym, co robić, żeby zostać skutecznie wyszukanym. Jest na ten temat już cała literatura internetowa, a nawet i drukowana. Jest to zresztą spory dział marketingu. Istotę rzeczy zwięźle ujmuje skrót SEO, co się wykłada jako search engine optimization, a przekłada jako optymalizacja dla wyszukiwarek internetowych. Chodzi, mówiąc prosto, bo z tym słowem większość internautów się zetknęła, o pozycjonowanie.

Nie zajmuję się tym zawodowo, ale jako właściciel kilku witryn internetowych dokładam starań, żeby ułatwić Google’owi ich odnalezienie. Uprawiam więc pozycjonowanie amatorskie. Chętnie korzystam przy tym z rad pozycjonerów, ale uważam, że trzeba się tym radom przyjrzeć krytycznie.

Jednym z zaleceń elementarnych z tego zakresu jest unikanie tzw. duplicate content, co po polsku najlepiej oddają słowa powielanie treści. Chodzi o to, że wyszukiwarki nie akceptują kopiowania treści i umieszczania jej pod różnymi adresami internetowymi. Za takie powielanie treści wyszukiwarki mogą nas ukarać. Znaczy nie będziemy widoczni w wynikach wyszukiwania, a więc wcale nas nie będzie.

Tak można wyczytać w pismach ekspertów SEO, w Internecie są nawet filmy, w których panowie z Google’a tłumaczą, jak to się dzieje.

Ale czy się naprawdę dzieje? A jeśli tak, to jak? O tym w następnym tekście.

czwartek, 15 grudnia 2011

Kogo powinien interesować Internet ukryty?

Problem ukrytego Internetu jest interesujący jeszcze z tego powodu, że większość artykułów na ten temat pochodzi sprzed kilku lat, a to - jak wiadomo - jest epoka w dziejach Sieci. Autorzy licznych publikacji często na przykład przytaczają dane z artykułu Michaela K. Bergmana The Deep Web: Surfacing Hidden Value. Jest to bez wątpienia publikacja godna zaufania, problem w tym, że pochodzi z roku 2001, opisuje więc głównie stan miniony.

Mając świadomość tego faktu, przytaczam za Bergmanem dane na temat zawartości ukrytego Internetu. Tu jednak, być może, nie zmieniło się szczególnie wiele, bo dane mówią o tym, jakich informacji można oczekiwać w nieznanej części Sieci. Najwięcej jest tych, które związane są z humanistyką (13,5 proc.) a także z wiadomościami i mediami (12,2). Inne działy wiedzy są wyraźnie skromniej reprezentowane, np. informatyka zajmuje ok 6,9 proc. danych ukrytego Internetu a sztuki piękne 6,6 proc.

Na koniec będzie dobra rada dla humanistów i medioznawców i medialnych praktyków: Szukajcie w ukrytym Internecie, a pewnie coś znajdziecie.