Wikipedia:Archiwum/Co ciekawego jest w logach Wikipedii
Z Wikipedii
Referery raw
Referery ludzi odwiedzających Wikipedię, to czego było przynajmniej 10. Wnioski:
- Najważniejszym refererem jest Polska Wikipedia
- Drugim jest google
- szukacz.pl, WP, Yahoo, MSN, AllTheWeb i cała reszta nie są w dostatecznym stopniu wykorzystywane !
- W sprawie katalogu ONETu, patrz niżej
136338 http://pl.wikipedia.org 39719 - 21088 20775 http://www.google.pl 5198 http://www.google.com 1644 http://www.szukacz.pl 1627 http://szukaj.wp.pl 856 http://www.wikipedia.org 847 http://search.yahoo.com 430 http://pl.wikipedia.com 281 http://www.google.de 222 http://search.msn.com 166 http://de.wikipedia.org 164 http://www.emulti.pl 155 http://katalog.onet.pl 146 http://216.239.39.100 137 http://www.alltheweb.com 103 http://www.google.ca 84 http://test.wikipedia.com 76 http://es.wikipedia.org 64 http://www.google.fr 60 http://images.google.com 54 http://www.vagla.pl 51 http://www.google.lt 51 http://fr.wikipedia.org 44 http://forum.battlenet.pl 40 http://meta.wikipedia.org 38 http://www.google.com.pl. 37 http://wiki.rozeta.com.pl 35 http://eo.wikipedia.org 34 http://www2.gazeta.pl 34 http://www.panoramafirm.com.pl 34 http://www.google.com. 34 http://216.239.51.100 33 http://szukaj.gery.pl 32 http://www.google.at 31 http://www.google.pl. 30 http://asterix.wonder.pl 29 http://uk.google.yahoo.com 29 http://search.netscape.com 29 http://pl.wikipedia.org. 28 http://www.google.it 27 http://search.evreka.passagen.se 24 http://www.google.com.br 24 http://nl.wikipedia.org 23 http://www.google.be 22 http://szukaj.onet.pl 22 http://buscador.terra.es 21 http://www.google.co.jp 21 http://asterix.rat.galaxy.pl 21 http://aolsearch.aol.com 18 http://216.239.53.100 17 http://www.google.nl 17 http://216.239.33.100 16 http://www.google.co.uk 16 http://www.google 16 http://ww.google.pl 16 http://216.239.37.100 15 http://www.osp-konieczkowa.xo.pl 15 http://www.iaea.org 15 http://search.virgilio.it 14 http://ww.google.com 14 http://search.lycos.com 14 http://emulti.pl 13 http://www.siec.pl 13 http://www.google.ch 13 http://google 12 http://search.dogpile.com 12 http://msxml.excite.com 11 http://www.xupiter.com 11 http://www.freenet.de 11 http://szukaj.gazeta.pl 11 http://sv.wikipedia.org 11 http://search1.seznam.cz 10 http://www.pl.wikipedia.org 10 http://webferret.search.com 10 http://search.earthlink.net 10 http://nerdquiz.sgh.waw.pl
Katalog Onetu
49 http://katalog.onet.pl/internet_i_komputery/oprogramowanie/jezyki_programowania/jezyk_programowania_ada/ 84 http://katalog.onet.pl/kultura_i_sztuka/literatura/ksiazki/encyklopedie/ 22 http://katalog.onet.pl/nauka_i_edukacja/nauki_spoleczne_humanistyczne/jezyki_inne/
Wnioski
- Musimy polepszyć swoje relacje z innymi wyszukiwarkami
- Musimy powrzucać paręset najlepszych artykułów do różnych katalogów. 3 artykuły w katalogu okazały się mieć całkiem spory efekt. 600 proporcjonalnie (czyli 1000 w praktyce) miało by taki efekt jak google !!!
- Ciekawe byłoby dowiedzieć się czego najczęściej wyszukiwano w wewnętrznej (wikipediowej) wyszukiwarce.
Kpjas nie gru 15 22:31:03 CET 2002
Nie konwertowałem %, bo starsze są w ISO a nowsze w Unikodzie, więc było by z tym dużo roboty. Jak dla mnie większość tych wyników jest całkowicie bezsensowna i żeby dostać jakieś sensowne wyniki trzeba by liczyć z ilu hostów dane wyszukiwanie zostało wykonane.
A nie, jest jeden mądry wniosek - jeśli wyszukiwanie nie zawiera żadnych pliter, należy uznać że 'a' pasuje do 'ą' itd. Ale to może generować false positives, więc przydała by się opcja "Bez polskich liter". Taw 01:20, 16 gru 2002 (CET)
148 %25s 138 26 wirus+%C5%BC%C3%B3%C5%82tej+kar%C5%82owacizny+ziemniakan%C4%85cych+nakrapianych+pomidor%C3%B3w 18 toczkowce 16 konstytucja 15 legiony+rzymskie 15 kolonializm 15 DOS 14 wirus+wi%C4%99dn%C4%85cych+nakrapianych+pomidor%C3%B3w 14 wirus+%C5%BC%C3%B3%C5%82tej+kar%C5%82owacizny+ziemniaka 14 turbina+peltona 14 internet 14 PIENIADZ+ELEKTRONICZNY 14 Enancjomery 13 szkola+podchor%C4%85%C5%BCych+w+poznaniu 13 calderon+gonzalez+cantu+syndrome 12 patenty 12 marek+kota%C5%84ski 12 definicja+cz%C5%82owieka 11 wy%C5%BCyna+kielecko-sandomkierska 11 taoizm 11 sukces+zyciowy+organizmow 11 orz%C4%99ski 11 nadnercza 11 maksymin+trak 11 kultura 11 expres+i+kawa 11 Surowce+w+Polsce 10 zarz%C4%85dzanie+cywilne 10 wojna+futbolowa 10 glewiki 10 fizyka 10 ekologia 10 celtowie 9 zwi%C4%85zki+toksyczne 9 sztuka+renesansu 9 rasy+ludzkie 9 polska 9 kryptarytm 9 fermentacja+octowa 9 Nizina+Mazowiecka 8 telefon 8 sekretarze+generalni+PZPR 8 obserwacja 8 nizina+wielkopolska 8 liczby+doskona%C5%82e 8 j%C4%99zyki 8 html 8 hey 8 hawaje 8 handel+elekroniczny 8 chill 8 cajg 8 budowa+geologiczna+polwyspu+iberyjskiego 8 akr 8 ZATRUCIA 8 Rewolucja+w+Anglii 8 Kota%C5%84ski 8 ICMP 8 IANA 8 Edward+Stachura 7 uklad+ruchowy+pierwotniakow 7 turbina+kaplane 7 stwosz 7 rolnictwo 7 rodzaje+teorii 7 python 7 punkt+izoelektryczny 7 przedsi%C4%99biorstwo 7 postet+cywilizacyjny 7 nizina+mazowiecka 7 mszaki 7 lisp 7 kr%C4%85%C5%BCkop+%C5%82awy 7 homofobia 7 gospodarka 7 glony 7 edukacja 7 becquerel 7 Wikipedysta 7 TR%C3%93JK%C4%84T+PROSTOK%C4%84TNY 7 Szwecja 7 RETINGER 7 OS 7 Morze+Kaspijskie 7 MODEL 7 London+Stock+Exchange 7 Europejska+Liga+Wsp%C3%B3%C5%82pracy+Gospodarczej 7 Bitmapa 7 1945 7 %27%27logp+firmowe%27%27 6 zabytki 6 wynalazki 6 wrotki 6 wolna+wola 6 wirus 6 wi%C4%85zanie+kleszczowe 6 turbina+wodna 6 trzeci+migdal 6 teorie+lokalizacji 6 tajwan 6 ta%C5%84ce+wielkopolski 6 ssl 6 sex 6 ruch 6 rokossowski 6 reformy+grabskiego 6 rachunek+predykat%C3%B3w 6 przygotowanie+podobrazia 6 protista 6 polskie+linie+oceaniczne 6 pensylwania 6 parki+narodowe+europy 6 og%C3%B3rek 6 mobilno%C5%9B%C4%87 6 manchester 6 konspekty+z+chemii 6 komunizm 6 informacja 6 haiku 6 formy+pa%C5%84stw 6 empatia 6 dysocjacja 6 czas 6 Stanis%C5%82aw+August+Poniatowski 6 Skytruck 6 SUDETY 6 KOMPRESJA+PALIWA 6 Jadwiga+Korczakowska 6 Francja 6 ENTROPIA 6 Brazylia 6 Amor 6 %C5%82agiew