Google proti komentářovému spamu
Google se pouští do boje proti komentářovámu spamu, a to velice jednoduše, popis je v tomto článku (via Patrick Zandl), a řešení je podle Google použít tento XHTML kód:
text odkazu
Na první pohled to vypadá jako zajímavé řešení, nicméně, spammeři si z něj stejně nebudou nic dělat, čtenáři si na takovýto link bez problému kliknou, a navíc, Google není na světě sám, nebere to ohled na jiné Search Engines (seznam.cz, centrum.cz v ČR), a je to řešení polovičaté. Google by měl být sám schopen postihnout weby, na které vedou desítky tisíc spamových odkazů, a ne přenášet tuto tíhu na redakční systémy, navíc, takového hromadné řešení postihne veškeré odkazy v komentářích, tedy i ty legitimní, a těch je vždy drtivá většina.
Osobně to řeším ve své redakčním
systému jinak, koncepčně, přes NP_Captcha
(turing
test) plugin, pomocí autorizace komentářů a pomocí pluginu NP_SEO
(volitelný
redirect odkazů jen pro čtenáře, nikoliv pro google, seznam, a spol.).
Doplnění Google “řešení” do redakčního systému je otázka 1 řádku kódu a 5 sekund práce, ale, je to zcela nadbytečná věc, a nesmyslná, která při koncepčním řešení spíše škodí…
Jsem si ale jist, že se toto “řešení” Google ujme. Cokoliv, co je primitivní na implementaci, i když to je polo-funkční, se stane snadno populární :-)
Google neni na svete sam, ale uvaz ze ty tagy mohou pouzivat i ostatni vyhledavace :) Nicmene podle principu vyhledavani Google jakekoliv externi odkazy skodi. Tve strance se sbira page rank za kazdy externi odkaz, coz dokonale zabranuje link farmam, ktere nemuzou dneska existovat v tehle mire.
To, ze pouzivas redirect podle me neni ciste reseni. Zbytecne to zpomaluje a zvysuje zatez tveho serveru.
[1] mohou, dokonce je budou používat Yahoo a MSN, ale, že by se přidalo centrum.cz a seznam.cz, do si nemyslím, navíc, to neřeší problém toho, že většina odkazů v komentářích není spam..
PS: zátěž mého serveru to nezvyšuje, ale zátěž mého webhostingu, ale ta je s 4.000 UIP denně i tak dost vysoká :-)
[2] Moc te vysoke zatezi neverim, protoze to stejne vsechno tahas z cache :) Vubec koukam, ze BLOG:CMS je trosku rychlejsi nez jsem ocekaval :-o
[3] tak, tak, na toto jsem hrdej:
stránka se generovala: 0.00106 sekund, vytvořena v 17:22:58, 19.01.05, používá GZip: Ano, z cache: Ano
[4] No ja cache pouzivam uz dlouho, hlavne u Smarty je to snadne. Zvlastni je, ze velmi jednoducha metoda je vzit vsechny dotazy z databaze, serializovat, udelat MD5 a pod tim to ulozit. Pokud databaze ma query cache, tak ty casi generovani jsou tak kolem 1ms jako BLOG:CMS s tou vyhodou, ze clovek na to nemusi myslet. Cache v adminu? To si nikdo nelajsne, ale ja ano :)
Část o tom, že Seznam.cz a Centrum.cz nebudou tento atribut nejspíš podporovat, nedává smysl. Seznam.cz pokud vím používá pro fulltext Jyxo a Google, Centrum.cz zase Morfeo. Morfeo už podporu této značky zavedlo a u Jyxa na to myslím nebudeme dlouho čekat.