Google proti komentářovému spamu

MyEgo.cz

home foto blogy mywindows.cz kontakt

Google proti komentářovému spamu

Google 19.01.05

Google se pouští do boje proti komentářovámu spamu, a to velice jednoduše, popis je v tomto článku (via Patrick Zandl), a řešení je podle Google použít tento XHTML kód:

text odkazu

Na první pohled to vypadá jako zajímavé řešení, nicméně, spammeři si z něj stejně nebudou nic dělat, čtenáři si na takovýto link bez problému kliknou, a navíc, Google není na světě sám, nebere to ohled na jiné Search Engines (seznam.cz, centrum.cz v ČR), a je to řešení polovičaté. Google by měl být sám schopen postihnout weby, na které vedou desítky tisíc spamových odkazů, a ne přenášet tuto tíhu na redakční systémy, navíc, takového hromadné řešení postihne veškeré odkazy v komentářích, tedy i ty legitimní, a těch je vždy drtivá většina.

Osobně to řeším ve své redakčním systému jinak, koncepčně, přes NP_Captcha (turing test) plugin, pomocí autorizace komentářů a pomocí pluginu NP_SEO (volitelný redirect odkazů jen pro čtenáře, nikoliv pro google, seznam, a spol.).

Doplnění Google “řešení” do redakčního systému je otázka 1 řádku kódu a 5 sekund práce, ale, je to zcela nadbytečná věc, a nesmyslná, která při koncepčním řešení spíše škodí

Jsem si ale jist, že se toto “řešení” Google ujme. Cokoliv, co je primitivní na implementaci, i když to je polo-funkční, se stane snadno populární :-)


Komentáře

  1. 1 markon2 19.01.05, 01:01:57
    FB

    Google neni na svete sam, ale uvaz ze ty tagy mohou pouzivat i ostatni vyhledavace :) Nicmene podle principu vyhledavani Google jakekoliv externi odkazy skodi. Tve strance se sbira page rank za kazdy externi odkaz, coz dokonale zabranuje link farmam, ktere nemuzou dneska existovat v tehle mire.

    To, ze pouzivas redirect podle me neni ciste reseni. Zbytecne to zpomaluje a zvysuje zatez tveho serveru.

  2. 2 Radek Hulán 19.01.05, 02:01:59
    FB

    [1] mohou, dokonce je budou používat Yahoo a MSN, ale, že by se přidalo centrum.cz a seznam.cz, do si nemyslím, navíc, to neřeší problém toho, že většina odkazů v komentářích není spam..

    PS: zátěž mého serveru to nezvyšuje, ale zátěž mého webhostingu, ale ta je s 4.000 UIP denně i tak dost vysoká :-)

  3. 3 markon2 19.01.05, 05:01:21
    FB

    [2] Moc te vysoke zatezi neverim, protoze to stejne vsechno tahas z cache :) Vubec koukam, ze BLOG:CMS je trosku rychlejsi nez jsem ocekaval :-o

  4. 4 Radek Hulán 19.01.05, 05:01:23
    FB

    [3] tak, tak, na toto jsem hrdej: stránka se generovala: 0.00106 sekund, vytvořena v 17:22:58, 19.01.05, používá GZip: Ano, z cache: Ano

  5. 5 markon2 19.01.05, 10:01:47
    FB

    [4] No ja cache pouzivam uz dlouho, hlavne u Smarty je to snadne. Zvlastni je, ze velmi jednoducha metoda je vzit vsechny dotazy z databaze, serializovat, udelat MD5 a pod tim to ulozit. Pokud databaze ma query cache, tak ty casi generovani jsou tak kolem 1ms jako BLOG:CMS s tou vyhodou, ze clovek na to nemusi myslet. Cache v adminu? To si nikdo nelajsne, ale ja ano :)

  6. 6 Jakub Vrána 20.01.05, 04:01:41
    FB

    Část o tom, že Seznam.cz a Centrum.cz nebudou tento atribut nejspíš podporovat, nedává smysl. Seznam.cz pokud vím používá pro fulltext Jyxo a Google, Centrum.cz zase Morfeo. Morfeo už podporu této značky zavedlo a u Jyxa na to myslím nebudeme dlouho čekat.