ČESKO a SLOVENSKO a jejich (téměř) validní RSS!

MyEgo.cz

home foto blogy mywindows.cz kontakt

ČESKO a SLOVENSKO a jejich (téměř) validní RSS!

Technologie 12.03.04
Pěkná bloggerka čte moje validní RSS!
Včera jsem zkoumal validitu, dle W3C norem, (X)HTML a CSS vybraných českých a slovenských blogů (dle toplist-50, a popostrčil jsem některé weby k tomu, aby pár, opravdu triviálních, věcí, opravili, a stali se validními), předtím jsem se věnoval subjektivnímu hodnocení jejich obsahu, a dnes bych se chtěl podívat na poslední část, a to validitu RSS exportů těchto webů.

Pokud je nabízených více verzí RSS exportů, zkoumal jsem preferenčně RSS verze 0.91/0.92. Jako validátor RSS jsem použil http://feedvalidator.org. Testování bylo provedeno 11.3.2004, od 16:00 do 16:05. V případě validity (X)HTML a CSS kódu může ještě někdo polemizovat o praktickém či akademickém smyslu této validity, v případě RSS exportu ale rozhodně ne, jedná se o XML dokument s přesně danou strukturou, a pokud tato struktura je odlišná, t.j. není validní, RSS export nemusí být vůbec čitelný pro RSS čtečky, které se chovají zcela podle norem.

Navíc, řada návštěvníků blogů používá právě RSS čtečky pro jejich monitorování.

Nevalidní RSS export je tedy MNOHEM větší problém, než (vědomě) nevalidní (X)HTML a CSS kód.

Doplnění: na základě konstruktivních připomínek Ronyho a V. Málka budu feedy o víkendu testovat i v RSS čtečkách a rovněž validátorem na http://www.walidator.com/. Tabulka validnosti RSS feedů (pokud je autoři opravili) v tomto článku upravována nebude, protože se k celé věci budu vracet, je ale možné se vyjádřit v komentářích...

A jak na tom tedy vybrané české a slovenské weblogy jsou?

Validní RSS!
No, je to lepší než u validity HTML a CSS kódu. Ze 16 sledovaných webů, jich 9 má RSS export plně validní, 6 webů obsahuje drobné chyby, a 1 RSS export vůbec nenabízí (zkoumal jsem jen titulní stranu, je možné, že RSS export je někde "schován", což je ale téměř totéž, jako by nebyl nabízen...).

Weby s validním RSS:
6. Hlava.net http://www.hlava.net/
Odkaz na validátor RSS exportu.
8. Marigold.cz http://www.marigold.cz/
Odkaz na validátor RSS exportu.
9. About http://www.zpravy.net/
Odkaz na validátor RSS exportu.
19. Arsinoe http://www.minimag.cz/arsinoe
Odkaz na validátor RSS exportu.
24. Oříšek.net (weblog) http://www.orisek.net/
Odkaz na validátor RSS exportu.
27. conBlog http://blog.converter.cz/
Odkaz na validátor RSS exportu.
31. Občasný O'blog https://myego.cz/
Odkaz na validátor RSS exportu.
41. Trillian http://trillian.bloguje.cz/
Odkaz na validátor RSS exportu.
Sova v síti http://www.sovavsiti.cz/weblog/
Odkaz na validátor RSS exportu.


Weby s nevalidním RSS:
2. Černovláska http://www.cernovlaska.cz/
Odkaz na validátor RSS exportu.
Chyba: line 8, column 32: managingEditor must include an email address
3. Pixylophone http://www.pixy.cz/blog/
Odkaz na validátor RSS exportu.
Chyba: line 9, column 40: lastBuildDate must be an RFC-822 date
15. Yuhův weblog o webu http://www.jakpsatweb.cz/weblog/
Odkaz na validátor RSS exportu.
Chyba: line 12, column 36: lastBuildDate must be an RFC-822 date
Převážně neškodný http://blog.maly.cz/
Odkaz na validátor RSS exportu.
Chyba: line 70, column 0: This feed contains conflicting DOCTYPE and version information
Holasí.net http://holasi.net/blog/
Odkaz na validátor RSS exportu.
Chyba 1: line 9, column 41: lastBuildDate must be an RFC-822 date
Chyba 2: line 10, column 44: webMaster must include an email address
42. Přístupnost http://pristupnost.nawebu.cz/weblog/
Odkaz na validátor RSS exportu.
Chyba 1: line 15, column 13: width must be between 1 and 144
Chyba 2: line 34, column 20: Undefined description element: abbr
Chyba 3: line 34, column 156: Undefined description element: span


Komentáře

  1. 1 rony 12.03.04, 01:03:28
    FB

    u RSS by som nejake obsiahlejsie testy nerobil iba validatorom ale aj tym, ze ich otestujem v citackach.

    napriklad ja mam 2 RSS - jedno z nich ponuka aj dalsie polia pre datum vydania, autora a kategoriu, co vie vyuzit napriklad FeedReader a ma to svoje klady.

    Preto by som si pri testoch vzal aj par citaciek a pozrel sa ako su schopne RSS blogov vysporiadat sa s nimi.

    Casto robi problemy napr. kodovanie...

  2. 2 Radek Hulán 12.03.04, 01:03:32
    FB

    [ad 1] jo, dobrej nápad Rony, o víkendu doplním praktické testy... :)

  3. 3 Vita/Marabu 12.03.04, 01:03:44
    FB

    Mozna by misto zvyrazneni slova napsanim velkymi pismeny stalo za to zkusit i em nebo strong ;)

  4. 4 Radek Hulán 12.03.04, 01:03:47
    FB

    [ad 3] ale jo, strong a em používám rozhodně taky, ale... někdy prostě chci použít i VELKÁ PÍSMENA :evil:

  5. 5 Petr Weida 12.03.04, 06:03:11
    FB

    U Přístupnosti bych tak přísný nebyl. Protože adresa weblogu je http://pristupnost.nawebu.c...

    Takže když není RSS na homepage celého webu, tak to není IMHO takový problém. Zde bych stejně očekával spíše RSS s novinkami a ne RSS s weblogem...

  6. 6 Vilém Málek 12.03.04, 10:03:01
    FB

    Pokud jde o validaci RSS, jsou příslušné nástroje ještě hluboko pod úrovní validace CSS a HTML. Doporučil bych provádět validaci přinejmenším všemi RSS/RDF nástroji na http://www.walidator.com - těžko dosáhnete validity ve všech, a to jsou pouze ty základní ;~)

  7. 7 David Špinar 12.03.04, 10:03:04
    FB

    Přístupnost má pouze RSS weblogu a tudíž je RSS odkazováno pouze z weblogu. URL je http://pristupnost.nawebu.c...

    Bylo by možné tu tabulku upravit?

    Jinak díky za popíchnutí, umístím odkaz na RSS i na titulku celého webu.

  8. 8 rawe 12.03.04, 10:03:19
    FB

    diky za tenhle vyzkum, diky nemu se taky prisel na chybu ve formatu datumu (RFC-822).

    mozna pro ostatni aby nemuseli hledat tak dlouho jako ja :-):

    1. datum ma mit tento format (napr): Wed, 02 Oct 2002 08:00:00 EST

    2. takze vetsinou tam vsem chybi oznaceni dne v tydnu

    3. pak pozor na casovou zonu! CET neni v RFC definovana! takze je lepsi pouzit casovy posun +0100

    4. uplne nejlip to v PHP vyresite funkci: date("r");

    tot vse ..

  9. 9 Richard H. 12.03.04, 10:03:25
    FB

    Hmmm, RSS jsem nedávno překopal (a obšlehl od Pixyho :wink: ), proto chyba v datu.

    Ta druhá chyba je docela k smíchu:

    webMaster must include an email address

    <webMaster>Richard Holas (risa@holasi.net)</webMaster>

    Ten validator není ideální...

  10. 10 Radek Hulán 12.03.04, 12:03:19
    FB

    [ad 5] jo, já vím, ale já beru "homepage" weblogu, tak jak je registrovaná na toplistu, a tam má David jako homepage URI bez weblog...

  11. 11 David Špinar 12.03.04, 12:03:30
    FB

    Díky za výtky. Chyby v RSS jsem na weblogu Přístupnost opravil.

  12. 12 Vilém Málek 12.03.04, 01:03:16
    FB

    Malé OT: Nevím, nevím, jestli je ten výběr odkazů z Google dobře řešen. Vidím tam odkaz na jeden článek z Interval.cz, kupodivu nikoli na základní referenční, ale na příkladovou aplikaci v .NET ;~)

  13. 13 Radek Hulán 12.03.04, 01:03:27
    FB

    [ad 12] lépe to dělat nejde, používám Google API a hledám frázi validní RSS, toto je to, co mi google vrátí, a navíc, pokud je nějaká doména vícekrát, tak beru jen tu první (měla by být nejrelevantnější), ale samozřejmě i s celým URI článku, jinak by to nemělo smysl.. IMO se to už lépe dělat nedá, ale pokud máte nápad, sem s ním! :)

  14. 14 Vilém Málek 12.03.04, 01:03:29
    FB

    [ad 12] Nápad na lepší metodu, bohužel nemám, to by nejdříve musel Google sám logičtěji indexovat stránky a především pak vracet výsledky. Jen jsem si dovolil poukázat, že výsledek, přestože velmi zajímavý, zkrátka může být i kontraproduktivní ;~)

  15. 15 Jirka Lahvička 14.03.04, 03:03:52
    FB

    Díky za pěkný článek - další argument, proč se RSS vyhýbat, co to jen jde. RSS je jako socialismus - také by bylo úplně perfektní, jen lidi to pořád kazí :P

  16. 16 sfb 18.03.04, 08:03:20
    FB

    [15] fsbsbb