ČESKO a SLOVENSKO a jejich (téměř) validní RSS!
Technologie
12.03.04
Včera jsem zkoumal validitu, dle W3C norem, (X)HTML a CSS vybraných českých a slovenských blogů (dle toplist-50, a popostrčil jsem některé weby k tomu, aby pár, opravdu triviálních, věcí, opravili, a stali se validními), předtím jsem se věnoval subjektivnímu hodnocení jejich obsahu, a dnes bych se chtěl podívat na poslední část, a to validitu RSS exportů těchto webů.
Pokud je nabízených více verzí RSS exportů, zkoumal jsem preferenčně RSS verze 0.91/0.92. Jako validátor RSS jsem použil http://feedvalidator.org. Testování bylo provedeno 11.3.2004, od 16:00 do 16:05. V případě validity (X)HTML a CSS kódu může ještě někdo polemizovat o praktickém či akademickém smyslu této validity, v případě RSS exportu ale rozhodně ne, jedná se o XML dokument s přesně danou strukturou, a pokud tato struktura je odlišná, t.j. není validní, RSS export nemusí být vůbec čitelný pro RSS čtečky, které se chovají zcela podle norem.
Navíc, řada návštěvníků blogů používá právě RSS čtečky pro jejich monitorování.
Nevalidní RSS export je tedy MNOHEM větší problém, než (vědomě) nevalidní (X)HTML a CSS kód.
Weby s validním RSS:
Weby s nevalidním RSS:
Pokud je nabízených více verzí RSS exportů, zkoumal jsem preferenčně RSS verze 0.91/0.92. Jako validátor RSS jsem použil http://feedvalidator.org. Testování bylo provedeno 11.3.2004, od 16:00 do 16:05. V případě validity (X)HTML a CSS kódu může ještě někdo polemizovat o praktickém či akademickém smyslu této validity, v případě RSS exportu ale rozhodně ne, jedná se o XML dokument s přesně danou strukturou, a pokud tato struktura je odlišná, t.j. není validní, RSS export nemusí být vůbec čitelný pro RSS čtečky, které se chovají zcela podle norem.
Navíc, řada návštěvníků blogů používá právě RSS čtečky pro jejich monitorování.
Nevalidní RSS export je tedy MNOHEM větší problém, než (vědomě) nevalidní (X)HTML a CSS kód.
Doplnění: na základě konstruktivních připomínek Ronyho a V. Málka budu feedy o víkendu testovat i v RSS čtečkách a rovněž validátorem na http://www.walidator.com/. Tabulka validnosti RSS feedů (pokud je autoři opravili) v tomto článku upravována nebude, protože se k celé věci budu vracet, je ale možné se vyjádřit v komentářích...
A jak na tom tedy vybrané české a slovenské weblogy jsou?
Weby s validním RSS:
Weby s nevalidním RSS:
2. Černovláska http://www.cernovlaska.cz/
Odkaz na validátor RSS exportu.
Chyba: line 8, column 32: managingEditor must include an email address
Odkaz na validátor RSS exportu.
Chyba: line 8, column 32: managingEditor must include an email address
3. Pixylophone http://www.pixy.cz/blog/
Odkaz na validátor RSS exportu.
Chyba: line 9, column 40: lastBuildDate must be an RFC-822 date
Odkaz na validátor RSS exportu.
Chyba: line 9, column 40: lastBuildDate must be an RFC-822 date
15. Yuhův weblog o webu http://www.jakpsatweb.cz/weblog/
Odkaz na validátor RSS exportu.
Chyba: line 12, column 36: lastBuildDate must be an RFC-822 date
Odkaz na validátor RSS exportu.
Chyba: line 12, column 36: lastBuildDate must be an RFC-822 date
Převážně neškodný http://blog.maly.cz/
Odkaz na validátor RSS exportu.
Chyba: line 70, column 0: This feed contains conflicting DOCTYPE and version information
Odkaz na validátor RSS exportu.
Chyba: line 70, column 0: This feed contains conflicting DOCTYPE and version information
Holasí.net http://holasi.net/blog/
Odkaz na validátor RSS exportu.
Chyba 1: line 9, column 41: lastBuildDate must be an RFC-822 date
Chyba 2: line 10, column 44: webMaster must include an email address
Odkaz na validátor RSS exportu.
Chyba 1: line 9, column 41: lastBuildDate must be an RFC-822 date
Chyba 2: line 10, column 44: webMaster must include an email address
42. Přístupnost http://pristupnost.nawebu.cz/weblog/
Odkaz na validátor RSS exportu.
Chyba 1: line 15, column 13: width must be between 1 and 144
Chyba 2: line 34, column 20: Undefined description element: abbr
Chyba 3: line 34, column 156: Undefined description element: span
Odkaz na validátor RSS exportu.
Chyba 1: line 15, column 13: width must be between 1 and 144
Chyba 2: line 34, column 20: Undefined description element: abbr
Chyba 3: line 34, column 156: Undefined description element: span
u RSS by som nejake obsiahlejsie testy nerobil iba validatorom ale aj tym, ze ich otestujem v citackach.
napriklad ja mam 2 RSS - jedno z nich ponuka aj dalsie polia pre datum vydania, autora a kategoriu, co vie vyuzit napriklad FeedReader a ma to svoje klady.
Preto by som si pri testoch vzal aj par citaciek a pozrel sa ako su schopne RSS blogov vysporiadat sa s nimi.
Casto robi problemy napr. kodovanie...
[ad 1] jo, dobrej nápad Rony, o víkendu doplním praktické testy... :)
Mozna by misto zvyrazneni slova napsanim velkymi pismeny stalo za to zkusit i em nebo strong ;)
[ad 3] ale jo, strong a em používám rozhodně taky, ale... někdy prostě chci použít i VELKÁ PÍSMENA :evil:
U Přístupnosti bych tak přísný nebyl. Protože adresa weblogu je http://pristupnost.nawebu.c...
Takže když není RSS na homepage celého webu, tak to není IMHO takový problém. Zde bych stejně očekával spíše RSS s novinkami a ne RSS s weblogem...
Pokud jde o validaci RSS, jsou příslušné nástroje ještě hluboko pod úrovní validace CSS a HTML. Doporučil bych provádět validaci přinejmenším všemi RSS/RDF nástroji na http://www.walidator.com - těžko dosáhnete validity ve všech, a to jsou pouze ty základní ;~)
Přístupnost má pouze RSS weblogu a tudíž je RSS odkazováno pouze z weblogu. URL je http://pristupnost.nawebu.c...
Bylo by možné tu tabulku upravit?
Jinak díky za popíchnutí, umístím odkaz na RSS i na titulku celého webu.
diky za tenhle vyzkum, diky nemu se taky prisel na chybu ve formatu datumu (RFC-822).
mozna pro ostatni aby nemuseli hledat tak dlouho jako ja :-):
1. datum ma mit tento format (napr): Wed, 02 Oct 2002 08:00:00 EST
2. takze vetsinou tam vsem chybi oznaceni dne v tydnu
3. pak pozor na casovou zonu! CET neni v RFC definovana! takze je lepsi pouzit casovy posun +0100
4. uplne nejlip to v PHP vyresite funkci: date("r");
tot vse ..
Hmmm, RSS jsem nedávno překopal (a obšlehl od Pixyho :wink: ), proto chyba v datu.
Ta druhá chyba je docela k smíchu:
webMaster must include an email address
<webMaster>Richard Holas (risa@holasi.net)</webMaster>
Ten validator není ideální...
[ad 5] jo, já vím, ale já beru "homepage" weblogu, tak jak je registrovaná na toplistu, a tam má David jako homepage URI bez weblog...
Díky za výtky. Chyby v RSS jsem na weblogu Přístupnost opravil.
Malé OT: Nevím, nevím, jestli je ten výběr odkazů z Google dobře řešen. Vidím tam odkaz na jeden článek z Interval.cz, kupodivu nikoli na základní referenční, ale na příkladovou aplikaci v .NET ;~)
[ad 12] lépe to dělat nejde, používám Google API a hledám frázi validní RSS, toto je to, co mi google vrátí, a navíc, pokud je nějaká doména vícekrát, tak beru jen tu první (měla by být nejrelevantnější), ale samozřejmě i s celým URI článku, jinak by to nemělo smysl.. IMO se to už lépe dělat nedá, ale pokud máte nápad, sem s ním! :)
[ad 12] Nápad na lepší metodu, bohužel nemám, to by nejdříve musel Google sám logičtěji indexovat stránky a především pak vracet výsledky. Jen jsem si dovolil poukázat, že výsledek, přestože velmi zajímavý, zkrátka může být i kontraproduktivní ;~)
Díky za pěkný článek - další argument, proč se RSS vyhýbat, co to jen jde. RSS je jako socialismus - také by bylo úplně perfektní, jen lidi to pořád kazí :P
[15] fsbsbb