The Turkey Curse
fukamis terror chatroom

Beobachtungen in der deutschsprachigen Blogosphäre

Pungenday, 55th Discord, 3172.

Von Berufs wegen beschäftige ich mich ziemlich ausgiebig mit der deutschsprachigen Blogosphäre. Dabei sind mir einige nervige, aber auch interessante Sachen aufgefallen, die ich in aller Kürze erläutern will. Das soll nur mal eine allererste Betrachtung sein, keine tiefschürfenden Aussage zum tatsächlichen Zustand.

  • Nicht-RFC 1035-konforme Domains
    Vor einiger Zeit habe ich festgestellt, dass eine Funktion von Ruby bei bestimmten Domains Fehler wirft, wohingegen bei anderen Sprachen, wie z.B. PHP, diese Fehler nicht auftauchen. Astro machte mich auf RFC 1035 aufmerksam. In “2.3.1. Preferred name syntax” des RFCs steht, dass Domains aus den 52 Buchstaben (a-z und A-Z), sowie den Zahlen 0-9 und Bindestrichen bestehen dürfen. Die Ruby-Klasse URI ist RFC 1035-konform, d.h. (Sub-)Domains, die Unterstriche beinhalten, werden als “Invalid Domain” nicht verarbeitet, PHP hingegen verarbeitet auch nicht-RFC-konforme Domains. Die Auswirkung ist letztendlich, dass User, die beispielsweise bei Bloghostern gehostet werden, die so etwas zulassen, sich nicht wundern sollten, warum ihre Blogs an bestimmten Stellen nicht auftauchen. Somit sollten Bloghoster diese Art von Subdomains meiner Meinung nach grundsätzlich nicht zulassen.

  • Feeds im Allgemeinen und im Speziellen
    Mittlerweile bieten die meisten Blogs Full Feeds an. Das ist gut so, den damit ist der Aufwand für das Spidern von Inhalten wesentlich einfacher, denn einzelne Artikel aus HTML heraus zu popeln ist überaus nervig, fehlerbehaftet und viel zu teuer. Deswegen verzichte ich erstmal auf das Monitoring von Blogs ohne Full Feed. Nichtsdestotrotz verdienen die allermeisten Feeds nicht wirklich die XML-Deklaration auf der ersten Zeile. Was es nicht alles für kranken Scheiss gibt. Es gibt doch mittlerweile so tolle Services wie W3C Feed Validation Service. Dinge wie “content:encoded” sind eher ein grundsätzliches Problem von Systemen wie WordPress, aber das ist noch das Geringste, da die Feeds meistens dennoch valid sind. Viel schlimmer sind Feeds, die nicht einmal wohlgeformt sind. Was man da teilweise zu sehen bekommt ist echt zum Davonlaufen.

  • Tagging
    “Richtig” angewendet sind Tags ein echter Segen, weil man damit, bei aller Unschärfe, eine Menge der Inhalte generisch erkennen kann. Schlimm sind allerdings so Sachen wie Artikel, in denen del.icio.us-Links des letzten Tages gepostet werden. Die Ergebnisse sind, zumindest aus Sicht einer automatischen Verarbeitung, eine Katastrophe. Dort stehen dann beispielsweise 10 bis 20 del.icio.us-Tags und 2-3 externe Ressourcen, die alle nicht wirklich was miteinander zu tun haben. Solche Einträge sind praktisch Spam und ich bin geneigt, derlei Einträge auch so zu behandeln.

  • Spings und Splogs
    Waren Spampings und Spamblogs füher vor allem ein Problem der amerikanischen Blogosphäre, gibt es mehr und mehr solchen Unrats auch in deutsch und von deutschsprachigen Domains. Vielleicht ist das ja ein Zeichen dafür, dass die Bedeutung von Weblogs auch hier zugenommen hat. Letztendlich kann ich schon jetzt sagen, dass bisher mindestens 2/3 aller Pings Spam sind, Tendenz stark steigend. Deswegen werden die Blacklisting-Mechanismen überaus rigoros sein und eher verschärft.

In nächster Zeit habe ich vor, dazu noch etwas ausführlicher zu schreiben, da mir noch weitere Dinge aufgefallen sind, die teilweise eine etwas ausufernde Beschreibung erfordern. Vielleicht hebe ich mir das aber auch für einen der nächsten Webmontage auf.

---

5 Comments »

  1. Nee, bloggen bitte. Ich war gespannt und bin es weiterhin.

    Comment by Astro — Pungenday, 55th Discord, 3172. @ 46128

  2. Amen. Mehr davon!

    Allerdings gehst Du IMHO unzulässigerweise davon aus, dass es das erstrebenswerte Ziel eines jeden Bloggers sei, maschinell verarbeitbar zu sein und etwas zu der ominösen Schwarmintelligenz durch Taggen beizutragen.

    Comment by ralle — Pungenday, 55th Discord, 3172. @ 53466

  3. @Ralle: Naja, ich gehe davon aus, dass Leute die Tags benutzen auch verstehen was Tags sind und wozu sie nutze sind. Bringt ja sonst gor nix :-)

    Comment by fukami — Pungenday, 55th Discord, 3172. @ 54288

  4. Davon würde ich nicht ausgehen. ;-) Das gilt nur in definierten Gruppen von Leuten oder bei Individuen.

    Mein Lieblingsbeispiel: Das Tag “Wiki” verwenden, wenn man einen Artikel zum Thema, sagen wir, “Tofu-Würstchen,” in einem Koch-Wiki gefunden hat. Ich tagge ja auch nicht jeden Artikel der Rundschau zum Thema X, den ich in deli aufbewahre, mit “Zeitung”. Und so gibt es zahlreiche Beispiele, die nicht so offensichtlich sind. Aber klar ist: Kollektives Taggen taugt global nicht zur Katalogisierung der Informationen der Welt.

    Comment by ralle — Pungenday, 55th Discord, 3172. @ 60090

  5. also domains mit unterstrichen sind auch bei exim nicht verarbeitbar - ganz zu schweigen von squid (soweit ich weiss)

    Comment by Olli — Pungenday, 55th Discord, 3172. @ 70390

RSS feed for comments on this post. | TrackBack URI

Leave a comment



The human race is faced with a cruel choice: work or daytime television.

The Turkey Curse is powered by WordPress, template idea by Priss

Entries (RSS) and Comments (RSS).
Generated in 0.158 seconds.