The Turkey Curse
fukamis terror chatroom

To tag or not to tag

Prickle-Prickle, 56th Discord, 3172.

Noch bevor die Diskussion mit Ralle zum Thema “Do’s and Dont’s von Tags” ausufert, versuche ich mal meine Gedanken darum zusammenzufassen.

Tags können, sofern man sich nicht als ausschliesslichen Index auf sie verlässt, probates Mittel sein, um Inhalte grob zu beschreiben. Wie auch Tim schon Mal sehr treffend irgendwo erläuterte, ist die Anwendung und Auswertung von Tags allerdings praktisch eine Wissenschaft für sich und wird nach Gusto von jedem unterschiedlich gehandhabt: Wird Ein- oder Mehrzahl gewählt, deutsch oder englisch, werden einzelne Worte getrennt oder mit Unterstrichen zusammengeschrieben usw.usf. Wenn man sich klar macht, dass bei del.icio.us einer der meistverwendeten Tags web ist, kann man sich vorstellen, wie unscharf die allermeisten Tags angewendet werden — was in den meisten Fällen dennoch ganz okay ist. Ein anderes aus meiner Sicht schönes Beispiel einer falschen Benutzungvon Tags ist ruby on rails als del.icio.us-Tag, der vor allem für eines sorgt, nämlich dass man den Tagfeed zu Ruby nicht mehr sinnvoll benutzen kann, da daraus 3 Tags entstehen: ruby, on und rails. Dabei wäre der richtige Tag bei diesem speziellen System wohl eher rubyonrails oder rubyonrails.

Als weiteres Beispiel verlinke ich mal ganz frech auf eine Unart, die schon immer ganz furchtbar fand und nun sogar ein gewisses Problem für mich darstellt, nämlich del.icio.us-Feeds in Blogartikeln. Als Beispiel diene ein Eintrag aus dem Weblog von Carsten Dobschat mit dem Titel links for 2006-05-06. Darin finden sich Informationen, die für Menschen relativ gut lesbar sind, mal davon abgesehen, ob man solche Sachen in Weblog-Feeds generell gut findet und nicht der Meinung ist, dies gehöre wahlweise separat in eine Seitenleiste des Blogs oder einfach als Link auf den entsprechenden persönlichen Linkfeed, der ohnehin schon vorliegt.

Carsten verlinkt auf einen Artikel in der Telepolis ( Verkommene Sitten), einen Blogeintrag zu Port Knocking (Port Knocking für ssh - Zugschlusbeobachtungen) und einer Seite, von der man Hintergründe und Texturen herunterladen kann (megapoxy.net). Die Tags, die in diesem Artikel enthalten sind, nach Alphabet sortiert: backgrounds, debian, free, gallery, german, graphics, howtos, images, linux, networking, patterns, politics, security, textures. Somit sind die Tags innerhalb des Artikels praktisch nicht für eine sinnvolle automatische Auswertung zu gebrauchen. Ansonsten verwendet Carsten keine Tags, sondern nur Kategorien, die im Kern noch wesentlich unschärfer sind.

Übrigens kann ich Ralfs Argument, nicht jeder Blogger wolle vollautomatisiert erfassbar und kategorisierbar sein, kann nicht so ganz teilen. Wenn dem so wäre, warum setzen die entsprechenden Blogger keine robots.txt in ihre Homedirs, um Crawler davon abzuhalten, die Artikel zu spidern? Und warum bieten sie RSS-Feeds an? Das sind alles Technologien, die auf Syndikation und Automatisierung ausgelegt sind, nicht mehr und nicht weniger. Wenn sie aber zur Diskusssion betragen wollen (und das wollen wohl die Allermeisten in der einen oder anderen Form), dann sind sie darauf angewiesen, das ihre Artikel sinnvoll verarbeitet werden können. Tags sind, wie schon erwähnt, sicher nicht das einzige Mittel zur sinnvollen Indizierung und man wird niemals um einen echten Textindex herumkommen. Aber sie können eine grosse Hilfe sein, sofern damit vernüftig umgegangen wird. Als gutes Beispiel dafür sehe ich die Artikel, in denen Dinge beschrieben werden und die entsprechenden Tags nicht im Artikel selbst als Worte auftauchen. Grade bei Artikeln, die sich um politische Inhalte drehen, kann das sehr wohl einen echten Benefit bringen.

Für die l33t3n Hardcore-Blogger unter den Lesern sage ich sicher überhaupt nichts Neues, aber die Diskussion um eine sehr vereinfachte Form semantischer Erfassung von Inhalten im Web kann man wohl nicht oft genug führen.

---

4 Comments »

  1. Was bin ich böse… g ich bookmarke, tagge und blogge nur für mich, ohne mir Gedanken darüber zu machen, ob und wie man das alles, was ich da so zusammen trage automatisch erfasst werden kann… Sorry, aber so ist das eben: meine Zielgruppe bin ich selber.

    Klar kann man der Meinung sein, dass die del.icio.us-Posts eigentlich nix im normalen Blog zu suchen haben, ich kann Deine Argumente auch gut nachvollziehen - von Deinem Standpunkt (alles automatisch erfassen und auswerten) ganz logisch. Aber die meisten Menschen bloggen wahrscheinlich nicht, damit alles was sie schreiben vollautomatisch erfassbar und kategorisierbar wird. Das mag ein Nebeneffekt sein, weil man Google & Co. eben nicht aussperrt und den Lesern(!) einen RSS-Feed anbietet… In dem Punkt liegst Du daneben: nur weil man nicht aktiv gegen eine automatische Erfassung des eigenen Weblogs vorgeht heisst das nicht, dass man die automatische Erfassung unbedingt möchte! Es ist einfach nur ein Nebeneffekt, den man mit nimmt.

    Wie beim Taggen: wenn ich ganz nebenbei etwas zu dieser “ominösen Schwarmintelligenz” beitragen kann ist ja prima. Aber ralle hat es ja schon geschrieben: nicht jeder hat dieses Ziel. Mein Ziel ist es nicht, zumindest nicht mein primäres Ziel. Primär ist del.icio.us für mich ein Werkzeug, das ich für mich nutze. Klingt gar nicht nach dem tollen sozialen Web 2.0 - ist aber so…

    Hallo, ich heisse Carsten und ich bin ein Bookmark-Egoist :-)

    Comment by Carsten Dobschat — Prickle-Prickle, 56th Discord, 3172. @ 46493

  2. Naja, klar. Bei der Art Filter die ich ansetze, sind diese Beiträge sowas wie Spam. Ich untersuche also, warum das so ist und muss feststellen, dass dieser Eintrag echte Spam-Charakteristiken aufweist, grade weil er Tags beinhaltet auf eine Art und Weise, die totaler Mumpitz sind.

    Ich verfolge deine del.icio.us-Links btw auch so, so dass ich schlicht und ergreifend die Infos unnötigerweise doppelt bekomme. Aber das nur am Rande…

    Comment by fukami — Prickle-Prickle, 56th Discord, 3172. @ 51551

  3. “Und warum bieten sie RSS-Feeds an?”

    Aus diesem Grunde hab ich eine schöne Checkbox im Admin vor jedem Eintrag: “Allow feeds for this entry?”. Nicht alles, was ich schreibe, möchte ich nach überallhin automatisch veröffentlichen :)

    Comment by Lukas — Prickle-Prickle, 56th Discord, 3172. @ 68900

  4. Gerade die Subjektivität und die “Unordnung” beim Setzen von Tags sowie die daraus resultierende Unschärfe sind es, die m.E. den Reiz und den Mehrwert von Folksonomien ausmachen, denn sie liefern in der Summe eine bessere Beschreibung der Wirklichkeit.

    Was sicherlich noch fehlt, sind komfortablere Suchmaschinen, die erkennen können, wo es ggf. Bedeutungsüberlappungen und -zusammenhänge gibt (rails, RoR, ruby on rails, rubyonrails etc.) und diese entsprechend berücksichtigen. Derzeit ist das z.B. bei del.icio.us immer noch ein manueller Prozess (und einigermaßen umständlich).

    Davon abgesehen sind viele Quellen, die ich über del.icio.us finde, gar nicht mal so unscharf definiert. Ab einer gewissen Anzahl zugeordneter Tags scheint sich recht schnell eine Reihe von Hauptbegriffen herauszustellen, die der Mehrheit der Nutzer zur Beschreibung dienen.

    Just my 2 cents.

    Comment by Tim — Prickle-Prickle, 56th Discord, 3172. @ 79470

RSS feed for comments on this post. | TrackBack URI

Leave a comment



I love deadlines. I especially love the whooshing sound they make as they fly by.

The Turkey Curse is powered by WordPress, template idea by Priss

Entries (RSS) and Comments (RSS).
Generated in 0.185 seconds.