The Turkey Curse
fukamis terror chatroom

Online-Durchsuchung

Prickle-Prickle, 7th The Aftermath, 3172.

Laut [SpOn][1] plant Schäuble mehrere hundert neue Stellen für den Verfassungsschutz und die Polizei. Dazu soll neue Technik angeschaut werden, mit der _”entfernte PC auf verfahrensrelevante Inhalte hin durchsuchen könnten, ohne tatsächlich am Standort des Gerätes anwesend zu sein”_. Das Ganze soll sich “Online-Durchsuchung” nennen. Es sollen 132 Millionen Euro in 3 Jahren zusätzlich ausgegeben werden um diese Massnahmen durchführen zu können.

Das erinnert mich irgendwie stark an das was Schily 2000 gegenüber der Washington forderte, als es um die Zündelseiten in Kanada ging:

Es ist nicht auszuschliessen, eine US-amerikanische Webseite niederzuzwingen, indem man sie mit massenhaftem Verkehr überschwemmt.

Na das sind doch mal sportliche Ansagen. Irgendwann gilt dann wohl auch ein “Hackmonopol des Staates”.

Ich kann mich des Eindrucks nicht erwehren mich grade in einer Realsatire zu befinden.

[1]: http://www.spiegel.de/politik/deutschland/0,1518,444687,00.html

---

Pavel zu Cottbus

Prickle-Prickle, 7th The Aftermath, 3172.

Pavel hat in seinem Weblog [Aggregat7 - Mechanismus zur Erkundung außerplanmäßiger Erneuerung][1], das, nebenbei bemerkt, ganz klar zu meinen Lieblingsblogs gehört, seinen [Bericht zur Beobachtung der Cottbusser Oberbürgermeisterwahl][2] veröffentlicht. Sein persönliches Fazit liest sich so:

Die Beobachtung der Wahl war eine sehr aufschlussreiche Aktion. Sie zeigte vor allem, das der Glaube in die “moderne” Technik in Cottbus kaum zu erschüttern ist. Auch ist der Glaube an die Integrität der handelnden Personen, Behörden und Firmen viel grösser als der Glaube daran, das der Ausgang der Wahl das persönliche Schicksal verbessern kann.

Es ist sicher gut, dass die Diskussion um die Sicherheit und Überprüfbarkeit von Wahlen am Computer in Deutschland zu einer Zeit stattfindet, in der die Geräte noch keine weite Verbreitung gefunden haben, so dass der finanzielle Schaden durch die Abkehr vom Wahlcomputer sich in Grenzen halten dürfte, auch wenn einzelne Gemeinden stark betroffen sein dürften. In Cottbus steht die Beschaffung der Geräte noch unter Haushaltsvorbehalt — der neue Bürgermeister ist hier gefragt.

Angesichts der Popularität der Geräte bei den Anwendern ist die Gefahr aber gross, das Sicherheit der Bequemlichkeit zum Opfer fällt. Ökonomisch ist der Einsatz der Geräte aber nicht. Sie dienen vor allem der Bequemlichkeit derer, die die Wahl veranstalten.

Bei der Gelegenheit noch einmal der Hinweis auf die [Wahlcomputer-Petition][3], an der sich bislang ca. 13.000 Personen beteiligt haben. Auch du?

[1]: http://acker3.ath.cx/wordpress/
[2]: http://acker3.ath.cx/wordpress/archives/29
[3]: http://itc.napier.ac.uk/e-Petition/bundestag/view_petition.asp?PetitionID=294

---

Bericht zur Oberbürgermeisterwahl in Cottbus

Pungenday, 6th The Aftermath, 3172.

Der [CCC][1] veröffentlicht den [Bericht der Wahlbeobachtergruppe][2] zur Bürgermeisterwahl in Cottbus. Das Fazit: Vertrauen ist gut, Kontrolle nicht möglich.

[1]: http://www.ccc.de/
[2]: http://www.ccc.de/updates/2006/bericht-ob-wahl-cottbus

---

Rangliste der Pressefreiheit 2006

Boomtime, 5th The Aftermath, 3172. Celebrate Maladay.

Die Menschenrechtsorganisation [Reporter ohne Grenzen][1] hat eine Rangliste 2006 zur weltweiten Situation der Pressefreiheit [veröffentlicht][2]. Deutschland kommt dabei zusammen mit Jamaika und Benin und hinter beispielsweise Bolivien, Bosnien-Herzegowina, Trinidad und Tobago, der Slowakei und Slowenien auf Platz 23. Deutschland fiel damit laut [Presseerklärung der ROG][3] von Platz 18 auf 23 zurück:

Der Bundesnachrichtendienst hat über zehn Jahre hinweg bis zum Herbst 2005 Journalisten illegal überwacht. Im Fall „Cicero“ gab es Redaktions- und Hausdurchsuchungen; das Verfahren wegen „Beihilfe zum Geheimnisverrat“ gegen zwei Journalisten wurde inzwischen eingestellt. Der Zugang zu Daten ist – trotz Verabschiedung des Informationsfreiheitsgesetzes – zum Teil immer noch erschwert.

Unter ferner liefen von 168 Plätzen Spanien (41), Israel (50/135), Japan (51) und die USA (53/113).

Als ich noch in der Schule war zählte die Freiheit der Presse als eins der wichtigsten Merkmale der Demokratie. Da hat sich ganz schön was getan seit dem …

[1]: http://www.reporter-ohne-grenzen.de/
[2]: http://www.reporter-ohne-grenzen.de/rangliste-2006.html
[3]: http://www.reporter-ohne-grenzen.de/presse/pressemitteilungen/news-nachrichten-single/article/1/in-nordkorea-turkmenistan-und-eritrea-ist-pressefreiheit-ein-fremdwort.html

---

Elektronische Wahlen

Sweetmorn, 4th The Aftermath, 3172.

In Franks Weblog [Knowledge brings fear][1] findet sich der [erste Teil][2] seines Berichts als Wahlbeobachter in Cottbus, wo am Wochenende mit Hilfe von Nedap-Wahlmaschinen gewählt wurde. Es hat dort versucht, Nedaps Aussagen zur “prozuderale Sicherheit” unter die Lupe zu nehmen.

Bei [Pavel][3] findet sich einmal mehr ein sehr lesenswerter Text zum Thema [Automatisierte Wahlen][4].

Die [Online-Petition für die ersatzlose Streichung des § 35 Bundeswahlgesetz][5] (Stimmabgabe mit Wahlgeräten) läuft noch bis 28. November dieses Jahres, und ich möchte jeden Leser meines Weblogs, der dort noch nicht unterzeichnet hat, bitten, dies zu tun.

[1]: http://frank.geekheim.de/
[2]: http://frank.geekheim.de/?p=306
[3]: http://acker3.ath.cx/wordpress/
[4]: http://acker3.ath.cx/wordpress/archives/28
[5]: http://itc.napier.ac.uk/e-Petition/bundestag/view_petition.asp?PetitionID=294

---

Anmerkungen zum “Round Table on Top Blogs”

Sweetmorn, 67th Bureaucracy, 3172.

Edelman und Technorati haben einige Blogger ([Johnny][1], [Jens][2], [Nico][3] und [Ix][4]) eingeladen, um mit ihnen zusammen über die in den letzen Tagen veröffentlichten Weblog-Toplisten und Monitoring von Weblogs im Allgemeinen zu diskutieren. Ich fand diese Diskussion sehr interessant, weil sie einige Details enthält, die ich bemerkenswert finde und freue mich, dass sie öffentlich als Video [zur Verfügung][5] gestellt wurde. Hier ein paar kurze Anmerkungen dazu.

- Es ist irgendwie merkwürdig, deutsche über die deutsche Blogosphäre reden zu hören. Ich denke, ein wenig ist dadurch inhaltlich verloren gegangen. Letztendlich war es aber weniger schlimm als ich erst erwartet hatte.

- Die Vorstellung von Johnny und Ix als Top 2- und Top 8-Blogger ist aus meiner Sicht ein Nono und war ihnen auch scheinbar ein wenig peinlich.

- “The Blogosphäre is doubling every 6 month”. Ich habe dazu nur eine Frage: Sind in dieser Aussage Splogs eingerechnet oder nicht?

- [Peter Hirshberg][6], seines Zeichens Technorati-Chairman, führte aus, dass die Musik eigentlich nicht in den Topblogs spielt, sondern im “Long Tail” genannten Teil der Blogosphäre, der teilweise nicht einmal in den 250 auftaucht. Das kann man so unterschreiben denke ich. Nico fragte später: “Who links to Bildblog?” Ich sehe das genauso. Es linkt tatsächlich niemand darauf, es wird eben nur gelesen. Ist es deshalb ein Blog mit grossem Einfluß? Das wirft natürlich die Frage auf, was soll so eine Liste bzw. was für Übersichten will man als interessierter Mensch stattdessen?

- Ein Detail: Die Sprache wird erfasst. Da stellt sich natürlich die Frage, warum Technorati Schwierigkeiten damit haben soll, diese den entsprechenden Blogs zuzuordnen. Ist mir vollkommen unklar.

- Johnny fragte, was man tun muss, um Technorati vom Spidern seiner Seiten abzuhalten. Auf Technoratis Seite ist dazu nichts zu finden (zumindest habe ich es nicht gefunden). Es gibt auch scheinbar nicht sowas wie einen “Technorati Bot”. Ich halte das für ein Issue, dass der Bot sich nicht ordentlich identifiziert.

Hier ein paar Zitate, die mir sehr gut gefallen haben:

- Peter: _”The top blogs behave like mainstream media.”_

- Jens: _”Your first list was crap!”_ und Ix: _Maybe it’s a little bit unscharf”_, als es um die Topliste geht.

- Jens (an Cornelia Kunze gewannt): _”The blogosphere is no market. It’s communication and people.”_

- Johnny: _”How many people read blogs in Germany? 2% maybe.”_

- Jens (auf die Frage, wie Firmen ihre grundsätzlichen Strategien ändern gegenüber Bloggern ändern sollten): _”Make good products.”_

- Jens (auf die Frage, was er sich wünscht wie sich Firmen verhalten sollten und wie nicht: _”Relax and don’t overreact.”_

Meiner Einschätzung nach ist im diesen Gespräch ein grundsätzlicher Bruch in der Kultur und im Selbstverständnis wieder einmal deutlich geworden. Die Blogger verstehen sich in erster Linie als private Kommentatoren des Geschehens. Einerseits wissen sie Monitoring zu schätzen, damit sie schnell mitbekommen was passiert. Andererseits ist es ihnen unangenehm, dass ihnen irgendwelche Corporates oder PR-Agenturen auf die Finger schauen und sie Angst haben müssen, bei Beiträgen, die Firmen betreffen, sofort zur Rechenschaft gezogen werden — mit dem Effekt, dass unter Umständen eine “freie” Kommunikation erschwert wird. Das Misstrauen vor allem gegen PR-Agenturen ist gross, denn diese werden als nach wie vor als die Gatekeeper betrachtet. PR-Agenturen würden gerne mehr mit Bloggern zusammenarbeiten, aber es gibt dagegen einen deutlichen Widerstand, weil es vor allem als Vereinnahmung wahrgenommen wird. Ich bin an dem Punkt Johnnys Meinung, dass sich ein gewisser Widerstand der Blogger gegen generelles Monitoring etablieren könnte.

Auf Technoratis Seite war zu merken, dass sie zwar einerseits eine Unmenge an Daten haben, anderseits aber große Schwierigkeiten haben, mehr rauszuholen. Deswegen wollen sie gerne die Benutzer ihres Systems ermuntern, ihnen bei der Kategorisierung zu helfen, ja, sie sind darauf ganz offensichtlich angewiesen.

Update: Die Artikel von [Johnny][7], [Ix][8] und [Jens][10] zu dem Treffen sind in ihren Weblogs zu finden. Livegeblogtes gibt es beim [Blogruf][9], lesenswert auch [Daily Pia][11] und das [Blog Bistro][12] zum Thema.

Update 2: [Nico][13] hat noch mal ein paar versöhnlichere Töne angestimmt.

[1]: http://spreeblick.com
[2]: http://popkulturjunkie.de
[3]: http://lumma.de
[4]: http://wirres.net
[5]: http://przweinull.de/eintrag.php?id=4
[6]: http://atomicbomb.typepad.com
[7]: http://www.spreeblick.com/2006/10/13/technoradi-in-frankfurt/
[8]: http://wirres.net/article/articleview/3980/1/6/
[9]: http://blog.zeit.de/blogruf/?p=288
[10]: http://www.popkulturjunkie.de/wp/?p=2629
[11]: http://www.daily-pia.de/?p=1599
[12]: http://www.blog-bistro.de/?p=514
[13]: http://lumma.de/eintrag.php?id=3018

---

Sprachen erkennen

Setting Orange, 66th Bureaucracy, 3172.

Anfänglich fand ich das ganze Trara um die Blogtopliste noch lustig, aber langsam wird es aber irgendwie absurd. Im [Technorati Blog][] (und in deutscher Sprache beim [Haltungsturner][]) wird angeregt, die Leute mögen bitte ihr Weblog claimen und die Sprache ihres Weblogs eintragen.

Leute: Es gibt da draußen mehr als genug Code, auf deren Basis man mit recht großer Genauigkeit Sprachen erkennen kann, ohne dass weitere grossartige Intervention nötig sein sollte. Sucht beispielsweise einfach mal in der Suchmaschine eurer Wahl nach “Language::Guess” oder, für euch sicher besser geeignet, “JTCL”. Dann müsst ihr die Berge nicht nötigen, zum Propheten zu kommen.

[Technorati Blog]: http://technorati.com/weblog/2006/10/136.html
[Haltungsturner]: http://luebue.blogspot.com/2006/10/auf-dem-weg-zu-vernnftigen-top-100.html

---

Battle of the Bands

Setting Orange, 66th Bureaucracy, 3172.

Im Allgemeinen binde ich ja eher keine YouTube-Filmchen ein. Aber in dem Fall muss ich mal ‘ne Ausnahme machen: Battle of the Bands =)

---

Die unsterblichen Alten. Und die Jungspunte.

Prickle-Prickle, 65th Bureaucracy, 3172.

Zitat Jens:

Der Schockwellenreiter ist der Paul Anka der deutschen Blogosphäre.

---

Warum Technoratis Ranking versagt

Prickle-Prickle, 65th Bureaucracy, 3172.

Edelman hat in Zusammenarbeit mit Technorati eine Topliste von Blogs [herausgegeben][], die für einigen Unmut in Deutsch-Kleinbloggershausen gesorgt hat. Über Sinn oder Unsinn von Toplisten kann man sich sicher streiten. Ich selbst halte nicht besonders viel davon, denn was soll so eine Liste am Ende beweisen? Aber wenn man unbedingt so etwas haben will, muss aus meiner Sicht Verschiedenes beachtet werden (neben dem, dass natürlich die Links und Namen der Weblogs sauber übernommen werden sollten). Ich will einmal versuchen, ganz grob einige der Probleme zu veranschaulichen und erhebe nicht den Anspruch, besonders umfassend zu sein.

Doubled Content und Content Origin
—————————————-

Ein Problem, mit dem jede Art Suchmaschine zu kämpfen hat, ist der Fakt, dass eine Ressource im Web oft über verschiedene URLs angesprochen werden kann, die den gleichen oder einen sehr ähnlichen Inhalt bereit stellen(beispielsweise http://www.weblog.tld, http://weblog.tld/blog, http://weblog.tld/wp und http://blog.weblog.tld/wp/index.php usw., die alle dasselbe Weblog referenzieren). Man könnte nun ganz hemdsärmelig rangehen: HTML und Sonderzeichen entfernen, einen Hash über den Restinhalt gelegt und schon hat man einen Wert, den man nur noch vergleichen muss. Das Problem ist allerdings, dass einerseits Leute auch zu kurze und zu ähnliche Texte verfassen, womit so ein Vergleich hinfällig wird, aber es kann auch passieren, dass jemand den Inhalt eines fremden Feeds einbindet und schon hat man das Problem heraus zu bekommen, woher der Inhalt im Ursprung stammt und versaut sich unter Umständen einiges (dazu aber mal irgendwann anders etwas ausführlicher). Das Ranking versaut sowas natürlich auch und macht es Spammern leicht. Aus meiner Sicht gibt es für diese Probleme bisher keine zufriedenstellenden Lösungen.

RSS- vs. HTML-Spidering
—————————-

Technorati benutzt die HTML-Seiten, um die Inhalte und Links aus Weblogs heraus zu ziehen. Vorteil ist, dass auch Weblogs, die keine Full Feeds bereit stellen, gespidert werden und mit Hilfe auf der HTML-Seite eingebundenen Blogrolls zudem Blogs erfasst werden können, die in Texten nicht verlinkt werden. Und natürlich bekommt man so auch die Kommentare leichter zu fassen. Das sorgt im konkreten Fall aber auch für die Einbindung von Links aus Footern, z.B. von verwendeten Plugins oder Skins, die eine Linkstatistik sehr stark verfälschen, da die entstehenden Links eigentlich “minderwertig” sind (Ranking-wise gesprochen). Zudem sorgen beispielweise durch Zufall erzeugter Inhalt (z.B. Reihenfolge Blogrolls) für Alerts, die eigentlich keine sind.

Durch das reine Spidern und Indizieren von RSS-Feeds kann es zwar durch verkrüppelte Feeds vorkommen, dass nicht alle Inhalte eines Postings auch wirklich indiziert werden, aber meiner Erfahrung nach hält sich die Menge der Blogs, auf die dieses Problem zutrifft, in Grenzen (weit unter 10% würde ich sagen). Schwieriger wird es mit dem Abgreifen von Kommentar-Feeds. Diese Feeds sind wichtig, ja oft fast noch wichtiger und interessanter als die eigentlichen Posts, da dort oft noch eine Unmenge von Infos dazu kommt und sogar aus Sicht des Marketings dort manchmal die interessanteren Infos ausgetauscht werden. Trotzdem glaube ich persönlich, dass die nackten Feeds die wichtigeren Informationen enthalten und deswegen nur diese für ein einigermassen sinnvolles Ranking herangezogen werden sollten.

Da man beispielsweise die Seitentitel der Seiten erfassen werden wollen, auf die gelinkt wird, ist ein Spidern von HTML trotzdem nötig (und natürlich auch, um neue spiderbare Ressourcen zu finden), aber für die Extraktion der Topics und für das Ranking sollte der reine HTML-Teil aus meiner Sicht trotzdem nicht benutzt werden.

Exitlinks
———

Viele Blogsysteme benutzen Exitlinks, die beispielsweise die Form “http://weblog.tld/exit.php?id=2342″ haben. Sinn ist, die Klicks der Besucher zu erfassen und macht für den Betreiber der Links totalen Sinn, um nachzuvollziehen, was auf der Seite eigentlich getrieben wird. Für eine Erfassung ist das aber machmal problematisch. Wie vielen Redirections soll der Spider folgen? 1? 3? 5? Diese Redirections können zu sehr lustigen Problemen für den Spider führen und sorgt, egal wie, für eine Verfälschung.

define WEBLOG
—————–

Die Frage, was ein Weblog ist und was nicht ist ohnehin ein Glaubenskrieg. Aber vollautomatisiert diese Entscheidung zu treffen ist aus meiner Sicht schlicht unmöglich, denn mittlerweile benutzt alles Feeds und Kommentarfunktionen: Foren, Wikis, Email-/Chat-/Bugtracking-/Weissdergeier-to-RSS-Systeme. Muss also ein Weblog Kommentar- und/oder Trackbackfunktionen besitzen? Muss es “nach draussen linken”? Es ist zu guter Letzt eben doch immer noch eine nicht-maschinenbasierte Entscheidung nötig. Bei grossen Systemen wie Technorati ist das aber nicht mehr ohne weiteres machbar. Zudem stehen viele für die Marketingfront wichtige Infos oft gar nicht in den Weblogs zur Diskussion, wo einzelne Leute, die einen bestimmten Hang zur Selbstdarstellung und eine bestimmte Sorgfalt an den Tag legen, sondern viel mehr in Foren. Damit verschwimmen die Grenzen allerdings zusehens: Will eine Firma Volkes Stimme oder mehr oder minder “qualifizierte” Betrachtungen? Will man möglichst viele, alle Blogs? Oder eher die Top 10.000?

SEO und andere Formen des Spams
—————————————-

Gegen bestimmte Arten von SEO ist nicht wirklich ein Kraut gewachsen, ausser rigoroses Prüfen und Rausschmeissen bzw. gnadenlosem Herunterranken (furchtbares Wort!). Automatisiert kann nur eine grobe Vorauswahl getroffen, mit bestimmten Schwellwerten und Auffälligkeiten gearbeitet werden, was aber mit zunehmender Menge der Ressourcen immer schwieriger wird.

Letztendlich ist aus meiner Sicht Technorati mit dem was sie machen offensichtlich überfordert, und deren Datenbasis müsste wohl auch mal gründlich entmistet werden, aber bei 50 und mehr Millionen zu prüfenden Ressourcen nicht eben eine triviale Aufgabe. Trotzdem ist diese Liste für mich natürlich sehr interessant, vor allem, da wir zu vollkommen anderen Ergebnissen kommen und mir in jedem einzelnen Fall gut ausmalen kann, wie es bei Technorati zu dieser Liste kommt.

Trotzdem finde ich natürlich, dass die Liste ganz schön geschludert ist und was sie nicht hätte sein müssen, weil sich dort ganz offensichtlich nicht einmal die Mühe gemacht wurde, die Ressourcen noch einmal zu überprüfen, denn dann wären so einige Schnitzer sicher nicht passiert.

Update: Beim popkulturjunkie gibt es noch weitere Erklärungen dazu, wie es zu einer solch schlechten Liste kommt. Sehr informativ das Ganze.

[herausgegeben]: http://www.micropersuasion.com/2006/10/edelman_and_tec.html

---



"I am chaos. I am the substance from which your artists and scientists build rhythms. I am the spirit with which your children and clowns laugh in happy anarchy. I am chaos. I am alive, and I tell you that you are free." - Eris, Goddess of Chaos, Discord & Confusion.

The Turkey Curse is powered by WordPress, template idea by Priss

Entries (RSS) and Comments (RSS).
Generated in 0.147 seconds.