Skip to content

Datamining in social networks

Datamining in social networks

Eine kurze Einführung zum Thema Datamining in sozialen Netzwerken bietet die Seminararbeit

Social Network Mining David Theil

In dieser Arbeit wird ein Überblick über Analyse sozialer Netzwerk geben. Zunächst wird
die Motivation und der Grund für die  Analyse soziale Netzwerk erklärt. Danach werden
wichtige  Begriffe  wie  soziales  Netzwerk  und  soziale  Netzwerkservices  definiert  und  die
wichtigsten  Bestandteile  von  sozialen  Netzwerken  beschrieben.  Nach  diesen Grundlagen
werden  einige  Methoden  zur  statischen  und  dynamischen  strukturellen  Netzwerkanalyse
beschrieben.  Danach  wird  auf  andere  Analyseverfahren  eingegangen  wie  Community
Detection,  Knotenklassifizierung,  und  Linkschlussfolgerung.  Des  Weiteren  wird  auf
Multimedia  Mining  in  sozialen  Netzwerken  und  Visualisierung  von  sozialen
Netzwerkgraphen eingegangen.

Spannende Dokus

Plastic Planet [deutsch]

Eine Doku über Kunststoffe die zeigt, was die Auswirkungen von fast einem Jahrhundert Plastikherstellung auf unseren Planeten bewirkt hat.

Der Film versucht alle Risiken auf zu zeigen, welche mit dem Gebrauch von Kunststoffen einhergehen. Dabei sind am bedenklichsten die Stoffe Bisphenol A und Phtalate (Weichmacher) welche im Zusammenhang mit PVC eingesetzt werden.

Es gibt auch eine Plastic Planet Webseite, auf der die Probleme nochmals aufgearbeitet und zusammengefasst sind und auch Alternativen zu den herkömmlichen Plastik Kunststoffen aufzeigt:

http://www.plastic-planet.at

http://www.plastic-planet.at/wissenschaft/bisphenola.html

http://www.plastic-planet.at/wissenschaft/phthalate.html

 

Neue Materialen und Techniken und ihre Gefahren

Eine spannende Präsentation von Heike Holdinghausen über die Gen-Technologie, die Nano-Technologie und Materialien die zum Nachdenken anregt.

Artikel über das Web 3.0 Sven Lennartz

Dass das Thema Semantik Web (Web 3.0) schon seit mehreren Jahren aktuell ist und bis heute noch an Brisanz dazu gewonnen hat zeigt ein Artikel von Sven Lennartz.
Bereits am 1. August 2006 schrieb er in seinem Artikel auf http://www.drweb.de/magazin/die-zukunft-im-web-30-eine-vision/ über die Entwicklung des World Wide Webs und das Web 3.0.

Der Artikel ist ebenfalls sehr einfach erklärter und ein guter Einstig in die Materie.

Prädikat: Sehr Lesenswert

Web 3.0 = Web 2.0 + 1.0?

Die Mehrheit der „normalen“ Internetbenutzer haben gerade erst vom Web 2.0 gehört und vielleicht ein wenig verstanden, was dieser Begriff bedeuten soll. Gerade sind sie dabei Web 2.0 zu verstehen sprechen die ersten Experten schon von Web 3.0 oder dem „Semantic Web“.

Um diesen neuen Begriffe jedoch verstehen zu können muss man zunächst einmal das Web 2.0 verstanden haben, wie und warum es entstanden ist, und warum es sich von den ursprünglichen Web 1.0 Internet unterscheidet.

Seine Anfänge hat das Internet ja bekanntlich im Forschungszentrum Cern in der Schweiz und wurde dann in Amerika von Universitäten und dem Militär weiter entwickelt. Das Militär spaltete dann sein Netz von dem der Universitäten ab und übrig blieb das Urinternet.

Das Internet der damaligen Form war jedoch rein statisch für die Informationsverbreitung verwendbar. Es gab einen Wissensanbieter (Knowledge Provider) und beliebig viele Konsumenten (Internet User).

Dabei erstellte der Wissensanbieter eine Statische HTML-Seite und Veröffentlichte diese auf seinen Server. Jeder konnte nun das neue Wissen der HTML Seite abrufen, durchlesen, studieren, ausdrucken etc.

Wollte ein User selbst anderen Usern ein Thema veröffentlichen so musste er unter hohen Aufwand selbst eine HTML Seite schreiben eine Server aufsetzen und auf diesen Server der Öffentlichkeit zur Verfügung stellen.

Man kann also sagen, dass im Web 1.0 nur unter hohen Aufwand von einigen wenigen Technisch begabten Menschen Wissen angeboten wurde. Es gab also eine Hand voll Anbietern von Informationen und eine überwiegende Mehrheit an Konsumenten.

Mit den Neuerungen im Web 2.0 änderte sich jedoch dieses Verhältnis. Aus den reinen Konsumenten (Consumer) wurde mit Hilfe verschiedenster Plattformen und Tools im Internet Produzenten und Konsumenten von Informationen. Durch Foren, Wikis, Blogs, Tools zur einfachen Erstellung und Hosting von Homepages konnte plötzlich jeder noch so technisch unbegabte Internetuser plötzlich seine eigenen Informationen einer breiten Öffentlichkeit zugänglich machen. Menschen konnten auf einmal (beispielsweise in Wikis) mit einander kollaborieren und ihre Informationen bündeln und so immer mehr und bessere Informationen preisgeben.

Das Web 2.0 stand also klar und deutlich im Zeichen der Kollaboration. Aus Usern wurden Prosumenten eine Mischung zwischen PROduzenten und KonSUMENTEN die einerseits Informationen anboten und andererseits Informationen konsumierten.

Erst wenn diese Tatsache erst einmal verstanden wurde kann man behaupten Web 2.0 verstanden zu haben. Viele Menschen befinden sich ja in den Irrglauben das Web2.0 habe etwas mit Interaktivität mit der Website zu tun auf der sie gerade sind. Das ist jedoch nicht korrekt.

Was ist nun das Web 3.0 und was heißt Semantic Web?

Wir befinden uns bereits am Übergang vom Web 2.0 wie wir es kennen und lieben gelernt haben zum neuen Web 3.0. Um jedoch die neuen Ideen und Konzepte und Verbesserungen verstehen zu können, muss man sich jedoch zuerst mal die Probleme beim Web 2.0 ansehen.

Sind sie schon mal in der Situation gewesen Ihr Auto/Fahrrad oder irgendeinen anderen wichtigen Gegenstand reparieren lassen zu müssen und wussten nicht wo das am schnellsten unkompliziertesten und günstigsten geht? Was tut man an so einer Stelle… man geht auf Google und gibt ein: Autowerkstatt Wohnort Reparaturart,…. Preis.

Ja das ist so eine Sache mit dem Preis; Ich will es natürlich möglichst günstig! Wenn ich bei der Google-Abfrage jetzt „günstig“ eingebe werde ich wahrscheinlich 10.000 Treffer mehr in meinen Suchergebnissen haben und dabei um 0% schlauer sein, wo ich am besten mein Auto reparieren lassen kann.

Das Problem hierbei ist nicht mit der achso besten Google-Abfrage in den Griff zu bekommen, also wird mir wohl nichts anderes übrig bleiben als mich Schritt für Schritt durch die Treffer in der Ergebnisliste durchzuarbeiten und zu recherchieren welche Werkstadt in meiner Nähe die am besten geeignetste für mich ist.

Google kann das Problem also für mich nicht lösen, und warum kann Google das nicht? Google weiß doch alles!?

Die Antwort auf diese Frage liegt im Aufbau des Web 2.0 so wie wir es kennen. Die Internet Seiten Heut zu Tage sind darauf ausgelegt das wir Menschen die Informationen in bester Form präsentiert bekommen. Die Webseiten sind also von Menschen für Menschen gemacht. Menschen können leicht Schlüsse ziehen mit verschiedenen Regelbasen und Filterkriterien durch Kreativität und Kombination verschiedenster Informationsquellen selbst komplexeste Aufgaben lösen. Computer können das nicht so einfach. Wo es Menschen egal ist ob in einem Wort ein Rechtschreibfehler ist oder nicht und sie trotz Fehlers dennoch den Sinn des Wortes verstehen und kombinieren was es meinen soll ist bei Computern schon Schluss. Rechner haben da null Toleranz was solche Sachen angeht weil ihnen die Kombinationsgabe und die Kreativität fehlen.

Um von Rechnern jetzt erwarten zu können einen Text(zb. einer Autowerkstatt-)HTML-Seite zu analysieren und somit heraus zu finden (ob die Werkstatt für mich geeignet ist oder nicht) ob sie gewissen Regeln/Suchkriterien entspricht, fehlen ihnen also Informationen, Metadaten über die in Textform angebotenen Informationen.

Diese zusätzlichen Informationen (Metadaten und Annotationen) erweitern das Web 2.0 und kreieren somit das Web 3.0 oder anders ausgedrückt das Semantic Web.

Warum jetzt Semantic Web ich dachte das heißt Web 3.0? Was meint man mit Semantic überhaupt?

Sucht man auf Wikipedia den Begriff Semantik, findet man folgende Definitionen:

  1.   Die Semantik (Bedeutungslehre) ist das Teilgebiet der Sprachwissenschaft (Linguistik), das sich mit Sinn und Bedeutung von Sprache beziehungsweise sprachlichen Zeichen befasst.
  2.   Die Semantik behandelt die Frage, wie Sinn und Bedeutung von komplexen Begriffen aus denen von einfachen Begriffen abgeleitet werden können und stützt sich dabei in der Regel auf die Syntax.

Semantik bezieht sich also auf die Bedeutung von Informationen wärend der Syntax nur regelt wie die Informationen darzustellen sind.

Bezugnehmend auf das Internet wird im Semantic Web versucht Wissen Computer und Menschenübergeifend zu verbinden und somit die Inhalte der Webseiten nicht nur für Menschen sonndern auch in für Computer verständlicher Form darzustellen. Dies geschieht unter anderen mit Ontologien und Annotationen.

Was machen Annotationen?

Annotationen werden in bestehende HTML Seiten eingebaut und machen somit die bereits vorhandenen Informationsstrukturen für Computer lesbar. Es sind somit Informationen über die eigentlichen Informationen. Dies nennt man Allgemein Metadaten.

Was ist eine Ontologie?

Eine Ontologie sind Regeln und Wissen wie die Vernetzung von Daten sinnvoll erfolgen kann. Dabei werden Datenstrukturen aufgebaut, Daten vernetzt und mit Regeln in Verbindung gestellt.

Mit Hilfe dieser Ontologien kann man eine semantische Wissensmodell-Basis aufbauen. Aufgrund dieser Basis und der Regeln kann man dann automatisch auf andere Gegebenheiten schließen und somit mehr Wissen produzieren.

Ein einfaches Beispiel: Weiß man das man mit einem Kugelschreiber zeichnen kann. Und weiß man, dass ein Kugelschreiber ein Stift ist und man mit Stiften zeichnen kann. Und weiß man, dass ein Bleistift auch ein Stift ist. So kann man automatisch davon ausgehen dass man mit einen Bleistift auch zeichnen kann.

Was erwartet uns nun im Semantic Web?

Da Aufgrund der neuen Vernetzung des Wissens unter den Rechnern nun Computer mehr Möglichkeiten haben Wissen zu verwenden und neues Wissen zu erzeugen wird das Internet immer Intelligenter werden. Es wird zahlreiche neue schlauere Funktionen geben und Usern somit der Umgang mit den Informationen im Internet erleichtert. Das bedeutet mehr Usabillity und einfacher zu bedienenden Applikationen, schlauere Suchmaschinen.

Andererseits Wecken diese neuen Funktionen neue Risiken auf welche ich demnächst eingehen werde.

Zu guter Letzt noch ein kleines zusammenfassendes Video zum Thema Semantic Web:

RFID und Datenschutz

Mit dem RFID – Transponder im Reisepass und der steigenden Anzahl an RFID – Transpondern auf Produkten regt sich der Widerstand gegen diese Technologie. Datenschützer haben Angst das die Daten der RFID – Transponder unbemerkt vom Konsumenten ausgelesen werden. Mit Hilfe von einer flächendeckenden RFID – Reader Vernetzung können sogar ganze Bewegungsprofile erstellt werden. RFID im öffentlichen Verkehr wie beispielsweise in Ubahnen in Stockholm oder anderen Großstädten machen bereits den ersten Schritt hin zu diesem Horrorszenario.

In der Realität muss man dieses Thema jedoch ein bisschen Nüchterner sehen. Momentan ist ein flächendeckender Allumfassender Einsatz von RFID ökonomisch nicht möglich. Jedoch gibt es einen klar ersichtlichen Trend dort hin. Und somit regt sich auch der Wiederstand gegen diese Technologie und es werden zahlreiche Filme und Reportagen zu dem Thema gedreht.

Andere Menschen lassen sich jedoch ohne weitere Bedenken RFID-Chips implantieren um somit immer eindeutig identifiziert werden zu können. So gibt es zum Beispiel einen Disco Club in Rotterdam (der Baja Beach Clubs) bei dem man mit einem RFID-Chip als VIP behandelt wird und mit dem Chip Getränke bezahlen kann.

Hier noch einmal ein Video welches in kürze versucht zu erklären was RFID ist und was die Risiken der Technologie sind:

Und eine Reportage des ARD über RFID mit Kritik an den Risiken.

Ablauf der RFID-Kommunikation

Ein RFID Transponder oder auch RFID-Tag genannt, wird in die Reichweite eines Lesegeräts gebracht.
Das Lesegerät erzeugt um sich herum ein elektromagnetisches Wechselfeld, welches die Antenne des Transponders direkt bestrahlt. Diese Bestrahlung der Antennenspule des Tags erzeugt einen Induktionsstrom im Transponder und versorgt ihn somit mit Energie, welche in einen Kondensator, der als Kurzzeitspeicher fungiert, geleitet wird. Dieser Kondensator versorgt während des Lese-/Schreibvorganges den Chip des RFID-Tags. Bei aktiven RFID-Tags übernimmt die Energieversorgung nicht wie bei passiven die Induktion, sondern eine dazu eigens eingebaute Batterie. Bei halbaktiven Transpondern wird der Mikrochip über eine Batterie mit Strom versorgt. Die Übertragung wird jedoch zusätzlich durch die Induktion über die Antenne mit Energie unterstützt.
Sobald der Mikrochip des Transponders mit Energie versorgt wird, beginnt er mit der Decodierung der vom Lesegerät gesendeten Befehle, bearbeitet diese und reagiert darauf. Die Antwort auf diese Befehle übernimmt der Reader, der ein Teil eines RFID-Tags ist. Er macht das mit Hilfe von Feldschwächungen im kontaktfreien Kurzschluss oder durch gegenphasige Reflektion des vom Lesegerät ausgesendeten Feldes. Somit sendet ein Transponder selbst kein Signal, sondern er verändert nur das elektromagnetische Sendefeld des Lesegerätes.