Unterschiede zwischen den Revisionen 1 und 8 (über 7 Versionen hinweg)
Revision 1 vom 2010-12-08 19:15:30
Größe: 814
Autor: anonym
Kommentar:
Revision 8 vom 2011-01-07 09:21:55
Größe: 2704
Autor: anonym
Kommentar:
Gelöschter Text ist auf diese Art markiert. Hinzugefügter Text ist auf diese Art markiert.
Zeile 3: Zeile 3:
Data-Mining ein vereinfachter Begriff für Knowledge Discovery in Databases (KDD). D.h. KDD ist der Versuch aus vorhandenen Datenmassen Erkenntnisse zu bekommen. Data-Mining ein vereinfachter Begriff für Knowledge Discovery in Databases (KDD). D.h. KDD ist der Versuch aus vorhandenen Datenmassen in Datenbanken Erkenntnisse zu bekommen. Bei nicht als Datenbanken vorliegenden Texten wird dabei zuerst [[http://wissensexploration.de/textmining-vs-datamining.php|Text Mining]] betrieben.
Zeile 7: Zeile 8:
Zum Finden der Funktion gibt es verschiedene Verfahren, welche je nach vorhandenen Daten ausgewählt werden müssen. Zum Finden der Funktion gibt es verschiedene Verfahren, welche je nach vorhandenen Daten ausgewählt werden müssen. Das Finden der Funktion wird bei den KI-Informatikern [[http://wissensexploration.de/datamining-kdd-machine-learning.php|Maschinelles Lernen]] genannt. Dieser Begriff ist allerdings problematisch, da er zur Überschätzung der Erkenntnisse durch Data-Mining führt. Gerade bei Kriminalbeamten, die in der Regel keine höhere Mathematik studiert haben, kann dieses problematisch werden. Denn es kann dazu führen, dass an einer falschen Spur festgehalten, da das Programm ja den oder die Verdächtige ausgegeben hat (Der Fall [[http://annalist.noblogs.org|Andrej Holm]] dürfte auf fehlerhaftes Nutzen der Data-Mining Programme zurückzuführen sein).
Zeile 11: Zeile 12:

[[http://www.rote-hilfe.de/static/publikationen/die-rote-hilfe-zeitung/2006/4/data-mining-rasterfahndung-und-der-ueberwachungsstaat.html| Rote Hilfe Zeitung zu Data Mining]]

[[http://dbs.informatik.uni-halle.de/Lehre/KDD_SS09_web/dm_skript.pdf|Data-Mining Skript (mathematisch)]]

In einem [[http://www.faz.net/s/Rub117C535CDF414415BB243B181B8B60AE/Doc~E38A2F6DD0A734EB789AAD27EDE6F9A35~ATpl~Ecommon~Scontent.html|FAZ-Artikel über Data-Mining]] von [[http://frank.geekheim.de|Frank Rieger]] wird die Problematik von Data-Minig sehr anschaulich beschrieben:

''Die Profile sind nützlich, um uns gezielt zum Kauf von mehr nutzlosem Tand oder interessanteren Büchern zu verleiten, uns effizienter zu verwalten und zukünftiges Verhalten zu prognostizieren. Und um Menschen unter präventive Überwachung zu stellen, deren Profil sich bedenklich dem von Straftätern nähert. Dabei geht es nicht um hundertprozentige Präzision der Vorhersage. Wahrscheinlichkeiten, Neigungen, Tendenzen, Zugehörigkeit zu Kohorten sind die Währungen der algorithmischen Orakel.''

Data Mining

Data-Mining ein vereinfachter Begriff für Knowledge Discovery in Databases (KDD). D.h. KDD ist der Versuch aus vorhandenen Datenmassen in Datenbanken Erkenntnisse zu bekommen. Bei nicht als Datenbanken vorliegenden Texten wird dabei zuerst Text Mining betrieben.

Bei Zahlendaten ist dieses nicht anderes als ein numerisches Verfahren, d.h. mathematische Funktionen werden durch Polynome angenähert, also eine kompliziertere Version der linearen Regression.

Bei normalen Daten versucht die KDD ebenfalls die Daten durch eine Funktion zu approproximieren. Diese ist allerdings keine mathematische Funktion und es ist deswegen noch fehleranfälliger. Zum Finden der Funktion gibt es verschiedene Verfahren, welche je nach vorhandenen Daten ausgewählt werden müssen. Das Finden der Funktion wird bei den KI-Informatikern Maschinelles Lernen genannt. Dieser Begriff ist allerdings problematisch, da er zur Überschätzung der Erkenntnisse durch Data-Mining führt. Gerade bei Kriminalbeamten, die in der Regel keine höhere Mathematik studiert haben, kann dieses problematisch werden. Denn es kann dazu führen, dass an einer falschen Spur festgehalten, da das Programm ja den oder die Verdächtige ausgegeben hat (Der Fall Andrej Holm dürfte auf fehlerhaftes Nutzen der Data-Mining Programme zurückzuführen sein).

Seminararbeit zu Data-Mining

Rote Hilfe Zeitung zu Data Mining

Data-Mining Skript (mathematisch)

In einem FAZ-Artikel über Data-Mining von Frank Rieger wird die Problematik von Data-Minig sehr anschaulich beschrieben:

Die Profile sind nützlich, um uns gezielt zum Kauf von mehr nutzlosem Tand oder interessanteren Büchern zu verleiten, uns effizienter zu verwalten und zukünftiges Verhalten zu prognostizieren. Und um Menschen unter präventive Überwachung zu stellen, deren Profil sich bedenklich dem von Straftätern nähert. Dabei geht es nicht um hundertprozentige Präzision der Vorhersage. Wahrscheinlichkeiten, Neigungen, Tendenzen, Zugehörigkeit zu Kohorten sind die Währungen der algorithmischen Orakel.