Klassifikation und Erstellung von benutzerspezifischen Domänen mit Methoden und Algorithmen des maschinellen Lernens
Abstract
Folgende Diplomarbeit behandelt die Fragestellungen, die mit der Klassifikation von Webdokumenten und mit der Erstellung von benutzerspezifischen Informationsprofilen in einem vorgegebenen, agentenbasierten Informationssystem zusammenhängen. Ausgewählte maschinelle Lernverfahren werden mit den unterschiedlichen Textbewertungstechniken kombiniert und durch Auswertung der Testergebnisse miteinander verglichen. Als maschinelle Lernmethoden werden hauptsächlich Entscheidungsbäume eingesetzt und ihre Generalisierungsfähigkeit getestet. Eine qualitativ gute und, soweit möglich, statistisch messbare Klassifikationsgenauigkeit wird als Hauptziel der Arbeit angestrebt. Die Verbesserung der Klassifikation ist jedoch nicht das einzige Ziel dieser Diplomarbeit. Gegenstand der Untersuchung ist die Anwendung der unterschiedlichen Strategien zur Bildung der Trainingsmenge und ihre Auswirkung auf die Generalisierungsfähigkeit der erstellten Klassifikatoren. Eine effiziente Kombination der untersuchten Methoden wird implementiert und in das vorhandene agentenbasierte Informationssystem für den Benutzer zur Verfügung gestellt.