Modul CS5131-KP08, CS5131

Web-Mining-Agenten (WebMining)

Dauer:

1 Semester

Angebotsturnus:

Wird nicht mehr angeboten

Leistungspunkte:

Studiengang, Fachgebiet und Fachsemester:

Master Medieninformatik 2020 (Wahlpflicht), Informatik, Beliebiges Fachsemester
Master Medizinische Informatik 2019 (Wahlpflicht), eHealth / Informatik, 1. oder 2. Fachsemester
Master Mathematik in Medizin und Lebenswissenschaften 2010 (Wahlpflicht), Informatik, Beliebiges Fachsemester
Master Medieninformatik 2014 (Wahlpflicht), Informatik, Beliebiges Fachsemester
Master Medizinische Informatik 2014 (Wahlpflicht), eHealth / Informatik, 1. oder 2. Fachsemester

Lehrveranstaltungen:

CS5131-Ü: Web-Mining-Agenten (Übung, 1 SWS)
CS5131-P: Web-Mining-Agenten (Praktikum, 1 SWS)
CS5131-V: Web-Mining-Agenten (Vorlesung, 4 SWS)

Workload:

30 Stunden Prüfungsvorbereitung
120 Stunden Selbststudium
90 Stunden Präsenzstudium

Lehrinhalte:

Wahrscheinlichkeiten und generative Modelle für diskrete Daten
Gauss-Modelle, Bayesscher und frequentistischer Wahrscheinlichkeitsbegriff
Graphische Wahrscheinlichkeitsmodelle (z.B. Bayessche Netze), Lernen von Parametern und Strukturen (Algorithmen BME, MAP, ML, EM), wahrscheinlichkeitsbasierte Klassifikation, Relationale graphische Wahrscheinlichkeitsmodelle
Dynamische graphische Wahrscheinlichkeitsmodelle (dynamische Bayessche Netzwerke, Markov-Annahme, Zustandsübergangs- und Sensor-Modelle, Berechnungsprobleme: Filterung, Prädiktion, Glättung, wahrscheinlichste Zustandsfolge), Erweiterungen (Hidden-Markov-Modelle, Kalman-Filter), exakte und approximative Verfahren zur Lösung von Berechnungsproblemen, Automatische Bestimmung von Parametern und Struktur von dynamischen graphischen Wahrscheinlichkeitsmodellen
Kausale Netze (Intervention, instrumentale Variable, Kontrafaktische Konditionale)
Gemischte Modelle, Latente lineare Modelle (LDA, LSI, PCA), dünn besetzte lineare Modelle
Entscheidungsfindung unter Unsicherheit: Nützlichkeitstheorie, Entscheidungsnetzwerke, Wert von Information, sequentielle Entscheidungsprobleme und -Algorithmen (Wert-Iteration, Strategie-Iteration), Markov-Entscheidungsprobleme (MDPs), entscheidungstheoretische konstruierte Agenten, Markov-Entscheidungsprobleme unter partieller Beobachtbarkeit (POMDP), dynamische Entscheidungsnetzwerke, Parameter- und Strukturbestimmung durch wiederholte Verstärkung (reinforcement learning)
Interaktion von Agenten: Spieltheorie, Betrachtung von Entscheidungen und Aktionen mehrerer Agenten (Nash-Gleichgewicht, ?Bayes-Nash-Gleichgewicht), Soziale Entscheidung (Abstimmung, Präferenzen, Paradoxien, Arrow's Theorem), Mechanismen, ?Mechanismen-Entwurf (kontrollierte Autonomie), Bilaterale Mechanismen: Regeln des Zusammentreffens (rules of encounter)
Multimedia-Interpretation für Webrecherchen (Erkennung benannter Entitäten, Duplikateliminierung, Interpretation von Inhalten, probabilistische Bewertung von Interpretationen, Linkanalyse, Netzwerkanalyse)
Informationsassoziation und -recherche, Anfragebeantwortung und Empfehlungsgenerierung

Qualifikationsziele/Kompetenzen:

Wissen: Studierende können die Agentenabstraktion erläutern und Informationsgewinnung im Web (web mining) als rationales Verhalten erläutern. Sie können Details der Architektur von Mining-Agenten (Ziele, Nützlichkeitswerte, Umgebungen) erläutern. Der Begriff des kooperativen und nicht-kooperativen Agenten kann durch die Studierenden im Rahmen von Entscheidungsproblemen diskutiert werden. Um Agenten mit Fähigkeiten zum Umgang mit Unsicherheiten bei der Informationsrecherche in Realweltszenarien auszustatten, können Studierende die wesentlichen Repräsentationswerkzeuge aufzeigen (z.B. Bayessche Netzwerke) und Algorithmen für Berechnungsprobleme für statische und dynamische Szenarien erläutern. Techniken zur automatischen Berechnung von verwendeten Repräsentationen und Modellen können erklärt werden. Damit Agenten mit Entscheidungs-findungskompetenz ausgestattet werden können (zum Beispiel, um festzulegen, wo weiter im Web gesucht werden soll) sind Studierende in der Lage, Entscheidungsfindungsprozesse für einfache und sequentielle Kontexte zu beschreiben und zu gestalten, so dass Szenarien beherrscht werden können, in denen die Agenten vollen oder auch nur partiellen Zugriff auf den Zustand ihres umgebenden Systems haben und den Wert von möglicherweise akquirierbaren Informationen für festgelegte Aufgaben abschätzen müssen. Studierende verfügen über Wissen zur Erläuterung der klassischen und der neueren Techniken zur zielgerichteten Anreicherung von unstrukturierten Daten mit symbolischen Beschreibungen (Multimediadaten-Interpretation, Annotation).
Fertigkeiten: Die Studierenden sind in der Lage, für den Aufbau von Web-Recherche-Systemen geeignete Repräsentations- und Kooperationsformen für Teilprozesse bzw. Agenten auszuwählen. Auf der Basis von multimodalen Daten können die Studierenden Mining-Systeme aufbauen, um explizit gegebene Dateneinheiten (Textdokumente, relationale Daten, Bilder, Videos) auszuwerten, so dass für bestimmte Anfragekontexte nicht nur die Einheiten einfach zurückgegeben werden (oder Zeiger hierauf), sondern eine symbolische, zusammenfassende Beschreibung generiert wird (und ggf. zur sog. Annotation der Einheiten hinzugefügt wird). Insbesondere können die Studierenden auf der Basis von multimodalen Daten Mining-Systeme aufbauen, um explizit gegebene Dateneinheiten (Textdokumente, relationale Daten, Bilder, Videos) auszuwerten, so dass für bestimmte Anfragekontexte nicht nur die Einheiten einfach zurückgegeben werden (oder Zeiger hierauf), sondern eine symbolische, zusammenfassende Beschreibung generiert wird (und ggf. zur sog. Annotation der Einheiten hinzugefügt wird). Die Fertigkeiten der Studierenden umfassen auch die wettbewerbsorientierte Gestaltung von Systemen mit autonomen, von verschiedene Parteien konstruierbaren Agenten, so dass über deren Zusammenspiel ein Mehrwert erzeugt werden kann (Interaktion bzw. Kooperation von Web-Mining-Agenten). Koordinierungsprobleme und Entscheidungsprobleme in einem Multiagenten-Szenario können durch die Studierenden über den Gleichgewichts- und den Mechanismus-Begriff behandelt werden.
Sozialkompetenz und Selbständigkeit: Studierende arbeiten in Gruppen, um Übungsaufgaben und kleine Projekte zu bearbeiten und ihre Lösungen in einem Kurzvortrag zu präsentieren. Selbständiges praktisches Arbeiten der Studierenden wird auch im zugehörenden Projektpraktikum durch die Entwicklung eines größeren Projekts mit aktuellen Programmiersprachen und Werkzeugen aus dem Bereich des Data Science gefördert.

Vergabe von Leistungspunkten und Benotung durch:

Klausur oder mündliche Prüfung nach Maßgabe des Dozenten

Modulverantwortlicher:

Prof. Dr. rer. nat. habil. Ralf Möller

Lehrende:

Institut für Informationssysteme

Literatur:

M. Hall, I. Witten and E. Frank: Data Mining: Practical Machine Learning Tools and Techniques - Morgan Kaufmann, 2011
D. Koller, N. Friedman: Probabilistic Graphical Models: Principles and Techniques - MIT Press, 2009
K. Murphy: Machine Learning: A Probabilistic Perspective - MIT Press, 2012
S. Russel, P. Norvig: Artificial Intelligence: A Modern Approach - Pearson Education, 2010
Y. Shoham, K. Leyton-Brown: Multiagent-Systems: Algorithmic, Game-Theoretic, and Logical Foundations - Cambridge University Press, 2009

Sprache:

Wird nur auf Englisch angeboten

Bemerkungen:

Zulassungsvoraussetzungen zur Belegung des Moduls:
- Keine

Zulassungsvoraussetzungen zur Teilnahme an Modul-Prüfung(en):
- Erfolgreiche Bearbeitung von Übungsaufgaben gemäß Vorgabe am Semesteranfang

Modulprüfung(en):
- CS5131-L1: Web-Mining-Agenten, mündliche Prüfung, 100% der Modulnote

Die Kompetenzen der folgenden Module werden für dieses Modul benötigt (keine harte Zulassungsvoraussetzung):
- Algorithmen und Datenstrukturen (CS1001)
- Lineare Algebra und Diskrete Strukturen I + II (MA1000, MA1500)
- Datenbanken (CS2700)
- Stochastik 1 (MA2510) bzw. Grundlagen der Statistik (PY1800)
- Einführung in die Logik (CS1002)
- Künstliche Intelligenz 1 (CS3204)
- Informationssysteme (CS4130)