Website
Modulhandbuch

Modul CS5131-KP08, CS5131

Web-Mining-Agenten (WebMining)

Dauer:
1 Semester
Angebotsturnus:
Jedes Wintersemester
Leistungspunkte:
8
Studiengang, Fachgebiet und Fachsemester:
  • Master Medieninformatik 2020 (Wahlpflicht), Informatik, Beliebiges Fachsemester
  • Master Medizinische Informatik 2019 (Wahlpflicht), eHealth / Informatik, 1. oder 2. Fachsemester
  • Master Mathematik in Medizin und Lebenswissenschaften 2010 (Wahlpflicht), Informatik, Beliebiges Fachsemester
  • Master Medieninformatik 2014 (Wahlpflicht), Informatik, Beliebiges Fachsemester
  • Master Medizinische Informatik 2014 (Wahlpflicht), eHealth / Informatik, 1. oder 2. Fachsemester
Lehrveranstaltungen:
  • CS5131-Ü: Web-Mining-Agenten (Übung, 1 SWS)
  • CS5131-P: Web-Mining-Agenten (Praktikum, 1 SWS)
  • CS5131-V: Web-Mining-Agenten (Vorlesung, 4 SWS)
Workload:
  • 30 Stunden Prüfungsvorbereitung
  • 120 Stunden Selbststudium
  • 90 Stunden Präsenzstudium
Lehrinhalte:
  • Wahrscheinlichkeiten und generative Modelle für diskrete Daten
  • Gauss-Modelle, Bayesscher und frequentistischer Wahrscheinlichkeitsbegriff
  • Graphische Wahrscheinlichkeitsmodelle (z.B. Bayessche Netze), Lernen von Parametern und Strukturen (Algorithmen BME, MAP, ML, EM), wahrscheinlichkeitsbasierte Klassifikation, Relationale graphische Wahrscheinlichkeitsmodelle
  • Dynamische graphische Wahrscheinlichkeitsmodelle (dynamische Bayessche Netzwerke, Markov-Annahme, Zustandsübergangs- und Sensor-Modelle, Berechnungsprobleme: Filterung, Prädiktion, Glättung, wahrscheinlichste Zustandsfolge), Erweiterungen (Hidden-Markov-Modelle, Kalman-Filter), exakte und approximative Verfahren zur Lösung von Berechnungsproblemen, Automatische Bestimmung von Parametern und Struktur von dynamischen graphischen Wahrscheinlichkeitsmodellen
  • Kausale Netze (Intervention, instrumentale Variable, Kontrafaktische Konditionale)
  • Gemischte Modelle, Latente lineare Modelle (LDA, LSI, PCA), dünn besetzte lineare Modelle
  • Entscheidungsfindung unter Unsicherheit: Nützlichkeitstheorie, Entscheidungsnetzwerke, Wert von Information, sequentielle Entscheidungsprobleme und -Algorithmen (Wert-Iteration, Strategie-Iteration), Markov-Entscheidungsprobleme (MDPs), entscheidungstheoretische konstruierte Agenten, Markov-Entscheidungsprobleme unter partieller Beobachtbarkeit (POMDP), dynamische Entscheidungsnetzwerke, Parameter- und Strukturbestimmung durch wiederholte Verstärkung (reinforcement learning)
  • Interaktion von Agenten: Spieltheorie, Betrachtung von Entscheidungen und Aktionen mehrerer Agenten (Nash-Gleichgewicht, ?Bayes-Nash-Gleichgewicht), Soziale Entscheidung (Abstimmung, Präferenzen, Paradoxien, Arrow's Theorem), Mechanismen, ?Mechanismen-Entwurf (kontrollierte Autonomie), Bilaterale Mechanismen: Regeln des Zusammentreffens (rules of encounter)
  • Multimedia-Interpretation für Webrecherchen (Erkennung benannter Entitäten, Duplikateliminierung, Interpretation von Inhalten, probabilistische Bewertung von Interpretationen, Linkanalyse, Netzwerkanalyse)
  • Informationsassoziation und -recherche, Anfragebeantwortung und Empfehlungsgenerierung
Qualifikationsziele/Kompetenzen:
  • Wissen: Studierende können die Agentenabstraktion erläutern und Informationsgewinnung im Web (web mining) als rationales Verhalten erläutern. Sie können Details der Architektur von Mining-Agenten (Ziele, Nützlichkeitswerte, Umgebungen) erläutern. Der Begriff des kooperativen und nicht-kooperativen Agenten kann durch die Studierenden im Rahmen von Entscheidungsproblemen diskutiert werden. Um Agenten mit Fähigkeiten zum Umgang mit Unsicherheiten bei der Informationsrecherche in Realweltszenarien auszustatten, können Studierende die wesentlichen Repräsentationswerkzeuge aufzeigen (z.B. Bayessche Netzwerke) und Algorithmen für Berechnungsprobleme für statische und dynamische Szenarien erläutern. Techniken zur automatischen Berechnung von verwendeten Repräsentationen und Modellen können erklärt werden. Damit Agenten mit Entscheidungs-findungskompetenz ausgestattet werden können (zum Beispiel, um festzulegen, wo weiter im Web gesucht werden soll) sind Studierende in der Lage, Entscheidungsfindungsprozesse für einfache und sequentielle Kontexte zu beschreiben und zu gestalten, so dass Szenarien beherrscht werden können, in denen die Agenten vollen oder auch nur partiellen Zugriff auf den Zustand ihres umgebenden Systems haben und den Wert von möglicherweise akquirierbaren Informationen für festgelegte Aufgaben abschätzen müssen. Studierende verfügen über Wissen zur Erläuterung der klassischen und der neueren Techniken zur zielgerichteten Anreicherung von unstrukturierten Daten mit symbolischen Beschreibungen (Multimediadaten-Interpretation, Annotation).
  • Fertigkeiten: Die Studierenden sind in der Lage, für den Aufbau von Web-Recherche-Systemen geeignete Repräsentations- und Kooperationsformen für Teilprozesse bzw. Agenten auszuwählen. Auf der Basis von multimodalen Daten können die Studierenden Mining-Systeme aufbauen, um explizit gegebene Dateneinheiten (Textdokumente, relationale Daten, Bilder, Videos) auszuwerten, so dass für bestimmte Anfragekontexte nicht nur die Einheiten einfach zurückgegeben werden (oder Zeiger hierauf), sondern eine symbolische, zusammenfassende Beschreibung generiert wird (und ggf. zur sog. Annotation der Einheiten hinzugefügt wird). Insbesondere können die Studierenden auf der Basis von multimodalen Daten Mining-Systeme aufbauen, um explizit gegebene Dateneinheiten (Textdokumente, relationale Daten, Bilder, Videos) auszuwerten, so dass für bestimmte Anfragekontexte nicht nur die Einheiten einfach zurückgegeben werden (oder Zeiger hierauf), sondern eine symbolische, zusammenfassende Beschreibung generiert wird (und ggf. zur sog. Annotation der Einheiten hinzugefügt wird). Die Fertigkeiten der Studierenden umfassen auch die wettbewerbsorientierte Gestaltung von Systemen mit autonomen, von verschiedene Parteien konstruierbaren Agenten, so dass über deren Zusammenspiel ein Mehrwert erzeugt werden kann (Interaktion bzw. Kooperation von Web-Mining-Agenten). Koordinierungsprobleme und Entscheidungsprobleme in einem Multiagenten-Szenario können durch die Studierenden über den Gleichgewichts- und den Mechanismus-Begriff behandelt werden.
  • Sozialkompetenz und Selbständigkeit: Studierende arbeiten in Gruppen, um Übungsaufgaben und kleine Projekte zu bearbeiten und ihre Lösungen in einem Kurzvortrag zu präsentieren. Selbständiges praktisches Arbeiten der Studierenden wird auch im zugehörenden Projektpraktikum durch die Entwicklung eines größeren Projekts mit aktuellen Programmiersprachen und Werkzeugen aus dem Bereich des Data Science gefördert.
Vergabe von Leistungspunkten und Benotung durch:
  • Klausur oder mündliche Prüfung nach Maßgabe des Dozenten
Modulverantwortlicher:
Lehrende:
Literatur:
  • M. Hall, I. Witten and E. Frank: Data Mining: Practical Machine Learning Tools and Techniques - Morgan Kaufmann, 2011
  • D. Koller, N. Friedman: Probabilistic Graphical Models: Principles and Techniques - MIT Press, 2009
  • K. Murphy: Machine Learning: A Probabilistic Perspective - MIT Press, 2012
  • S. Russel, P. Norvig: Artificial Intelligence: A Modern Approach - Pearson Education, 2010
  • Y. Shoham, K. Leyton-Brown: Multiagent-Systems: Algorithmic, Game-Theoretic, and Logical Foundations - Cambridge University Press, 2009
Sprache:
  • Wird nur auf Englisch angeboten
Bemerkungen:

Prüfungsvorleistungen können zu Beginn des Semesters festgelegt werden. Sind Vorleistungen definiert, müssen diese vor der Erstprüfung erbracht und positiv bewertet worden sein. Diese Lehrveranstaltung setzt die folgenden Bachelor-Module voraus: - Algorithmen und Datenstrukturen (CS1001) - Lineare Algebra und Diskrete Strukturen I + II (MA1000, MA1500) - Datenbanken (CS2700) - Stochastik 1 (MA2510) bzw. Grundlagen der Statistik (PY1800) Empfohlen wird die Teilnahme an den folgenden Modulen: - Einführung in die Logik (CS1002) - Künstliche Intelligenz 1 (CS3204) - Informationssysteme (CS4130)

Letzte Änderung:
17.7.2019