Website
Modulhandbuch vor WS2020/21

Modul CS5131 T

Modulteil: Web-Mining-Agenten (WebMininga)

Dauer:


1 Semester
Angebotsturnus:


Wird nicht mehr angeboten
Leistungspunkte:


8
Studiengang, Fachgebiet und Fachsemester:
  • Zertifikatsstudium Künstliche Intelligenz (Modulteil eines Pflichtmoduls), Modulteil, 1. Fachsemester
  • Master IT-Sicherheit 2019 (Modulteil eines Wahlmoduls), Modulteil, 1. oder 2. Fachsemester
  • Master Informatik 2019 (Modulteil eines Wahlmoduls), Modulteil, Beliebiges Fachsemester
  • Master Entrepreneurship in digitalen Technologien 2020 (Modulteil eines Wahlmoduls), Modulteil, Beliebiges Fachsemester
  • Master Entrepreneurship in digitalen Technologien 2014 (Modulteil eines Wahlmoduls), Modulteil, Beliebiges Fachsemester
  • Master Informatik 2014 (Modulteil eines Wahlmoduls), Modulteil, Beliebiges Fachsemester
Lehrveranstaltungen:
  • CS5131-Ü: Web-Mining-Agenten (Übung, 1 SWS)
  • CS5131-P: Web-Mining-Agenten (Praktikum, 1 SWS)
  • CS5131-V: Web-Mining-Agenten (Vorlesung, 4 SWS)
Workload:
  • 90 Stunden Präsenzstudium
  • 120 Stunden Selbststudium
  • 30 Stunden Prüfungsvorbereitung
Lehrinhalte:
  • Wahrscheinlichkeiten und generative Modelle für diskrete Daten
  • Gauss-Modelle, Bayesscher und frequentistischer Wahrscheinlichkeitsbegriff
  • Graphische Wahrscheinlichkeitsmodelle (z.B. Bayessche Netze), Lernen von Parametern und Strukturen (Algorithmen BME, MAP, ML, EM), wahrscheinlichkeitsbasierte Klassifikation, Relationale graphische Wahrscheinlichkeitsmodelle
  • Dynamische graphische Wahrscheinlichkeitsmodelle (dynamische Bayessche Netzwerke, Markov-Annahme, Zustandsübergangs- und Sensor-Modelle, Berechnungsprobleme: Filterung, Prädiktion, Glättung, wahrscheinlichste Zustandsfolge), Erweiterungen (Hidden-Markov-Modelle, Kalman-Filter), exakte und approximative Verfahren zur Lösung von Berechnungsproblemen, Automatische Bestimmung von Parametern und Struktur von dynamischen graphischen Wahrscheinlichkeitsmodellen
  • Kausale Netze (Intervention, instrumentale Variable, Kontrafaktische Konditionale)
  • Gemischte Modelle, Latente lineare Modelle (LDA, LSI, PCA), dünn besetzte lineare Modelle
  • Entscheidungsfindung unter Unsicherheit: Nützlichkeitstheorie, Entscheidungsnetzwerke, Wert von Information, sequentielle Entscheidungsprobleme und -Algorithmen (Wert-Iteration, Strategie-Iteration), Markov-Entscheidungsprobleme (MDPs), entscheidungstheoretische konstruierte Agenten, Markov-Entscheidungsprobleme unter partieller Beobachtbarkeit (POMDP), dynamische Entscheidungsnetzwerke, Parameter- und Strukturbestimmung durch wiederholte Verstärkung (reinforcement learning)
  • Interaktion von Agenten: Spieltheorie, Betrachtung von Entscheidungen und Aktionen mehrerer Agenten (Nash-Gleichgewicht, ?Bayes-Nash-Gleichgewicht), Soziale Entscheidung (Abstimmung, Präferenzen, Paradoxien, Arrow's Theorem), Mechanismen, ?Mechanismen-Entwurf (kontrollierte Autonomie), Bilaterale Mechanismen: Regeln des Zusammentreffens (rules of encounter)
  • Multimedia-Interpretation für Webrecherchen (Erkennung benannter Entitäten, Duplikateliminierung, Interpretation von Inhalten, probabilistische Bewertung von Interpretationen, Linkanalyse, Netzwerkanalyse)
  • Informationsassoziation und -recherche, Anfragebeantwortung und Empfehlungsgenerierung
Qualifikationsziele/Kompetenzen:
  • Wissen: Studierende können die Agentenabstraktion erläutern und Informationsgewinnung im Web (web mining) als rationales Verhalten erläutern. Sie können Details der Architektur von Mining-Agenten (Ziele, Nützlichkeitswerte, Umgebungen) erläutern. Der Begriff des kooperativen und nicht-kooperativen Agenten kann durch die Studierenden im Rahmen von Entscheidungsproblemen diskutiert werden. Um Agenten mit Fähigkeiten zum Umgang mit Unsicherheiten bei der Informationsrecherche in Realweltszenarien auszustatten, können Studierende die wesentlichen Repräsentationswerkzeuge aufzeigen (z.B. Bayessche Netzwerke) und Algorithmen für Berechnungsprobleme für statische und dynamische Szenarien erläutern. Techniken zur automatischen Berechnung von verwendeten Repräsentationen und Modellen können erklärt werden. Damit Agenten mit Entscheidungs-findungskompetenz ausgestattet werden können (zum Beispiel, um festzulegen, wo weiter im Web gesucht werden soll) sind Studierende in der Lage, Entscheidungsfindungsprozesse für einfache und sequentielle Kontexte zu beschreiben und zu gestalten, so dass Szenarien beherrscht werden können, in denen die Agenten vollen oder auch nur partiellen Zugriff auf den Zustand ihres umgebenden Systems haben und den Wert von möglicherweise akquirierbaren Informationen für festgelegte Aufgaben abschätzen müssen. Studierende verfügen über Wissen zur Erläuterung der klassischen und der neueren Techniken zur zielgerichteten Anreicherung von unstrukturierten Daten mit symbolischen Beschreibungen (Multimediadaten-Interpretation, Annotation).
  • Fertigkeiten: Die Studierenden sind in der Lage, für den Aufbau von Web-Recherche-Systemen geeignete Repräsentations- und Kooperationsformen für Teilprozesse bzw. Agenten auszuwählen. Auf der Basis von multimodalen Daten können die Studierenden Mining-Systeme aufbauen, um explizit gegebene Dateneinheiten (Textdokumente, relationale Daten, Bilder, Videos) auszuwerten, so dass für bestimmte Anfragekontexte nicht nur die Einheiten einfach zurückgegeben werden (oder Zeiger hierauf), sondern eine symbolische, zusammenfassende Beschreibung generiert wird (und ggf. zur sog. Annotation der Einheiten hinzugefügt wird). Insbesondere können die Studierenden auf der Basis von multimodalen Daten Mining-Systeme aufbauen, um explizit gegebene Dateneinheiten (Textdokumente, relationale Daten, Bilder, Videos) auszuwerten, so dass für bestimmte Anfragekontexte nicht nur die Einheiten einfach zurückgegeben werden (oder Zeiger hierauf), sondern eine symbolische, zusammenfassende Beschreibung generiert wird (und ggf. zur sog. Annotation der Einheiten hinzugefügt wird). Die Fertigkeiten der Studierenden umfassen auch die wettbewerbsorientierte Gestaltung von Systemen mit autonomen, von verschiedene Parteien konstruierbaren Agenten, so dass über deren Zusammenspiel ein Mehrwert erzeugt werden kann (Interaktion bzw. Kooperation von Web-Mining-Agenten). Koordinierungsprobleme und Entscheidungsprobleme in einem Multiagenten-Szenario können durch die Studierenden über den Gleichgewichts- und den Mechanismus-Begriff behandelt werden.
  • Sozialkompetenz und Selbständigkeit: Studierende arbeiten in Gruppen, um Übungsaufgaben und kleine Projekte zu bearbeiten und ihre Lösungen in einem Kurzvortrag zu präsentieren. Selbständiges praktisches Arbeiten der Studierenden wird auch im zugehörenden Projektpraktikum durch die Entwicklung eines größeren Projekts mit aktuellen Programmiersprachen und Werkzeugen aus dem Bereich des Data Science gefördert.
Vergabe von Leistungspunkten und Benotung durch:
  • Prüfungsform hängt vom übergeordneten Modul ab
Modulverantwortlicher:
  • Siehe Hauptmodul
Lehrende:
Literatur:
  • M. Hall, I. Witten and E. Frank: Data Mining: Practical Machine Learning Tools and Techniques - Morgan Kaufmann, 2011
  • D. Koller, N. Friedman: Probabilistic Graphical Models: Principles and Techniques - MIT Press, 2009
  • K. Murphy: Machine Learning: A Probabilistic Perspective - MIT Press, 2012
  • S. Russel, P. Norvig: Artificial Intelligence: A Modern Approach - Pearson Education, 2010
  • Y. Shoham, K. Leyton-Brown: Multiagent-Systems: Algorithmic, Game-Theoretic, and Logical Foundations - Cambridge University Press, 2009
  • : Journal-Artikel zu speziellen Themen der Veranstaltung werden in der Vorlesung bekanntgegeben
Sprache:
  • Wird nur auf Englisch angeboten
Bemerkungen:

Zulassungsvoraussetzungen zum Modul:
- Keine

Zulassungsvoraussetzungen zur Prüfung:
- Prüfungsvorleistungen können zu Beginn des Semesters festgelegt werden. Sind Vorleistungen definiert, müssen diese vor der Erstprüfung erbracht und positiv bewertet worden sein.

Die Kompetenzen der folgenden Module werden für dieses Modul benötigt (keine harte Zulassungsvoraussetzung):
- Algorithmen und Datenstrukturen (CS1001)
- Lineare Algebra und Diskrete Strukturen I + II (MA1000, MA1500)
- Datenbanken (CS2700)
- Stochastik 1 (MA2510) bzw. Grundlagen der Statistik (PY1800)
- Einführung in die Logik (CS1002)
- Künstliche Intelligenz 1 (CS3204)
- Informationssysteme (CS4130)

(Ist gleich CS5131)
(Ist Modulteil von CS4513, CS4514-KP12)

Letzte Änderung:
12.7.2022