Website
Aktuelles
Montag, 23.03.2020

Forschung

Datenbankzugriffe technisch massiv beschleunigen

Start des DFG-Projekts "Hybrid2 - Indexstrukturen für Hauptspeicherdatenbanken" am Institut für Informationssysteme

Ist es Ihnen auch schon aufgefallen: Ihr Computer scheint nicht annäherungsweise ausgelastet zu sein, aber Sie müssen trotzdem viel zulange auf Informationen aus Ihren Datenbanken warten. Dieser scheinbare Widerspruch liegt darin begründet, dass oftmals die Kapazitäten Ihres Rechners durch die vorhandene Software nicht in vollem Umfang genutzt werden.

Zu dieser Fragestellung ist am Institut für Informationssysteme der Universität zu Lübeck kürzlich das Forschungsprojekt „Hybrid2 - Indexstrukturen für Hauptspeicherdatenbanken“ gestartet worden. Es wird durch die Deutsche Forschungsgemeinschaft (DFG) gefördert und hat zum Ziel, die Performanz zukünftiger Datenbanken durch den Einsatz von Hardwarebeschleunigern massiv zu verbessern. Als Hardwarebeschleuniger kommen dabei die Grafikprozessoren zum Einsatz, die in jedem PC zu finden sind und zumeist neben der Berechnung der Bildschirmausgabe für die täglichen Berechnungsaufgaben des Computers nicht verwendet werden. Wenn man ihre Kapazitäten voll ausschöpft, lässt sich eine massiv parallele Verarbeitung durchführen.

In einem ersten Ansatz wurde bereits eine Beschleunigung (Speedup) mit den Faktor 4 erreicht. Dies entspricht also dem Unterschied zwischen den 25 Stundenkilometern eines Fahrrades mit limitierter Tretunterstützung und den 100 Stundenkilometern eines Autos außerhalb geschlossener Ortschaften. Theoretisch sind noch deutlich größere Speedups möglich, da Grafikprozessoren (Global Processing Unit, GPU) mehrere 1000 bis 10.000 Ausführungseinheiten besitzen, während ein Prozessors eines Computers (Central Processing Unit, CPU) auch bei den Server-CPUs im Many-Core-Bereich höchstens mehrere Dutzend Kerne umfasst.

Der Projektleiter an der Universität zu Lübeck ist Prof. Dr. Sven Groppe am Institut für Informationssysteme. Das Projekt wird zusammen mit dem Institut für Informations- und Kommunikationstechnik der Otto-von-Guericke-Universität Magdeburg unter Leitung von Prof. Thilo Pionteck durchgeführt. Seine Arbeitsgruppe wird die Beschleunigung durch Field Programmable Gate Arrays (FPGAs) untersuchen. Die Projektlaufzeit ist drei Jahre, das Fördervolumen für die Lübecker Gruppe beträgt 300.000 Euro.

„Durch die Reduktion des Kommunikationsaufwands zwischen CPU und Hardwarebeschleunigern bei Shared-Memory-Systemen gehen wir davon aus, dass viele bestehende Entwurfsregeln für den Einsatz von Hardwarebeschleunigern in Datenbanksystemen neu überdacht werden müssen, was insbesondere auch die Komplexität der auf dem Hardwarebeschleuniger ausgelagerten Aufgaben betrifft“, sagt Projektleiter Prof. Dr. Sven Groppe. „Im Rahmen des Projektes wollen wir daher erforschen, welche statischen oder dynamischen Indexstrukturen sich effizient und performant auf hybriden Systemen wie realisieren lassen.“

Signifikante Leistungssteigerung

Im Detail ist das Ziel des gestarteten Projektes die Beschleunigung des Indexzugriffs von Datenbankmanagementsystemen (DBMS) zur Steigerung der Gesamtsystemperformanz. Da der Indexzugriff Ausgangspunkt für alle nachfolgenden Verarbeitungsschritte von An-fragen eines DBMS ist, ist ein schneller Indexzugriff wesentlich für die Gesamtperformanz der DBMS.

Zur Beschleunigung des Indexzugriffs wollen die Wissenschaftler neue Hardware-/Softwarestrukturen von Indexen entwickeln. Sie werden dabei untersuchen, welche strukturhybriden Indexe, d.h. Kombinationen von statischen und dynamischen Indexen, für sogenannte hybride Shared-Memory-Systemarchitekturen am geeignetsten sind. Hybride Shared-Memory-Systemarchitekturen bestehen aus einer CPU und einem FPGA oder GPU als Hardwarebeschleuniger, die auf den Hauptspeicher genauso schnell wie die CPU zugreifen können. Solche Hybrid2-Indexe wurden in der Literatur bisher nicht betrachtet, wodurch die Möglichkeiten aktueller hybrider Shared-Memory Systemarchitekturen nicht genutzt werden können.

Außerdem wollen die Wissenschaftler untersuchen, wie durch einen dynamischen Wechsel zwischen Indexstrukturen oder einen Austausch der Hardwarerealisierung zur Laufzeit auf unterschiedliche Zugriffsmuster reagiert werden kann. Im Ergebnis dieses Projektes erwarten sie neuartige, adaptive struktur- und hardwarehybride Indexstrukturen, die gegenüber bestehenden Systemen zu einer signifikanten Leistungssteigerung bei Indexzugriffen in Datenbanken führen.

Prof. Dr. Sven Groppe forscht seit 2002 im Bereich der Datenbanken, des Semantic Webs und des Internet der Dinge (Internet of Things) und hat unter anderem international renommierte Workshops an den weltbesten gerankten Datenbankkonferenzen „Special Interest Group on Management of Data“ (SIGMOD) und „Very Large Data Bases“ (VLDB) geleitet. Zwei der Workshops finden in den nächsten Monaten statt: „Semantic Big Data“ im Juni in Portland, USA, (https://www.ifis.uni-luebeck.de/~groppe/sbd/) und „Very Large Internet of Things“ im September in Tokio, Japan (https://www.ifis.uni-luebeck.de/~groppe/vliot/).

Prof. Dr. Sven Groppe erläutert anhand eines Architekturbildes die beschleunigte Verarbeitung von Anfragen an eine Datenbank (Foto: IFIS; Ausschnitt)