Archiv für die Kategorie ‘Datenbanken’

Trusted-Cloud Wettbewerb des BMWi gewonnen

3. März 2011 | Geschrieben von Jörg Bienert | Keine Kommentare »

Das Bundeswirtschaftsministerium hatte einen Wettbewerb für die Förderung von “Trusted Cloud” Aktivitäten ausgeschrieben. Über 100 Anträge gingen ein von denen 12 Projekte Fördermittel erhalten. Wir sind stolz darauf, im Rahmen des MIA Konsortiums aus der TU Berlin und weiteren Partnern zu den Gewinnern von Fördermitteln zu gehören.

Am ersten Tag der Cebit fand die offizielle Bekanntgabe auf der Cebit statt (s. Foto)

Über Inhalte und Zielsetzung unseres gemeinsamen unter der Leitung der TU Berlin und Prof. Volker Markl entstandenen Projektes möchte ich auf folgende Pressemitteilung verweisen.

MIA – ein Marktplatz für Informationen und Analysen
Das deutschsprachige Web mit derzeit mehr als 6 Milliarden Webseiten bietet ein außerordentliches Potential für zahlreiche Anwendungen (APPs), z.B. in den Bereichen Markt- und Trendforschung, Vertrieb von Nachrichten, der Sprachverarbeitung und allgemein der „Business Intelligence“ (Unternehmenssteuerung). In dem Projekt „MIA – ein Marktplatz für Informationen und Analysen“, das vom Bundeswirtschaftsministerium im Rahmen des „Trusted-Cloud“-Wettbewerbs gefördert wird, entwickelt ein Konsortium von Industrie- und Forschungspartnern unter der Leitung des Fachgebiets Datenbanksysteme und Informationsmanagement (DIMA) der Technischen Universität Berlin einen Prototypen für einen Informationsmarktplatz für Deutschland. Ziel des Projekts ist es, durch die Schaffung einer Marktplatz-Infrastruktur die Bereitstellung, Veredelung, Vermarktung und Abrechnung von Daten und Mehrwertdiensten auf diesen Daten zu ermöglichen. Um dieses Ziel zu realisieren, erfolgt eine Übertragung und Adaption von Ergebnissen aus der Grundlagenforschung in Cloud Computing und Informationsmanagement (z.B. aus dem THESEUS – Alexandria Projekt, und der DFG Forschergruppe „Stratosphere – Informationsmanagement in der Cloud“). Ein besonderes Merkmal des Projekts ist es, dass das deutschsprachige Internet inklusive seiner Historie als Datenbasis für Analysen und Mehrwertdienste bereitgestellt werden soll. Eine derartige Infrastruktur ermöglicht völlig neuartige Geschäftsmodelle mit Informationen und Analysen als elektronisch handelbarem Gut, die darauf bauen, in den Daten implizit und unstrukturiert vorhandenes Wissen durch algorithmische Verfahren explizit und damit nutzbar zu machen. Die gemeinschaftliche Speicherung, Analyse und Verwertung der Daten des deutschsprachigen Webs bietet erhebliche Kosteneinsparpotentiale bzw. hohe Innovationspotentiale. Auf diese Weise soll eine Basis für die Informationsökonomie in Deutschland geschaffen werden, die es insbesondere kleinen und mittelständischen Unternehmen (KMU) ermöglichen wird, Daten und Analyseverfahren anzubieten und nachzufragen. Dadurch werden insbesondere für KMU erhebliche Markteintrittsbarrieren und Innovationsbarrieren beseitigt. In der ersten Pilotierung enthält der Marktplatz Anwendungsfälle für die Branchen „Medien“, „Marktforschung“ und „Beratung“ unter besonderer Berücksichtigung der hierfür spezifischen Anforderungen an Datenschutz und Datensicherheit. In weiteren Ausbaustufen werden eine Internationalisierung sowie die Ausweitung der bereitgestellten Dienstleistungen angestrebt.

Das Bundesministerium für Wirtschaft und Technologie (BMWi) fördert durch “Trusted Cloud” die Entwicklung und Erprobung von innovativen, sicheren und rechtskonformen Cloud Computing-Diensten mit insgesamt rund 50 Mio. Euro. Hinzu kommen Eigenmittel der Projektbeteiligten in etwa gleicher Höhe, so dass insgesamt rund 100 Mio. Euro zur Verfügung stehen. Das BMWi-Technologieprogramm “Trusted Cloud” ist Teil des Aktionsprogramms Cloud Computing, das das BMWi im Oktober 2010 gemeinsam mit Partnern aus Wirtschaft und Wissenschaft gestartet hat.

Konsortialführer:

Fachgebiet Datenbanksysteme und Informationsmanagement (DIMA), Technische Universität Berlin

Konsortialpartner:

Empulse GmbH

Fraunhofer Institut für Rechner und Systemtechnik (FIRST)

Neofonie GmbH

Temis Deutschland GmbH

VICO Research & Consulting GmbH

Conference on Very Large Databases (VLDB) in Singapur

17. September 2010 | Geschrieben von Jörg Bienert | Keine Kommentare »

Die VLDB ist ein der anerkanntesten Konferenzen im Bereich Datenbanken und deren Technologie. Ich bin daher nach Singapur geflogen, um zu erfahren, was die derzeit heißen Themen in der Forschungsgemeinschaft sind und wohin der Weg in den nächsten Jahren führen wird.

Eines der Hauptthemen in den vielfältigen Präsentation ist das Verarbeiten und Analysieren von riesigen Datenmengen. Die Vortragenden aus Industrie und Forschung stellen fest, dass diese Mengen von Jahr zu Jahr zunehmen und etablierte Datenbanksysteme mit dieser Aufgabe Probleme haben. Dies liegt laut deren Aussagen unter anderem daran, dass viele dieser System auf einer 20-30 Jahre alten Softwarearchitektur beruhen. Genau dieses Anwendungsfeld und diese Schwäche sind der Grund weswegen wir mit unserer eigenen Datenbank ParStream den Markt betreten.

Ein weiterer Schwerpunkt der Konferenz sind Map-Reduce Ansätze und Hadoop. Mein Eindruck ist, dass dieses Thema insbesondere auf Grund der einfach horizontalen Datenpartitionierung und der damit einhergehenden Skalierbarkeit weit verbreitet ist. Allerdings ist die Anfrageperformanz weiterhin problematisch. Viele Wissenschaftler (z.B. ein Team der Universät des Saarlandes und dem Thema hadoop++) arbeiten daran diese zu verbessern. Es stellt sich aber weiterhin die Frage, ob Map-Reduce durch solche Verfahren genügend beschleunigt werden kann ohne das weiterhin immense Hardwareinfrastruktur benötigt wird und immense Energiekosten entstehen. Gerüchteweise denkt sogar Google darüber nach diesen Ansatz ad-acta zu legen – http://tech.slashdot.org/story/10/09/12/0155259/Google-Caffeine-Drops-MapReduce-Adds-Colossus

Ein Thema, welches mir besonders nahe liegt und welches auch vielfach besprochen wurde, sind GPU-basierte Ansätze, um die Performanz einer Datenbank zu verbessern. Ein Großteil der Beiträge sieht diese Technologie derzeit noch als “still to come” oder sieht weitere Aufgaben “for future research”. Kein einziger Ansatz zeigte bereits laufende und einsatzbare Software, welche die massive Parallelität von GPUs so fundamental ausnutzt wie es in unserer ParStream geschieht.

Alles in allem hab ich auf dieser Konferenz einen guten Eindruck über die zukünftige Richtung der Forschung und der Industrie gewonnen. Nicht zuletzt dadurch bin ich nun noch überzeugter, dass wir mit der Architektur und der generellen Entwicklung der ParStream auf dem absolut richtigen Weg sind und das es ein riesiges Potential am Markt für diesen Ansatz gibt.