fbpx
Glossar
0

Data Warehouse

Wenn es ums Thema Daten geht, dann sind viele Begriffe auf Englisch und ein Laie versteht sie nicht auf Anhieb. Einer dieser Begriffe ist das „Data Warehouse“ – ein Warenhaus von Daten. Es wird benötigt, um wichtige Daten zu sammeln, zu speichern und für die Analyse weiterzuverarbeiten.

In unserem Beitrag zum Data Warehouse 2021 erhältst du alle wichtigen Informationen zum Thema Daten speichern, Datenschutz und Anwendungsbereich von Data Warehouses. Wir erklären dir auch, was die Vor- und Nachteile von einem Data Warehouse sind und für welche Unternehmen sich so ein Datenspeicher lohnt.

Das Wichtigste in Kürze

  • Ein Data Warehouse ist ein Datenspeicher, der für die Betreiber wichtige Daten sammelt, speichert und zur Analyse aufbereitet. Besonders große Unternehmen, bei denen viele Daten anfallen, können von so einem System profitieren.
  • Der Vorteil des Data Warehouses ist es, dass es ein echter Alleskönner ist. Es hat eine große Kapazität für Daten, sie werden einheitlich gespeichert und dient sogar als Grundlage für die weitere Prüfung und Behandlung der Informationen.
  • Der Datenschutz wird in der DSGVO geregelt. Die Daten, welche in ein Data Warehouse kommen, dürfen nur mit der Zustimmung des Betroffenen verwendet werden und auch nur für den vorgesehenen Zweck. Fehlbares Verhalten wird hart geahndet.

Glossareintrag: Der Begriff Data Warehouse im Detail erklärt

Wenn du dich schon mal mit Informatik oder genauer gesagt mit Wirtschaftsinformatik befasst hast, dann bist du bestimmt schon einmal über den Begriff Data Warehouse gestolpert. Aber was genau ist eigentlich so ein «Warenhaus an Daten»? Damit du umfassend informiert bist, haben wir für dich in den folgenden Abschnitten die wichtigsten Fragen rund um das Thema Data Warehouse aufgegriffen. Wir beantworten dir alles, was du zu Date Warehouses im Informationsmanagement wissen musst.

Was genau ist ein Data Warehouse?

Data Warehouse kommt, wie viele Begriffe beim Thema Informatik, aus dem Englischen und bedeutet übersetzt soviel wie «Datenlager». Auf Deutsch würden wir wohl eher «Datenbank» sagen, also ein Speicher von verschiedenen Daten an einem einheitlichen und zentralen Ort. Werden nun Daten in das Data Warehouse eingespeist, dann werden sie dort extrahiert und gespeichert.

Dabei soll eine Langzeitarchivierung erreicht werden, damit die Daten auf keinen Fall verloren gehen, auch wenn das System überholt sein wird. Diese Daten werden aber nicht einfach nur gespeichert, sondern an nachgelagerte Systeme weitergegeben, sodass sie weiter verarbeitet werden können. Nun können die Daten in einem analytischen Prozess ausgewertet werden. (1)

In einem elektronischen Daten-Warenhaus werden Informationen, die für ein Unternehmen relevant sind, gespeichert. Experten können diese dann weiter verwerten, was den Gewinn steigern kann. (Bildquelle: Science in HD / unsplash)

Was genau ein Data Warehouse ist und was nicht, lässt sich nicht ganz trennscharf abgrenzen. Es besteht allerdings ein allgemeiner Konsens darüber, dass bei einem Data Warehouse verschiedenste Datenbestände zu einem gemeinsamen Datenbestand verbunden werden, wobei die nicht benötigten Informationen herausgefiltert werden. (2) Der Inhalt des Data Warehouse besteht somit ausschließlich durch das Kopieren von vorhandenen Daten aus diversen Quellen. Oft kommen diese Quellen aus dem Internet.

Die gespeicherten Daten sind schlussendlich nichts anderes, als unausgewertete Informationen. Sie können beispielsweise von Unternehmen benutzt werden, um bestimmte Entscheidungen zu treffen. Dazu werden sie analytisch aufbereitet. Ein Data Warehouse ist dann besonders hilfreich, wenn eine Gesamtanalyse von einer Vielzahl von Daten aus unterschiedlichen Datenbanken benötigt wird.

Anwendungsbereiche sind beispielsweise die Ermittlung von Kennzahlen oder das Erstellen von Statistiken. Besonders in der Konsumgüterbranche, im medizinischen Bereich, in der Energiebranche oder in der Luftfahrt kommen Data Warehouses oft zum Einsatz. (3)

Wie funktioniert das Data Warehouse und wie ist es aufgebaut?

Du kannst dir ein Data Warehouse wie ein richtiges Warenhaus vorstellen. Ein Lieferant bringt die Produkte, hier die Daten, ins Lager des Warenhauses. Dort wird es einsortiert und «gespeichert». Beim Verarbeiten werden sie gewissermaßen in die Regale des Warenhauses einsortiert. Bei Bedarf können sich Zugriffsberechtigte diese Daten ansehen und weiterverarbeiten, vergleichbar mit Kunden, die sich eine Packung Spaghetti kaufen und später zu Hause kochen.

Vereinfacht gesagt funktioniert ein Data Warehouse genau wie ein richtiges Warenhaus.

Das ist alles stark vereinfacht, aber es gibt dir einen Einblick in die sonst eher abstrakte Welt der elektronischen Datenverwaltung.

Data Warehouses sind ein Bestandteil von einem großen System. Bereits innerhalb dieses Systems werden sie mit Daten und Informationen gefüttert. Auf sie kann mit sogenannten Data Access Tools zugegriffen werden. (4, 5) Damit hat das Data Warehouse nicht nur die Aufgabe, vergangene Daten zu archivieren, sondern auch die Daten auszuwerten.

Wofür brauchen Unternehmen ein Data Warehouse?

Für mittlere bis große Unternehmen kann ein Data Warehouse von großem Vorteil sein. Es stellt Daten zur Verfügung, es analysiert die Daten und die Geschäftsprozesse, es ermittelt Kennzahlen für das Unternehmen und es bringt eine gewisse Struktur in die riesige Datenmenge, welche bei Unternehmen zweifellos anfällt.

Für viele Unternehmen sind Data Warehouses wortwörtlich Gold wert.

Somit ist das Data Warehouse ein Instrument für die IT, für die Geschäftsleitung, aber auch für den Marketingbereich. Anhand von Kundendaten können neue Marktstrategien entworfen und anhand von Feedbacks Verbesserungen beim Produkt realisiert werden. Zudem kann durch ein Data Warehouse auch garantiert werden, dass die Daten angemessen getrennt werden, beispielsweise müssen Daten für das operative Geschäft klar von Daten zur Revision abgegrenzt werden.

Welche Vor- und Nachteile gibt es beim Data Warehouse?

Ein großer Vorteil des Data Warehouses ist es, dass Daten von verschiedenen Quellen in einem Lager vereint werden können, auch wenn diese global verteilt sind. Somit können sie einheitlich gespeichert und bei Bedarf abgerufen werden.

Das ist viel praktischer, als wenn die Daten überall verstreut sind. Die Gefahr, dass die Daten unvollständig sind, verringert sich.

Mit einem Data Warehouse hat dein Unternehmen alle wichtige Daten auf einem Fleck. Wenn du sie benötigst, sind sie schnell aufgerufen und können dir wichtige Informationen liefern. (Bild: ThisisEngineering RAEng / unsplash)

Mit einem Data Warehouse hat dein Unternehmen alle wichtige Daten auf einem Fleck. Wenn du sie benötigst, sind sie schnell aufgerufen und können dir wichtige Informationen liefern.

Weiter kann ein Data Warehouse die Grundlage für die weitere Bearbeitung liefern. Beispielsweise wird es benötigt, wenn man Data-Mining betreiben will, also wenn die Daten systematisch analysiert werden, um an neue und relevante Informationen zu kommen.

Ein Nachteil von Data Warehouses ist, dass die Speicherung von Daten zu rechtlichen Probleme führen kann, Stichwort Datenschutz. Artikel 8 der Charta der Grundrechte der Europäischen Union hält fest, dass personenbezogene Daten geschützt werden müssen. (6) Wichtig ist hierbei die Einwilligung der betroffenen Personen, was besonders online oft problematisch sein kann.

Die personenbezogenen Daten werden im Data Warehouse für eine unbegrenzte Zeit gespeichert. In vielen Fällen ist das länger, als die Daten wirklich benötigt werden oder als die betroffenen Personen es erlauben. Auch das kann gegebenenfalls rechtswidrig sein. Zudem wird das Data Warehouse unübersichtlich und mit redundanten Daten gefüllt. Um das zu verhindern braucht es innerhalb des Warehouses eine gute Struktur.

Vorteile

  • Große Kapazität für Daten
  • Daten aus verschiedenen Quellen
  • Einheitliche Speicherung
  • Grundlage für weitere Bearbeitung

Nachteile

  • Kann rechtlich problematisch sein
  • Ein Großteil der Daten wird nicht benötigt
  • Für kleine Unternehmen nicht geeignet

Zusammenfassend lässt sich sagen, dass ein Data Warehouse ein praktisches Tool für große und mittelgroße Unternehmen ist, um Daten zu beschaffen, zu speichern und auszuwerten. Wenn du beim Thema Datenschutz vorsichtig agierst, dann kann es dem Unternehmen viele operative Vorteile bringen, denn eine saubere Datenanalyse bringt wichtige Kennzahlen und Informationen ans Licht.

Was sind die Unterschiede von Data Warehouse, Data Lake, Data-Mining und Data Mart?

Der Begriff Data Warehouse wird oft mit ähnlichen Begriffen wie Data Lake, Data-Mining und Data Mart benutzt. Doch was ist das alles genau? Wir klären dich auf.

  • Data Lake: Ein Data Lake ist ebenfalls ein Datenspeicher für eine große Menge an Daten. Er nimmt Informationen im Rohformat auf und legt sie unstrukturiert ab. Im Gegensatz dazu führt das Data Warehouse die Informationen aus unterschiedlichen Herkunftsorten zusammen und bereitet sie so auf, dass sie weiterverarbeitet werden können. Damit unterscheiden sich diese beiden Konzepte entscheidend. Beide haben ihre Vorteile und Anwendungsbereiche. Der Data Lake kann die Daten zum Beispiel flexibel abrufen, während das Data Warehouse diese direkt verarbeitet.
  • Data-Mining: Der Name sagt es bereits: Beim Data-Mining wird wortwörtlich nach Daten gegraben. Dabei werden keine neuen Daten generiert, sondern Informationen aus bestehenden Daten extrahiert. Das heißt man nimmt große Datenbestände, beispielsweise aus einem Data Lake oder Data Warehouse, und versucht systematisch, die vorhandenen Daten miteinander in Verbindung zu setzen um neue Erkenntnisse zu gewinnen. Um Data-Mining betreiben zu können, braucht es zwingend eine große Menge an Daten. Somit ermöglicht ein Data Warehouse das Data-Mining.
  • Data Mart: Ein Data Mart ist sozusagen eine Kopie von einem Teil des Data Warehouses. Es wird benutzt, wenn man nicht alle Daten benötigt, um eine Analyse durchzuführen. So kann die Rechenleistung verstärkt werden und die Arbeitsaufteilung fällt leichter. Ebenso können die Daten für die Revision beispielsweise abgekapselt werden. Data Marts kann es nur geben, wenn auch ein Data Warehouse vorhanden ist.

Es ist also wichtig, diese verschiedenen Fachbegriffe unterscheiden zu können. Schlussendlich hängen sie allerdings eng zusammen und werden nicht selten auch gemeinsam eingesetzt. Beispielsweise nennt man die Kombination aus einem Data Warehouse und einem Data Lake eine «Analytics Platform». Diese ermöglicht einheitliche Kennzahlen und vertrauenswürdige Ergebnisse.

Was ist ein gutes Beispiel für ein Data Warehouse?

Wie weiter oben bereits erwähnt funktioniert ein Data Warehouse ähnlich wie ein echtes Warenhaus, einfach mit Daten. Es werden Daten angeliefert, verarbeitet, ausgestellt und verkauft. Interessanterweise kann eine reale Warenhauskette ein Data Warehouse selbst gut gebrauchen. Dieses speichert beispielsweise die Verkaufszahlen oder die Lagerbestände der Warenhäuser.

Mit den Daten können Experten einige Analysen vornehmen und herausfinden, welche Produkte besonders oft verkauft werden und welche weniger. So kann das Produktsortiment entsprechend angepasst werden.

Ein Data Warehouse funktioniert ähnlich wie ein großes Lage, nur dass dort Daten gelagert werden, keine Waren bzw. Produkte. (Bildquelle: 123rf / fotoreactor)

Für die Warenhauskette kann das Data Warehouse die Grundlage für eine Warenkorbanalyse sein, das heißt, es überprüft die Kaufverhalten von Kunden. Diese Informationen sind für das Unternehmen sehr wertvoll. Auch andere Firmen wie Versicherungen, Banken oder Restaurants können von solch einem System profitieren. (7)

Was passiert bei einem Data Warehouse mit den persönlichen Daten?

Wenn deine Daten in ein Data Warehouse kommen, dann werden sie dort – oft für unbegrenzte Zeit – gespeichert und für Analysen genutzt. Die Inhaber des Data Warehouses unterliegen strengen Richtlinien, dass sie die Daten schützen müssen, dass sie sie nicht weitergeben dürfen und dass sie nur für den Zweck dienen dürfen, für den du als Nutzer zugestimmt hast.

Geregelt ist dies in der Datenschutz-Grundverordnung (DSGVO). Betroffene haben dadurch einige Rechte, so wie das Auskunftsrecht und das Recht auf Widerspruch. In der Praxis ist es aber schwierig nachzuvollziehen, wo sich Daten von dir befinden, ob sie anonymisiert sind oder nicht und was genau mit den Daten passiert. Sei darum immer vorsichtig, was für Daten du weitergeben willst. (8)

Personenbezogene Daten spielen häufig eine wichtige Rolle, da sie den Unternehmen am meisten Informationen bringen. Fehlverhalten seitens der Firmen im Umgang mit Daten wird mit hohen Bußgeldern bestraft.

Fazit

Das Data Warehouse ist ein nützliches Werkzeug für grössere Unternehmen, um Daten von unterschiedlichen Quellen zu sammeln, zusammenzuführen und zu verarbeiten. Verschiedene Abteilungen in einem Unternehmen profitieren von einem gut ausgebauten Warenhaus an Daten, beispielsweise das Rechnungswesen oder auch das Marketing.

Vorsicht ist geboten beim Thema Datenschutz: Die Daten müssen gut gesichert sein und dürfen nur für den Zweck benutzt werden, wie der Betroffene es erlaubt. Insgesamt ist es für viele Branchen sinnvoll, ein sortiertes Data Warehouse zu haben. So können sie wichtige Informationen extrahieren, die ihnen im Markt einen erheblichen Vorteil verschaffen können.

Weiterführende Literatur: Quellen und interessante Links

[1] https://www.bigdata-insider.de/was-ist-ein-data-warehouse-a-606701/ [2] https://link.springer.com/chapter/10.1007/978-3-662-53362-8_4 [3] https://www.datenbanken-verstehen.de/data-warehouse/data-warehouse-grundlagen/data-warehouse-beispiele/ [4] https://www.datenbanken-verstehen.de/data-warehouse/data-warehouse-grundlagen/data-warehouse/ [5] https://ramareddydcp.wordpress.com/2017/02/12/what-is-staging-area-and-why-we-need-it-in-dwh/ [6] https://www.europarl.europa.eu/charter/pdf/text_de.pdf [7] https://dbs.uni-leipzig.de/file/dwh-ss08-kap1.pdf [8] https://dsgvo-gesetz.de/

Bildquelle: pixabay / Buffik

Weitere Glossarbeiträge

Featured Artikel im Glossar
Menü