DER BERICHT ZU CLOUD-DATEN
Verlagerung von Big
Data in die Cloud
Die meisten Unternehmen streben an, ihre Daten zu erfassen und zu analysieren. Aber wie und wo geht dies vonstatten?
In der Vergangenheit waren Lösungen ausschließlich auf standortgebunden bereitgestellte Datenbanken beschränkt.
Heute müssen sich Unternehmen jedoch in einer großen Anzahl von Technologien und Bereitstellungsarten zurechtfinden. Von einzelnen Datenbanken und Hadoop-Produkten bis hin zu Cloud-, standortgebundenen und hybriden Bereitstellungen – die Landschaft ist vielfältig und verändert sich rasch.
Der Bericht zu Cloud-Daten wird fortlaufend aktualisiert und zielt darauf ab, die Entwicklung dieses Umfelds zu quantifizieren. Untersucht werden dabei die Verbindungen zu Datenquellen, die weltweit von Tableau
Online-Kunden genutzt werden. Die Analyse dieser Verbindungen gewährt einen Einblick dazu, wie und wo Unternehmen heute ihre Daten analysieren.
Unsere Methode:
Im Bericht zu Cloud-Daten werden stichprobenartig über eine Million anonymisierter Datenquellenverbindungen untersucht, die von mehr als 4.000 Kunden auf Tableau Online veröffentlicht wurden. Da es sich um ein in der Cloud gehostetes Tool handelt, weist das Nutzungsverhalten möglicherweise insgesamt eine Tendenz zur Cloud auf.
Andererseits sind die Kunden von Tableau Online in fast jeder Branche anzutreffen und reichen von kleinen
Unternehmen bis hin zu großen Konzernen. Dieser Bericht umfasst die Daten von all diesen Unternehmen, und wir sind davon überzeugt, dass sie ein aussagekräftiger Indikator für die allgemeinen Markttrends sind.
Wesentliche Erkenntnisse
Die Datenspeicherung expandiert über unsere herkömmlichen Datenbankkonzepte hinaus
• Die Kunden von Tableau Online verwenden für ihre Analysen zahlreiche unterschiedliche Datenquellen.
Es werden mehr als 40 Arten von Datenquellen eingesetzt, von proprietären Datenbanken bis hin zu Open-Source-Tools wie Hadoop. Zwei Drittel dieser Datenquellentypen werden häufiger in der Cloud bereitgestellt als standortgebunden installiert.
Der Datenschwerpunkt bewegt sich in Richtung Cloud
• Die Anzahl von Verbindungen zu in der Cloud gehosteten Daten ist in den vergangenen 15 Monaten um 28 % angestiegen. Im Januar 2015 waren die Verbindungen zu Datenquellen in Tableau Online beinahe gleichmäßig auf die Cloud und eine standortgebundene Bereitstellung verteilt. Im ersten Quartal 2016 hat sich das Verhältnis bereits zu 70 % in der Cloud und 30 % standortgebundener Bereitstellung verändert.
• Cloud-native Datenquellen wie Amazon Redshift und Google BigQuery gewinnen an Marktanteil. Anfang 2014 stellten sie lediglich 12 % aller Verbindungen in Tableau Online dar. Bis zum ersten Quartal des Jahres 2016 ist ihr Anteil auf 28 % aller Verbindungen angestiegen.
Hybride Datentechnologien bleiben für Geschäftsabläufe entscheidend
• Hybride Datenquellen – Datenquellen, die entweder standortgebunden oder in der Cloud bereitgestellt werden können – bleiben die von Tableau Online-Kunden mit Abstand am häufigsten genutzte Verbindungsart. In den vergangenen beiden Jahren machten Verbindungen zu hybriden Datenquellen immer mindestens 60 % aller Verbindungen aus.
• Auch bei hybriden Daten geht die Entwicklung jedoch in Richtung Cloud. Vor fünfzehn Monaten war der Anteil hybrider Datenquellen bei Kunden von Tableau Online gleichmäßig auf die Cloud und eine standortgebundene
Bereitstellung verteilt. Bis zum ersten Quartal des Jahres 2016 hat sich der Anteil an in der Cloud bereitgestellten hybriden Datenquellen auf 60 % erhöht.
Sie hätten gern noch weitere Informationen?
Erfahren Sie mehr über die visuelle Datenanalyse und den Bericht zu Cloud-Daten, einschließlich der neuesten Version der Analyse der tatsächlichen Nutzung auf Cloud-Plattformen wie Amazon Web Services, Microsoft Azure und Google Cloud Platform.
Die
Datenlandschaft ist vielseitig
DATENQUELLENVERBINDUNGEN
Nutzer von Tableau Online verwenden mehr als 40 verschiedene Arten von Datenquellen.
Sogar wenn dateibasierte Quellen wie Excel und geschäftsspezifische
Webanwendungen wie Salesforce und Google Analytics nicht berücksichtigt werden, sind 32 verschiedene Arten von Datenbanken und Hadoop-
Systemumfeldern repräsentiert. Diese Vielfalt ist bezeichnend für die breite und diversifizierte Landschaft heute verfügbarer Datenmanagement-Tools.
CLOUD-DATEN
In Zukunft wird diese Vielfalt nur weiter zunehmen. Laut dem Marktforschungsinstitut Gartner befinden sich operative Datenmanagementsysteme „im Aufwind, wobei neue Mitbewerber die Position der etablierten Unternehmen in Frage stellen“. Wie Gartner weiter berichtet, sind es – im Hinblick auf Warehousing-Tools, die speziell für die Datenanalyse konzipiert wurden – disruptive Technologien, die Innovation beschleunigen.
Ob Nutzer die Cloud- oder die standortgebundene Bereitstellung bevorzugen, hängt stark von der Art der Datenquelle ab.
Zwei Drittel der oben aufgeführten Datenquellen werden häufiger in der Cloud als standortgebunden bereitgestellt.
Während einige Data Warehouses wie Amazon Redshift und Google BigQuery ausschließlich in der Cloud zu finden sind, werden andere Data Warehouses wie SQL Server und MySQL sowohl in der Cloud als auch standortgebunden bereitgestellt.
In welche Richtung geht die Entwicklung insgesamt?
Die Datenlandschaft ist vielseitig
Cloud-Daten liegen im
Trend
Die Anzahl der Verbindungen zu Cloud-Bereitstellungen nimmt zu.
Im Januar 2015 machten die Verbindungen zu in der Cloud bereitgestellten Datenquellen 55 % aller in Tableau Online veröffentlichten Verbindungen aus.
Im ersten Quartal des Jahres 2016 lag der Anteil von Verbindungen zu in der Cloud bereitgestellten Datenquellen bei 70 % aller Verbindungen. In Prozent der Gesamtsumme entspricht dieses Wachstum einer 28 %igen Steigerung in nur 15 Monaten.
DATENQUELLENVERBINDUNGEN NACH ART DER BEREITSTELLUNG CLOUD-DATEN
Cloud-Daten liegen im Trend
Was treibt diese Entwicklung in Richtung Cloud-Datenquellen an?
Die Cloud hilft Unternehmen zweifellos dabei, Kosten zu reduzieren und Zeit bei der Bereitstellung und Wartung
der Infrastruktur einzusparen. Darüber hinaus sorgen noch drei weitere Entwicklungen für eine häufigere Verwendung von Cloud-Datenquellen:
• Neue Unternehmen wurden häufig „in der Cloud geboren“. Diese Unternehmen, die ihre Dateninfrastruktur von Beginn an in der Cloud nutzen, machen einen kleinen, aber wachsenden Anteil des Marktes aus.
• Neue Datenquellen erfordern hochgradig skalierbare Umgebungen. Ein Musterbeispiel hierfür ist das Internet der Dinge (IdD), bei dem von Geräten und Sensoren erzeugte Daten fortlaufend verfügbar sind. Unternehmen verwenden häufig eine skalierbare Cloud-Infrastruktur, um diese Daten zu erfassen und zu speichern.
Das Marktforschungsinstitut Enterprise Management Associates schätzt, dass die Datensätze des IdD inzwischen 33 % aller Daten in Cloud-Umgebungen ausmachen. Darüber hinaus werden Daten immer häufiger in der Cloud gespeichert, wenn Unternehmen das IdD dazu nutzen, um Geschäftssysteme mit Daten zu versorgen und zu verbessern.
• Geräte wie Smartphones und Tablets werden immer häufiger für Geschäftszwecke verwendet. Laut der Marktumfrage Wisdom of Crowds von Dresner Advisory Service aus dem Jahr 2015 bezeichneten beinahe 70 % aller befragten Personen die Unterstützung für mobile Geräte als „wichtig, sehr wichtig oder entscheidend“ für Initiativen im Bereich Business Intelligence. Cloud-Lösungen, durch die jederzeit und von jedem Ort aus auf Daten zugegriffen werden kann, bilden die Grundlage für den mobilen Zugriff auf Geschäftsdaten.
Während einige Datenbanken ausschließlich in der Cloud arbeiten, können andere Lösungen entweder standortgebunden oder in einer Cloud-Umgebung bereitgestellt werden. Für welche Möglichkeit entscheiden sich Unternehmen?
Mehr Daten
ausschließlich in der Cloud, aber noch
dominieren hybride
Lösungen
In dieser Grafik sind Verbindung aus dem Zeitraum vom Januar 2014 bis März 2016 dargestellt.
Die Anzahl von Verbindungen zu Cloud-nativen Datenquellen ist in den vergangenen beiden Jahren um 125 % gestiegen.
Zu Beginn des Jahres 2014 entfielen lediglich 12 % aller Verbindungen in Tableau Online auf Verbindungen zu Datenquellen, die ausschließlich in der Cloud zur Verfügung stehen.
Im März 2016 lag dieser Anteil bei 27 %. Das Wachstum ist auf die Verwendung von Cloud- basierten Data Warehouses wie Amazon Redshift und Google BigQuery durch Tableau
Online-Kunden zurückzuführen.
DATENQUELLENVERBINDUNGEN NACH ART DER BEREITSTELLUNG CLOUD-DATEN
Mehr Daten ausschließlich in der Cloud, aber noch dominieren hybride Lösungen
Der häufigste Verbindungstyp bleibt dennoch die Verbindung zu „hybriden“ Datenquellen.
Hybride Datenquellen, die entweder standortgebunden oder in der Cloud bereitgestellt werden können, machten zu Beginn des Jahres 2014 73 % aller Verbindungen aus. Im März 2016 entfielen 62 % aller Verbindungen auf Verbindungen zu hybriden Datenquellen. Trotz dieses leichten Rückgangs entfällt immer noch die große Mehrheit aller Datenquellenverbindungen,
die von Nutzern von Tableau Online veröffentlicht werden, auf Verbindungen zu hybriden Datenquellen.
Worauf ist die Dominanz hybrider Datenquellen zurückzuführen? Zahlreiche Unternehmen erstellen Analysen anhand verschiedener Datenquellen, von denen nicht alle in der Cloud bereitgestellt werden können. So verlangen beispielsweise die Sicherheitsanforderungen für bestimmte Arten von Finanz- und Gesundheitsdaten nach einer standortgebundenen
Speicherung. In anderen Fällen ist die die Verschiebung von Abläufen in die Cloud ein schrittweiser Prozess, der über Monate oder Jahre erfolgt. Gartner prognostiziert, dass der Wettbewerb im Jahr 2016 sich auf die Bereitstellung dieser hybriden
Modelle konzentrieren wird, die bis zum Jahr 2018 die Norm darstellen werden.
Welche individuellen Datenbanktechnologien aus der Kategorie der hybriden Datenquellen werden von Geschäftsanwendern wo bereitgestellt?
Verlagerung hybrider
Bereitstellungen in die Cloud
Der Datenschwerpunkt bei den hybriden Datenquellen verlagert sich auf die Cloud.
Im Januar 2015 war die Anzahl an Verbindungen zu hybriden Datenquellen bei Kunden von Tableau Online gleichmäßig auf Cloud- und standortgebundene
Umgebungen verteilt.* Bis zum ersten Quartal des Jahres 2016 hat sich der Anteil von in der Cloud bereitgestellten hybriden Datenquellen leicht erhöht und lag bei 60%.
* Im Bericht zu Cloud-Daten werden die anonymen IP-Adressen von Verbindungen zu hybriden Datenquellen aus Tableau Online verwendet, um zu bestimmen, ob Datenquellen standortgebunden oder in der Cloud bereitgestellt wurden. Bei diesem Vorgehen existiert eine geringe Fehlerspanne, die Mehrheit der Arten der Bereitstellung kann aber fehlerfrei identifiziert werden.
HYBRIDE DATENQUELLENVERBINDUNGEN CLOUD-DATEN
Hybride Bereitstellungen nähern sich der Cloud
Gartner prognostiziert, dass Enterprise Resource Planning (ERP)-Umgebungen, die sowohl eine Cloud- als auch eine standortgebundene Softwarebereitstellung ermöglichen, bis zum Jahr 2018 zum Standard avancieren. Die beinahe gleichmäßige Verteilung hybrider Datenquellen auf Cloud- und standortgebundene Bereitstellungen zeigt ebenso wie die generelle Dominanz hybrider Datenquellen, dass der Markt sich, trotz einer offensichtlichen Entwicklung in Richtung der Cloud, immer noch im Wandel befindet.
Die vier von Tableau Online-Kunden am häufigsten verwendeten hybriden Datenquellen sind Microsoft SQL Server, MySQL, PostgreSQL und Oracle.
DIE VIER HÄUFIGSTEN ARTEN HYBRIDER DATENQUELLEN NACH ART DER BEREITSTELLUNG
Von diesen vier Arten werden SQL Server und Oracle häufiger standortgebunden bereitgestellt.
Eine standortgebundene Bereitstellung von SQL Server ist im Durchschnitt doppelt so häufig wie eine Bereitstellung von SQL Server in der Cloud. Verbindungen zu standortgebundenen Oracle-Datenquellen sind viermal so häufig wie Verbindungen zu Oracle-Datenquellen in der Cloud.
Sowohl SQL Server als auch Oracle sind gängige Technologien aus der Zeit vor der Cloud. Sie wurden lange Zeit standortgebunden bereitgestellt, sodass eine Tendenz zur standortgebundenen Bereitstellung nicht überraschend ist. Mit dem Wachstum von Microsofts Cloud-Plattform Azure – im Rightscale-Bericht State of the Cloud ist von einer Verdoppelung der Azure-Benutzerzahlen von 2014 bis 2015 die Rede – wird eine Cloud-Bereitstellung des SQL-Servers von Microsoft in naher Zukunft aber immer häufiger vorkommen.
Im Vergleich dazu sind Verbindungen zu in der Cloud bereitgestelltem MySQL und PostgreSQL wesentlich häufiger als standortgebundene Verbindungen zu MySQL und PostgreSQL.
MySQL wird im Durchschnitt beinahe sechsmal häufiger in der Cloud bereitgestellt als standortgebunden. PostgreSQL wird fünfmal häufiger in der Cloud bereitgestellt als standortgebunden.
Die Beliebtheit der Open-Source-Technologien MySQL und PostgreSQL in der Cloud ist vermutlich auf deren Kompatibilität mit allen großen Cloud-Plattformen (u. a. Amazon Web Services, Microsoft Azure und Google Cloud Platform)
zurückzuführen. Die Vorliebe der Tableau Online-Kunden für in der Cloud bereitgestelltes MySQL und PostgreSQL entspricht der allgemeinen Branchenentwicklung in Richtung Open-Source-Datenbanktechnologien in der Cloud.
Hybride Bereitstellungen nähern sich der Cloud
Die
Datenlandschaft von Morgen
Von Bereitstellungsmöglichkeiten bis zu spezifischen
Datenbankprodukten – Unternehmen, die ihre Daten erfassen und Erkenntnisse daraus gewinnen möchten, steht eine Vielzahl an Möglichkeiten offen. Standortgebundene, Cloud- oder hybride Bereitstellung? Redshift oder SQL-Server? Die Auswahl der besten Lösung kann eine Herausforderung sein.
Trotz der zahlreichen Möglichkeiten sind Unternehmen laut einer aktuellen Studie von Enterprise Management Associates (EMA) aber weniger an den Eigenschaften einzelner Technologien interessiert. Stattdessen konzentrieren sie sich auf die Zeit bis zur
Wertschöpfung, die eine bestimmte Lösung bietet. Laut den Ergebnissen der besagten Studie glauben 40 % der Unternehmen, dass ihre
Datenmanagementsysteme ihnen dabei helfen können, sich einen Wettbewerbsvorteil zu verschaffen.
DER BERICHT ZU CLOUD-DATEN
Die Datenlandschaft von Morgen
Cloud-gehostete Software wird immer häufiger als die beste
Möglichkeit zur Schaffung eines Wettbewerbsvorteils angesehen.
Um eine erfolgreiche Datenstrategie aufzubauen, müssen Unternehmen Änderungen in der Big Data-Welt
verstehen und diesen Rechnung tragen. Branchenanalysten wie Gartner vermuten, dass der Großteil der IT-Ausgaben in naher Zukunft auf die „Modernisierung, Erweiterung oder Ersetzung altbewährter Geschäftsanwendungen durch cloudbasierte Anwendungen“ entfallen wird. Die wachsende Beliebtheit von in der Cloud bereitgestellten Datenquellen bei Nutzern von Tableau Online zeigt, dass die Cloud in der Big-Data-Welt immer mehr an Bedeutung gewinnt.
Insbesondere drei Entwicklungen beeinflussen die Zukunft von für die Analyse und Visualisierung genutzten Daten:
1. Der Datenschwerpunkt verlagert sich auf die Cloud.
Der Datenschwerpunkt veranschaulicht den Datensog in Bezug auf Services und Anwendungen. Wenn Ihre Daten sich in der Cloud befinden, benötigen Sie Daten-Tools – von der Verarbeitung bis zur Analyse –, die auch in der Cloud ausgeführt werden. Der Datenschwerpunkt liegt jetzt auf der Cloud, und dieser Fokus wird sich in Zukunft nur noch weiter verstärken. Unternehmen, die Daten-Systemumfelder aufbauen, sollten sich auf Cloud-Workflows konzentrieren, damit ihre Systeme für diese Verlagerung des Datenschwerpunkts bereit sind.
Die Datenlandschaft von Morgen
2. Bei der Verlagerung in die Cloud sind Hybrid-Datentechnologien entscheidend für Geschäftsabläufe.
Wenn nicht alle Ihre Daten in die Cloud verlagert werden können oder Sie die Verlagerung inkrementell vollziehen möchten, bieten Ihnen Hybrid-Datenoptionen die Flexibilität, die Lücke zwischen Ihren Cloud-gehosteten und
standortgebundenen Systemumfeldern zu überbrücken. Gartner prognostizierte kürzlich, dass diese Hybrid-Angebote 2018 die Norm sein werden. Für Unternehmen, die zur Cloud übergehen, ist Hybrid bereits jetzt die Norm.
3. Das Konzept für Datenspeicherung entwickelt sich rasch über die herkömmliche Vorstellung von Datenbanken und Data Warehouses hinaus.
Datenfluss findet nun überall statt. In der Folge expandiert der Bereich Datenspeicherung, um die Anforderungen der neuen und variablen Datenströme zu erfüllen. Die Expansion wird vor allem durch Cloud-gehostete Daten-Tools mit „as a Service“-Produkten wie Snowflake, aber auch von vertrauenswürdigen Diensten wie Relational Database Service von Amazon gefördert. In Zukunft wird diese Vielfalt nur weiter zunehmen. Um von dieser halsbrecherischen Innovationsgeschwindigkeit zu profitieren, bauen Unternehmen Daten-Workflows auf, die den Fokus vor allem auf Flexibilität und Wahlmöglichkeiten legen.
Lesen Sie auch die nächste Ausgabe unseres Berichts zu Cloud-Daten und besuchen Sie unsere Website für weitere Informationen über die Arbeitsweise von Tableau mit den in diesem Bericht analysierten Datenbanken.
unabhängig davon, wie umfangreich oder in wie vielen unterschiedlichen Systemen sie gespeichert sind.
Das nahtlose Zusammenspiel von PC und iPad ermöglicht dabei das schnelle Verknüpfen, Zusammenführen,
Visualisieren und Teilen von Datendashboards. Erstellen und veröffentlichen Sie Dashboards mit automatisierten Datenupdates und teilen Sie sie mit Kollegen, Partnern oder Kunden – ganz ohne Programmierkenntnisse.
WWW.TABLEAU.COM