• Keine Ergebnisse gefunden

DER BERICHT ZU CLOUD-DATEN. Verlagerung von Big Data in die Cloud

N/A
N/A
Protected

Academic year: 2022

Aktie "DER BERICHT ZU CLOUD-DATEN. Verlagerung von Big Data in die Cloud"

Copied!
17
0
0

Wird geladen.... (Jetzt Volltext ansehen)

Volltext

(1)

DER BERICHT ZU CLOUD-DATEN

Verlagerung von Big

Data in die Cloud

(2)

Die meisten Unternehmen streben an, ihre Daten zu erfassen und zu analysieren. Aber wie und wo geht dies vonstatten?

In der Vergangenheit waren Lösungen ausschließlich auf standortgebunden bereitgestellte Datenbanken beschränkt.

Heute müssen sich Unternehmen jedoch in einer großen Anzahl von Technologien und Bereitstellungsarten zurechtfinden. Von einzelnen Datenbanken und Hadoop-Produkten bis hin zu Cloud-, standortgebundenen und hybriden Bereitstellungen – die Landschaft ist vielfältig und verändert sich rasch.

Der Bericht zu Cloud-Daten wird fortlaufend aktualisiert und zielt darauf ab, die Entwicklung dieses Umfelds zu quantifizieren. Untersucht werden dabei die Verbindungen zu Datenquellen, die weltweit von Tableau

Online-Kunden genutzt werden. Die Analyse dieser Verbindungen gewährt einen Einblick dazu, wie und wo Unternehmen heute ihre Daten analysieren.

Unsere Methode:

Im Bericht zu Cloud-Daten werden stichprobenartig über eine Million anonymisierter Datenquellenverbindungen untersucht, die von mehr als 4.000 Kunden auf Tableau Online veröffentlicht wurden. Da es sich um ein in der Cloud gehostetes Tool handelt, weist das Nutzungsverhalten möglicherweise insgesamt eine Tendenz zur Cloud auf.

Andererseits sind die Kunden von Tableau Online in fast jeder Branche anzutreffen und reichen von kleinen

Unternehmen bis hin zu großen Konzernen. Dieser Bericht umfasst die Daten von all diesen Unternehmen, und wir sind davon überzeugt, dass sie ein aussagekräftiger Indikator für die allgemeinen Markttrends sind.

(3)

Wesentliche Erkenntnisse

Die Datenspeicherung expandiert über unsere herkömmlichen Datenbankkonzepte hinaus

• Die Kunden von Tableau Online verwenden für ihre Analysen zahlreiche unterschiedliche Datenquellen.

Es werden mehr als 40 Arten von Datenquellen eingesetzt, von proprietären Datenbanken bis hin zu Open-Source-Tools wie Hadoop. Zwei Drittel dieser Datenquellentypen werden häufiger in der Cloud bereitgestellt als standortgebunden installiert.

Der Datenschwerpunkt bewegt sich in Richtung Cloud

Die Anzahl von Verbindungen zu in der Cloud gehosteten Daten ist in den vergangenen 15 Monaten um 28 % angestiegen. Im Januar 2015 waren die Verbindungen zu Datenquellen in Tableau Online beinahe gleichmäßig auf die Cloud und eine standortgebundene Bereitstellung verteilt. Im ersten Quartal 2016 hat sich das Verhältnis bereits zu 70 % in der Cloud und 30 % standortgebundener Bereitstellung verändert.

• Cloud-native Datenquellen wie Amazon Redshift und Google BigQuery gewinnen an Marktanteil. Anfang 2014 stellten sie lediglich 12 % aller Verbindungen in Tableau Online dar. Bis zum ersten Quartal des Jahres 2016 ist ihr Anteil auf 28 % aller Verbindungen angestiegen.

(4)

Hybride Datentechnologien bleiben für Geschäftsabläufe entscheidend

• Hybride Datenquellen – Datenquellen, die entweder standortgebunden oder in der Cloud bereitgestellt werden können – bleiben die von Tableau Online-Kunden mit Abstand am häufigsten genutzte Verbindungsart. In den vergangenen beiden Jahren machten Verbindungen zu hybriden Datenquellen immer mindestens 60 % aller Verbindungen aus.

• Auch bei hybriden Daten geht die Entwicklung jedoch in Richtung Cloud. Vor fünfzehn Monaten war der Anteil hybrider Datenquellen bei Kunden von Tableau Online gleichmäßig auf die Cloud und eine standortgebundene

Bereitstellung verteilt. Bis zum ersten Quartal des Jahres 2016 hat sich der Anteil an in der Cloud bereitgestellten hybriden Datenquellen auf 60 % erhöht.

Sie hätten gern noch weitere Informationen?

Erfahren Sie mehr über die visuelle Datenanalyse und den Bericht zu Cloud-Daten, einschließlich der neuesten Version der Analyse der tatsächlichen Nutzung auf Cloud-Plattformen wie Amazon Web Services, Microsoft Azure und Google Cloud Platform.

(5)

Die

Datenlandschaft ist vielseitig

DATENQUELLENVERBINDUNGEN

Nutzer von Tableau Online verwenden mehr als 40 verschiedene Arten von Datenquellen.

Sogar wenn dateibasierte Quellen wie Excel und geschäftsspezifische

Webanwendungen wie Salesforce und Google Analytics nicht berücksichtigt werden, sind 32 verschiedene Arten von Datenbanken und Hadoop-

Systemumfeldern repräsentiert. Diese Vielfalt ist bezeichnend für die breite und diversifizierte Landschaft heute verfügbarer Datenmanagement-Tools.

CLOUD-DATEN

(6)

In Zukunft wird diese Vielfalt nur weiter zunehmen. Laut dem Marktforschungsinstitut Gartner befinden sich operative Datenmanagementsysteme „im Aufwind, wobei neue Mitbewerber die Position der etablierten Unternehmen in Frage stellen“. Wie Gartner weiter berichtet, sind es – im Hinblick auf Warehousing-Tools, die speziell für die Datenanalyse konzipiert wurden – disruptive Technologien, die Innovation beschleunigen.

Ob Nutzer die Cloud- oder die standortgebundene Bereitstellung bevorzugen, hängt stark von der Art der Datenquelle ab.

Zwei Drittel der oben aufgeführten Datenquellen werden häufiger in der Cloud als standortgebunden bereitgestellt.

Während einige Data Warehouses wie Amazon Redshift und Google BigQuery ausschließlich in der Cloud zu finden sind, werden andere Data Warehouses wie SQL Server und MySQL sowohl in der Cloud als auch standortgebunden bereitgestellt.

In welche Richtung geht die Entwicklung insgesamt?

Die Datenlandschaft ist vielseitig

(7)

Cloud-Daten liegen im

Trend

Die Anzahl der Verbindungen zu Cloud-Bereitstellungen nimmt zu.

Im Januar 2015 machten die Verbindungen zu in der Cloud bereitgestellten Datenquellen 55 % aller in Tableau Online veröffentlichten Verbindungen aus.

Im ersten Quartal des Jahres 2016 lag der Anteil von Verbindungen zu in der Cloud bereitgestellten Datenquellen bei 70 % aller Verbindungen. In Prozent der Gesamtsumme entspricht dieses Wachstum einer 28 %igen Steigerung in nur 15 Monaten.

DATENQUELLENVERBINDUNGEN NACH ART DER BEREITSTELLUNG CLOUD-DATEN

(8)

Cloud-Daten liegen im Trend

Was treibt diese Entwicklung in Richtung Cloud-Datenquellen an?

Die Cloud hilft Unternehmen zweifellos dabei, Kosten zu reduzieren und Zeit bei der Bereitstellung und Wartung

der Infrastruktur einzusparen. Darüber hinaus sorgen noch drei weitere Entwicklungen für eine häufigere Verwendung von Cloud-Datenquellen:

• Neue Unternehmen wurden häufig „in der Cloud geboren“. Diese Unternehmen, die ihre Dateninfrastruktur von Beginn an in der Cloud nutzen, machen einen kleinen, aber wachsenden Anteil des Marktes aus.

• Neue Datenquellen erfordern hochgradig skalierbare Umgebungen. Ein Musterbeispiel hierfür ist das Internet der Dinge (IdD), bei dem von Geräten und Sensoren erzeugte Daten fortlaufend verfügbar sind. Unternehmen verwenden häufig eine skalierbare Cloud-Infrastruktur, um diese Daten zu erfassen und zu speichern.

Das Marktforschungsinstitut Enterprise Management Associates schätzt, dass die Datensätze des IdD inzwischen 33 % aller Daten in Cloud-Umgebungen ausmachen. Darüber hinaus werden Daten immer häufiger in der Cloud gespeichert, wenn Unternehmen das IdD dazu nutzen, um Geschäftssysteme mit Daten zu versorgen und zu verbessern.

• Geräte wie Smartphones und Tablets werden immer häufiger für Geschäftszwecke verwendet. Laut der Marktumfrage Wisdom of Crowds von Dresner Advisory Service aus dem Jahr 2015 bezeichneten beinahe 70 % aller befragten Personen die Unterstützung für mobile Geräte als „wichtig, sehr wichtig oder entscheidend“ für Initiativen im Bereich Business Intelligence. Cloud-Lösungen, durch die jederzeit und von jedem Ort aus auf Daten zugegriffen werden kann, bilden die Grundlage für den mobilen Zugriff auf Geschäftsdaten.

Während einige Datenbanken ausschließlich in der Cloud arbeiten, können andere Lösungen entweder standortgebunden oder in einer Cloud-Umgebung bereitgestellt werden. Für welche Möglichkeit entscheiden sich Unternehmen?

(9)

Mehr Daten

ausschließlich in der Cloud, aber noch

dominieren hybride

Lösungen

In dieser Grafik sind Verbindung aus dem Zeitraum vom Januar 2014 bis März 2016 dargestellt.

Die Anzahl von Verbindungen zu Cloud-nativen Datenquellen ist in den vergangenen beiden Jahren um 125 % gestiegen.

Zu Beginn des Jahres 2014 entfielen lediglich 12 % aller Verbindungen in Tableau Online auf Verbindungen zu Datenquellen, die ausschließlich in der Cloud zur Verfügung stehen.

Im März 2016 lag dieser Anteil bei 27 %. Das Wachstum ist auf die Verwendung von Cloud- basierten Data Warehouses wie Amazon Redshift und Google BigQuery durch Tableau

Online-Kunden zurückzuführen.

DATENQUELLENVERBINDUNGEN NACH ART DER BEREITSTELLUNG CLOUD-DATEN

(10)

Mehr Daten ausschließlich in der Cloud, aber noch dominieren hybride Lösungen

Der häufigste Verbindungstyp bleibt dennoch die Verbindung zu „hybriden“ Datenquellen.

Hybride Datenquellen, die entweder standortgebunden oder in der Cloud bereitgestellt werden können, machten zu Beginn des Jahres 2014 73 % aller Verbindungen aus. Im März 2016 entfielen 62 % aller Verbindungen auf Verbindungen zu hybriden Datenquellen. Trotz dieses leichten Rückgangs entfällt immer noch die große Mehrheit aller Datenquellenverbindungen,

die von Nutzern von Tableau Online veröffentlicht werden, auf Verbindungen zu hybriden Datenquellen.

Worauf ist die Dominanz hybrider Datenquellen zurückzuführen? Zahlreiche Unternehmen erstellen Analysen anhand verschiedener Datenquellen, von denen nicht alle in der Cloud bereitgestellt werden können. So verlangen beispielsweise die Sicherheitsanforderungen für bestimmte Arten von Finanz- und Gesundheitsdaten nach einer standortgebundenen

Speicherung. In anderen Fällen ist die die Verschiebung von Abläufen in die Cloud ein schrittweiser Prozess, der über Monate oder Jahre erfolgt. Gartner prognostiziert, dass der Wettbewerb im Jahr 2016 sich auf die Bereitstellung dieser hybriden

Modelle konzentrieren wird, die bis zum Jahr 2018 die Norm darstellen werden.

Welche individuellen Datenbanktechnologien aus der Kategorie der hybriden Datenquellen werden von Geschäftsanwendern wo bereitgestellt?

(11)

Verlagerung hybrider

Bereitstellungen in die Cloud

Der Datenschwerpunkt bei den hybriden Datenquellen verlagert sich auf die Cloud.

Im Januar 2015 war die Anzahl an Verbindungen zu hybriden Datenquellen bei Kunden von Tableau Online gleichmäßig auf Cloud- und standortgebundene

Umgebungen verteilt.* Bis zum ersten Quartal des Jahres 2016 hat sich der Anteil von in der Cloud bereitgestellten hybriden Datenquellen leicht erhöht und lag bei 60%.

* Im Bericht zu Cloud-Daten werden die anonymen IP-Adressen von Verbindungen zu hybriden Datenquellen aus Tableau Online verwendet, um zu bestimmen, ob Datenquellen standortgebunden oder in der Cloud bereitgestellt wurden. Bei diesem Vorgehen existiert eine geringe Fehlerspanne, die Mehrheit der Arten der Bereitstellung kann aber fehlerfrei identifiziert werden.

HYBRIDE DATENQUELLENVERBINDUNGEN CLOUD-DATEN

(12)

Hybride Bereitstellungen nähern sich der Cloud

Gartner prognostiziert, dass Enterprise Resource Planning (ERP)-Umgebungen, die sowohl eine Cloud- als auch eine standortgebundene Softwarebereitstellung ermöglichen, bis zum Jahr 2018 zum Standard avancieren. Die beinahe gleichmäßige Verteilung hybrider Datenquellen auf Cloud- und standortgebundene Bereitstellungen zeigt ebenso wie die generelle Dominanz hybrider Datenquellen, dass der Markt sich, trotz einer offensichtlichen Entwicklung in Richtung der Cloud, immer noch im Wandel befindet.

Die vier von Tableau Online-Kunden am häufigsten verwendeten hybriden Datenquellen sind Microsoft SQL Server, MySQL, PostgreSQL und Oracle.

DIE VIER HÄUFIGSTEN ARTEN HYBRIDER DATENQUELLEN NACH ART DER BEREITSTELLUNG

(13)

Von diesen vier Arten werden SQL Server und Oracle häufiger standortgebunden bereitgestellt.

Eine standortgebundene Bereitstellung von SQL Server ist im Durchschnitt doppelt so häufig wie eine Bereitstellung von SQL Server in der Cloud. Verbindungen zu standortgebundenen Oracle-Datenquellen sind viermal so häufig wie Verbindungen zu Oracle-Datenquellen in der Cloud.

Sowohl SQL Server als auch Oracle sind gängige Technologien aus der Zeit vor der Cloud. Sie wurden lange Zeit standortgebunden bereitgestellt, sodass eine Tendenz zur standortgebundenen Bereitstellung nicht überraschend ist. Mit dem Wachstum von Microsofts Cloud-Plattform Azure – im Rightscale-Bericht State of the Cloud ist von einer Verdoppelung der Azure-Benutzerzahlen von 2014 bis 2015 die Rede – wird eine Cloud-Bereitstellung des SQL-Servers von Microsoft in naher Zukunft aber immer häufiger vorkommen.

Im Vergleich dazu sind Verbindungen zu in der Cloud bereitgestelltem MySQL und PostgreSQL wesentlich häufiger als standortgebundene Verbindungen zu MySQL und PostgreSQL.

MySQL wird im Durchschnitt beinahe sechsmal häufiger in der Cloud bereitgestellt als standortgebunden. PostgreSQL wird fünfmal häufiger in der Cloud bereitgestellt als standortgebunden.

Die Beliebtheit der Open-Source-Technologien MySQL und PostgreSQL in der Cloud ist vermutlich auf deren Kompatibilität mit allen großen Cloud-Plattformen (u. a. Amazon Web Services, Microsoft Azure und Google Cloud Platform)

zurückzuführen. Die Vorliebe der Tableau Online-Kunden für in der Cloud bereitgestelltes MySQL und PostgreSQL entspricht der allgemeinen Branchenentwicklung in Richtung Open-Source-Datenbanktechnologien in der Cloud.

Hybride Bereitstellungen nähern sich der Cloud

(14)

Die

Datenlandschaft von Morgen

Von Bereitstellungsmöglichkeiten bis zu spezifischen

Datenbankprodukten – Unternehmen, die ihre Daten erfassen und Erkenntnisse daraus gewinnen möchten, steht eine Vielzahl an Möglichkeiten offen. Standortgebundene, Cloud- oder hybride Bereitstellung? Redshift oder SQL-Server? Die Auswahl der besten Lösung kann eine Herausforderung sein.

Trotz der zahlreichen Möglichkeiten sind Unternehmen laut einer aktuellen Studie von Enterprise Management Associates (EMA) aber weniger an den Eigenschaften einzelner Technologien interessiert. Stattdessen konzentrieren sie sich auf die Zeit bis zur

Wertschöpfung, die eine bestimmte Lösung bietet. Laut den Ergebnissen der besagten Studie glauben 40 % der Unternehmen, dass ihre

Datenmanagementsysteme ihnen dabei helfen können, sich einen Wettbewerbsvorteil zu verschaffen.

DER BERICHT ZU CLOUD-DATEN

(15)

Die Datenlandschaft von Morgen

Cloud-gehostete Software wird immer häufiger als die beste

Möglichkeit zur Schaffung eines Wettbewerbsvorteils angesehen.

Um eine erfolgreiche Datenstrategie aufzubauen, müssen Unternehmen Änderungen in der Big Data-Welt

verstehen und diesen Rechnung tragen. Branchenanalysten wie Gartner vermuten, dass der Großteil der IT-Ausgaben in naher Zukunft auf die „Modernisierung, Erweiterung oder Ersetzung altbewährter Geschäftsanwendungen durch cloudbasierte Anwendungen“ entfallen wird. Die wachsende Beliebtheit von in der Cloud bereitgestellten Datenquellen bei Nutzern von Tableau Online zeigt, dass die Cloud in der Big-Data-Welt immer mehr an Bedeutung gewinnt.

Insbesondere drei Entwicklungen beeinflussen die Zukunft von für die Analyse und Visualisierung genutzten Daten:

1. Der Datenschwerpunkt verlagert sich auf die Cloud.

Der Datenschwerpunkt veranschaulicht den Datensog in Bezug auf Services und Anwendungen. Wenn Ihre Daten sich in der Cloud befinden, benötigen Sie Daten-Tools – von der Verarbeitung bis zur Analyse –, die auch in der Cloud ausgeführt werden. Der Datenschwerpunkt liegt jetzt auf der Cloud, und dieser Fokus wird sich in Zukunft nur noch weiter verstärken. Unternehmen, die Daten-Systemumfelder aufbauen, sollten sich auf Cloud-Workflows konzentrieren, damit ihre Systeme für diese Verlagerung des Datenschwerpunkts bereit sind.

(16)

Die Datenlandschaft von Morgen

2. Bei der Verlagerung in die Cloud sind Hybrid-Datentechnologien entscheidend für Geschäftsabläufe.

Wenn nicht alle Ihre Daten in die Cloud verlagert werden können oder Sie die Verlagerung inkrementell vollziehen möchten, bieten Ihnen Hybrid-Datenoptionen die Flexibilität, die Lücke zwischen Ihren Cloud-gehosteten und

standortgebundenen Systemumfeldern zu überbrücken. Gartner prognostizierte kürzlich, dass diese Hybrid-Angebote 2018 die Norm sein werden. Für Unternehmen, die zur Cloud übergehen, ist Hybrid bereits jetzt die Norm.

3. Das Konzept für Datenspeicherung entwickelt sich rasch über die herkömmliche Vorstellung von Datenbanken und Data Warehouses hinaus.

Datenfluss findet nun überall statt. In der Folge expandiert der Bereich Datenspeicherung, um die Anforderungen der neuen und variablen Datenströme zu erfüllen. Die Expansion wird vor allem durch Cloud-gehostete Daten-Tools mit „as a Service“-Produkten wie Snowflake, aber auch von vertrauenswürdigen Diensten wie Relational Database Service von Amazon gefördert. In Zukunft wird diese Vielfalt nur weiter zunehmen. Um von dieser halsbrecherischen Innovationsgeschwindigkeit zu profitieren, bauen Unternehmen Daten-Workflows auf, die den Fokus vor allem auf Flexibilität und Wahlmöglichkeiten legen.

Lesen Sie auch die nächste Ausgabe unseres Berichts zu Cloud-Daten und besuchen Sie unsere Website für weitere Informationen über die Arbeitsweise von Tableau mit den in diesem Bericht analysierten Datenbanken.

(17)

unabhängig davon, wie umfangreich oder in wie vielen unterschiedlichen Systemen sie gespeichert sind.

Das nahtlose Zusammenspiel von PC und iPad ermöglicht dabei das schnelle Verknüpfen, Zusammenführen,

Visualisieren und Teilen von Datendashboards. Erstellen und veröffentlichen Sie Dashboards mit automatisierten Datenupdates und teilen Sie sie mit Kollegen, Partnern oder Kunden – ganz ohne Programmierkenntnisse.

WWW.TABLEAU.COM

Referenzen

ÄHNLICHE DOKUMENTE

Die neuen Startseiten für den Direkteinstieg in SAP Analytics Cloud, mit denen Sie Ihre zuletzt verwendeten Dateien durchsuchen oder neue erstellen können, bieten ein

Big Data ist ein Teilbereich der Business- Intelligence und befasst sich mit der Analyse grosser Datenmengen, die in der Geschäfts- tätigkeit der Unternehmen anfallen und

Wenn die Datenbank, die per DBaaS erstellt wird, eine Test- datenbank sein soll, stellt sich die Frage, ob als Basis für das Service Template eine Produktivdatenbank herangezogen

Welche IT-Cluster der Bank sind für eine potenzielle Cloud-Migration sinnvollerweise abzugrenzen/zu schneiden. Welche (z.B. Geschäfts-)Anforderungen und Zielkriterien

Auf der einen Seite wird SOA, die Service orientierte Architektur von Software Systemen vorangetrieben und auf der anderen Seite erfolgt eine Marktöffnung der Hardware Ressourcen

Download from personal cloud limited by upstream(!) data rate Upload to personal cloud limited by downstream(!) date rate. Typical DSL to DSL transfer rate 0.5 …

“A model for enabling convenient, on-demand network access to a shared pool of configurable computing resources (e.g., networks, servers, storage, applications, and services)

Teil 3: Die Verantwortlichkeit in der Cloud... Zweck der Verantwortlichkeit... Interessen bei der gemeinsamen Verantwortlichkeit und der Auftragsverarbeitung ... Auftrags