Autonomous Database Services: Hochladen von Excel-Dateien

Der Vorteil von autonomen Datenbanken ist, dass sie schnell und einfach erzeugt werden können. Sie werden vollständig autonom betrieben, sodass sich zum Beispiel niemand Gedanken zu den Themen Hochverfügbarkeit im Allgemeinen und Backups im Besonderen machen muss. Autonomous Data Warehouse (ADW) ist zum Beispiel dann besonders gut geeignet, wenn Daten schnell analysiert und ggf. zu Reports verarbeitet werden sollen und die Datenmenge einfache Dateiformate sprengt oder mehrere Benutzer auf diese Daten zugreifen sollen. Diese Daten liegen oft in Form mehrerer Spreadsheetdateien vor und solange die Datenmenge nicht zu groß wird, werden oft Tabellenkalkulationsprogramme für die Analyse genutzt. Dieses stößt aber immer dann an Grenzen, wenn die Datenmenge wächst (also ständig neue Daten hinzukommen) und/oder mehrere Benutzer auf die Daten zugreifen sollen. Dieser Tipp zeigt, wie solche Spreadsheetdaten schnell und einfach in eine ADW-Datenbank hochgeladen und ausgewertet werden können.

Wir haben in unserem Blog schon in anderen Beiträgen gezeigt, wie ein Autonomous Database Service erzeugt wird. Dabei wird auch gezeigt, wie Daten, die aus einer Oracle Datenbank exportiert wurden, in die ADW Datenbank importiert werden können. Ein weiteres Blogposting zeigt, wie Daten aus einer bestehenden Oracle Datenbank direkt in eine ADW Datenbank kopiert werden können.

Im Rahmen eines oben skizzierten Vorhabens zur Datenanalyse liegen die zu analysierenden Daten aber meist als Spreadsheet vor. Diese Daten können sehr leicht mit einem Tool in die ADW Datenbank geladen werden, welches im Subskriptionspreis des ADW-Services enthalten ist: Data Visualization Desktop (DVD). Dieses Tool kann auf den Plattformen Windows und MacOS verwendet werden und kann von der Oracle Webseite heruntergeladen werden.

Auf der Plattform Windows installieren Sie mit der heruntergeladenen EXE-Datei das Tool lokal auf Ihrem Rechner. Auf der Plattform MacOS starten Sie PKG-Datei. Sie brauchen während der Installation keine weiteren Angaben machen und einfach die Standardeinstellungen nutzen. Wenn sie das Tool nun starten sollte das Ergebnis im oberen Teil wie folgt aussehen:

Im ersten Schritt muss eine Datenbankverbindung definiert werden. Dazu klicken Sie im Feld mit den verschiedenen Kacheln (die im Screenshot für eine Fokussierung ausgeblendet wurden) auf die Kachel "Connect to Oracle Autonomous Data Warehouse".

Im folgenden Dialog geben Sie im ersten Schritt die Datei mit den Client Credentials ein. Das ist die ZIP-Datei, die im Administrationsbereich von ADW heruntergeladen werden kann und die notwendig ist, um mit dieser Datenbank Verbindung aufzunehmen.

Geben Sie nun der Verbindung einen Namen, wählen Ihren Datenbankservice aus. Dann muss noch der Datenbankbenutzer mit seinem Passwort festgelegt werden. In einer ADW Datenbank können mehrere Datenbankbenutzer erstellt werden. Es gibt aber immer einen Benutzer mit dem Namen "admin", den ich im Beispiel der Einfachheit halber verwende. Speichern Sie mit "Save" und die neue Datenbankverbindung ist angelegt.

Um jetzt die Daten hochzuladen, muss ein sogenannter "Data Flow" erzeugt werden, der sich auf eine Datenquelle (unser Spreadsheet) bezieht. Es gibt zum Testen schon ein Beispiel für eine solche Datenquelle, auch Data Set genannt, mit dem Namen "Sample Order Items". Dieser Tipp zeigt das Vorgehen anhand der Daten dieses Data Sets. Um das Anlegen von Data Sets zu demonstrieren zeige ich das Erstellen eines solchen Data Sets anhand der Spreadsheetdatei des Beispiels. Dazu klicken Sie oben rechts auf "Create" und dann auf "Data Set".

Klicken Sie auf die markierte Fläche, um eine Spreadsheet-Datei auszuwählen.

Nach einer kleinen Bearbeitungszeit...

... können Sie dem Data Set noch einen Namen geben und mit "Add" legen Sie das Data Set an.

Oben links kommen Sie wieder zurück zur Hauptseite und nun geht es zum Anlegen des "Data Flows".

Wählen Sie als Data Set Ihre Datenquelle aus. In unserem Fall also das Spreadsheet.

Jetzt muß dem Prozess noch das Speichern der Daten in der ADW Datenbank hinzugefügt werden. Dazu klicken Sie auf den im Screenshot markierten Bereich...

..und wählen als Prozessschritt "Save Data" aus.

Im Rahmen des Data Flows wird ein neues Data Set, also eine neue Datenquelle die jetzt in der ADW Datenbank liegen wird, angelegt. Geben Sie dem neuen Data Set einen Namen und wählen als Ziel der Speicherung "Database Connection".

Mit einem Klick auf "Select Connection"...

...selektieren Sie Ihre Datenbankverbindung zur ADW Datenbank.

Jetzt speichern Sie oben rechts Ihren neuen Data Flow.

Im nächsten Schritt führen Sie den Data Flow mit "Run Data Flow" aus.

Sobald dieses abgeschlossen ist, liegen die Daten in der ADW Datenbank und die Analyse kann beginnen. An dieser Stelle zeige ich ein einfaches Beispiel. Klicken Sie dazu oben links auf den Pfeil, der nach links zeigt.

Erstellen Sie ein Analyseprojekt über "Create"->"Project".

Wählen Sie das neue Data Set aus. Das Symbol zeigt, dass es sich um eine Datenquelle in einer Datenbank handelt.

Ziehen Sie die Datenspalte "Profit" nach rechts auf den Darstellungsbereich.

Sie können die Darstellungsart rechts oben ändern. Es bietet sich eine klassische vertikale Balkengrafik an.

Der Gewinn kann über die verschiedenen Produkte angezeigt werden. Ziehen Sie die Datenspalte "ProductName" auf die X-Achse.

Die Übersicht über die Gewinne pro Produkt zeigt Minuswerte, also Verluste. Konzentrieren wir uns darauf und ziehen die Datenspalte "Profit" auch auf die Filter.

Sie können nun ein Maximum von Null angeben, um nur die Verluste anzuzeigen.

Mit wenigen Schritten kann das Produkt mit dem größten Verlust identifiziert werden, wobei die Daten dauerhaft, sicher und für mehrere zugelassene Benutzer in der ADW Datenbank gespeichert sind. Sie können das Analyseprojekt jetzt natürlich auch noch sichern, um es später mit aktuellen Daten wieder aufzurufen.

 
Fazit

Mit Autonomous Datawarehouse Datenbanken können Spreadsheets schnell in eine Oracle Datenbank geladen und ausgewertet werden. Dabei steht jedem Kunden des ADW Cloud Services das Analysetool "Data Visualization Desktop" (DVD) ohne Mehrkosten zur Verfügung. Selbstverständlich können alle Analysewerkzeuge eingesetzt werden, die mit Oracle Datenbanken verbunden werden können.

Weitere Informationen


 

Zurück zum Anfang des Artikels

Zurück zur Community-Seite
 

Visit the Oracle Blog

 

Contact Us

Oracle

Integrated Cloud Applications & Platform Services