Jemand arbeitet am Notebook am Schreibtisch

Data-Science-Technologien

Die Zusammenwirkung verschiedenster Kompetenzen

Mehrwerte durch wissenschaftliche Methoden

Data Science umfasst den Zusammenschluss verschiedener Kompetenzen – von Statistik über Branchen-Know-how bis hin zur Informatik. Im Bereich Informatik werden wissenschaftliche Verfahren und Methoden eingesetzt, um Daten zu analysieren und daraus einen Mehrwert zu ziehen. Entsprechend ist die Programmierung im Data-Science-Kontext darauf ausgelegt, die Daten einfach zu verarbeiten, zu analysieren und Vorhersagen daraus zu generieren.

Entsprechend fokussieren sich unsere Expertinnen und Experten auf datenzentrierte Programmiersprachen – etwa R und Python kombiniert mit Jupyter Notebooks und den jeweiligen Fachbibliotheken wie numpy, pandas, scikit-learn, keras, tensorflow, prophet, OpenCV oder Shiny.

Bevor wir zusammen mit Ihnen in Großprojekten Use Cases umsetzen, bieten wir Ihnen die Möglichkeit, schnell erste Use Cases in einem Proof of Concept (PoC) zu erproben. Hierzu empfehlen wir die Open-Source-Programmiersprachen Python und R.

Dank Open-Source ergeben sich zwei zentrale Vorteile:

Es fallen keine teuren Lizenzgebühren an.
Der Zeitaufwand wird durch zahlreiche vorimplementierte Methoden deutlich verringert.

Ein weiterer Vorteil von Python und R ist, dass fast alle großen Hersteller – etwa Microsoft, SAS, SAP oder Cloudera – Schnittstellen für die Programmiersprachen zur Verfügung stellen. Auf diese Weise können im PoC entwickelte Data-Science-Modelle einfach ins Produktivsystem überführt werden. Aus diesem Grund bilden wir unsere Data Scientists stetig in den Bereichen Programmierung, Datenanalyse und Visualisierung weiter und haben bereits unser Know-how in zahlreichen Projekten einsetzen können.

python - Die Programmiersprache für maschinelles Lernen

python ist derzeit die am weitesten verbreitete Programmiersprache für maschinelles Lernen und insbesondere für die Entwicklung von anspruchsvollen Modellen und Vorhersagemodulen geeignet, die direkt in Produktionssysteme eingebunden werden können. Aus diesem Grund beherrschen unsere Mitarbeiterinnen und Mitarbeiter alle wichtigen python-Bibliotheken im Data-Science-Bereich.

Die Bibliothek scikit-learn bietet alle notwendigen Algorithmen und Methoden des Maschinellen Lernens. Diese haben eine Reichweite von gängigen Regressionen, Clustering-Verfahren bis hin zu Klassifikations- und Vorhersagemodulen.

Je nach Komplexität der Problemstellung können auch Methoden aus dem Deep Learning zum Einsatz kommen. In diesem Bereich sind unsere Data Scientists zertifiziert und verfügen über ein umfangreiches Know-how in den Bibliotheken keras, tensorflow und pytorch. Diese eignen sich vor allem aufgrund ihrer Flexibilität besonders gut für die Implementierung eigener Deep-Learning-Lösungen.

R - Skriptsprache zur Analyse und Visualisierung von Daten

R eine ist leistungsfähige und flexible Skriptsprache, die insbesondere zur Analyse und Visualisierung von Daten genutzt wird. Ein Großteil aller Neuentwicklungen in den Bereichen Statistik und maschinelles Lernen findet in R statt, was unseren Expertinnen und Experten ein stetiges Erproben von neuen statistischen Verfahren ermöglicht.

Zudem ist R sehr gut automatisierbar und integrierbar – etwa in Git, ODBC, Oracle R Enterprise, Spark oder Hadoop. Wie Python verfügt auch R über eine große Bibliothekanzahl. Für die Datenaufbereitung großer Datenmengen ist data.table besonders gut geeignet. Mit Hilfe der Bibliothek caret sind alle Verfahren aus den Bereichen Machine- und Deep Learning anwendbar. Visualisierungen können wir besonders eindrucksvoll mit Bibliotheken wie ggplot oder plotly gestalten. Soll der Use Case anschließend mittels einer App-Anwendung in den Produktionsbetrieb gehen, so greifen unsere Spezialisten zu der Bibliothek Shiny.

Rollen im Data-&-Analytics-Umfeld

Im Data-&-Analytics-Umfeld werden verschiedene statistische Methoden verwendet, um aus erhobenen Daten Informationen zu gewinnen. Genauso vielfältig ist auch die Tätigkeit in diesem Umfeld. Finden Sie die Rollen, die Ihnen auf den Leib geschneidert sind. Wir zeigen Ihnen, worauf es in den unterschiedlichen Data-&-Analytics-Positionen ankommt.

Erfahren Sie mehr

Sie haben Fragen?

Wir freuen uns darauf, mit Ihnen ins Gespräch zu kommen.

Team Lead Manager
Sven Langhoff
+49 231 7000-7000

sven.langhoff@adesso.de

Kontakt