Data Science umfasst den Zusammenschluss verschiedener Kompetenzen – von Statistik über Branchen-Know-how bis hin zur Informatik. Im Bereich Informatik werden wissenschaftliche Verfahren und Methoden eingesetzt, um Daten zu analysieren und daraus einen Mehrwert zu ziehen. Entsprechend ist die Programmierung im Data-Science-Kontext darauf ausgelegt, die Daten einfach zu verarbeiten, zu analysieren und Vorhersagen daraus zu generieren.
Entsprechend fokussieren sich unsere Expertinnen und Experten auf datenzentrierte Programmiersprachen – etwa R und Python kombiniert mit Jupyter Notebooks und den jeweiligen Fachbibliotheken wie numpy, pandas, scikit-learn, keras, tensorflow, prophet, OpenCV oder Shiny.
Bevor wir zusammen mit Ihnen in Großprojekten Use Cases umsetzen, bieten wir Ihnen die Möglichkeit, schnell erste Use Cases in einem Proof of Concept (PoC) zu erproben. Hierzu empfehlen wir die Open-Source-Programmiersprachen Python und R.
Dank Open-Source ergeben sich zwei zentrale Vorteile:
- Es fallen keine teuren Lizenzgebühren an.
- Der Zeitaufwand wird durch zahlreiche vorimplementierte Methoden deutlich verringert.
Ein weiterer Vorteil von Python und R ist, dass fast alle großen Hersteller – etwa Microsoft, SAS, SAP oder Cloudera – Schnittstellen für die Programmiersprachen zur Verfügung stellen. Auf diese Weise können im PoC entwickelte Data-Science-Modelle einfach ins Produktivsystem überführt werden. Aus diesem Grund bilden wir unsere Data Scientists stetig in den Bereichen Programmierung, Datenanalyse und Visualisierung weiter und haben bereits unser Know-how in zahlreichen Projekten einsetzen können.