Jeden Tag generieren Unternehmen Unmengen von Daten aus einer Vielzahl von Quellen. Jene, die diese Datenmengen richtig nutzen, können sich einen Wettbewerbsvorteil sichern. Doch wie generiert man eigentlich aus Daten nutzbares Wissen? Darüber spricht LHIND-Expertin Fereshta Yazdani im Interview.
„Ich bringe die relevanten Daten für Unternehmen zusammen.“
Fereshta, die Masse an Rohdaten in Unternehmen nimmt immer weiter zu. Was sind die größten Herausforderungen bei der gewinnbringenden Nutzung der Datenmassen?
Daten sind der Rohstoff und das Gold der Zukunft. Leider fehlt es Unternehmen häufig an Ressourcen oder Fachwissen, um einen Mehrwert oder konkreten Nutzen aus den vorliegenden Datenmengen zu ziehen.
Zudem ist die Speicherung großer Datenmassen eine echte Herausforderung. Denn: Je größer das Datenvolumen, desto mehr Speicher wird benötigt, um dieses effizient abzulegen. Klassische Datenbanksysteme sind darauf nicht ausgelegt. Deswegen bedarf es neuer Technologien, wie die der Cloud. Angebote wie Plattform as a Service (PaaS), bei denen Unternehmen virtuelle Plattformen sozusagen mieten können, können da die Lösung sein.
Eine zweite Herausforderung ist die Geschwindigkeit des Datenabrufs. Um Echtzeit-Entscheidungen treffen zu können, müssen Daten immer aktuell sein. Das heißt, sie müssen schnell übertragen und verarbeitet werden. Denn: Veraltete Daten führen zu falschem Interpretationsspielraum.
Künstliche Intelligenz (KI) und Maschinelles Lernen sind Schlüsselansätze im Bereich Big Data. Sind Unternehmen darauf vorbereitet?
Wir sehen, dass der Reifegrad in Bezug auf KI bei Unternehmen sehr unterschiedlich ist. Einige Unternehmen sind noch ganz am Anfang und müssen erstmal ein grundlegendes Verständnis für KI und dessen Mehrwert aufbringen.
Andere Unternehmen sind schon viel weiter und haben zum Teil die notwendigen IT- und Cloud-Infrastrukturen aufgebaut. Sie stehen aber oftmals vor anderen Problemen, zum Beispiel, dass sie mit vielen personenbezogenen Daten arbeiten und diese aufgrund der DSGVO stark absichern müssen.
Und in beiden Fällen hilft LHIND mit geeigneten Schnittstellen, Lösungen oder dem Aufbau einer Infrastruktur?
Genau, wir beraten Kunden ganzheitlich und setzen die gesamte Implementierung um. Dafür ist zum Beispiel das Data Insight Lab bei LHIND da – ein Kompetenzcenter, um den Weg zum datengetriebenen Unternehmen zu begleiten. Hier arbeite ich zusammen mit Kolleg:innen aus den Bereichen Business Analytics, IT Security, Data Science und Data Architects an Szenarien und spezifischen Use Cases, um gemeinsam den höchsten Nutzen für Kunden aus ihren Unternehmensdaten zu ziehen.
„Ausgangspunkt für eine Datenanalyse ist immer eine solide Datenbasis. Denn nur so kann man qualitativ hochwertige und haltbare Aussagen treffen.“
Dr.-Ing. Fereshta Yazdani
Als Technology Consultant hast du also die Fäden in der Hand und einen Überblick über die technologischen Möglichkeiten?
Genau. Der Vorteil als Technology Consultant ist, dass man verschiedene Rollen einnehmen kann – immer abhängig vom Projekt und vom Bedarf der Kunden. Ich wurde schon als Cloud-Expertin eingesetzt und habe die komplette Infrastruktur für ein Unternehmen in der Cloud aufgesetzt. In einem anderen Fall bin ich als agile Projektmanagerin tätig. Da leite ich verschiedene Teams und stimme mich mit dem Kunden und verschiedenen Stakeholder:innen ab. Durch die unterschiedlichen Rollen bleibt der Job sehr spannend, denn jeder Tag ist anders und man lernt ständig dazu.
Spezialisiert bist du auf den Bereich Data Science, du generierst also aus Daten Wissen und schaffst damit Entscheidungsgrundlagen für Unternehmen. Wie machst du das?
Als Data Scientist ist es nicht nur meine Aufgabe, unzählige Daten von Unternehmen auszuwerten. Sondern vor allem die relevanten Daten zusammenzubringen, zu analysieren und wichtige Hinweise zu liefern, damit dann die besten Entscheidungen getroffen werden können.
Ausgangspunkt für eine Datenanalyse ist immer eine solide Datenbasis. Denn nur so kann man qualitativ hochwertige und haltbare Aussagen treffen. Daher muss immer zuerst definiert werden: „Welche Daten sind für eine Entscheidung relevant und wo bekommt man diese her?“
Nachdem ich die Daten untersucht habe, bereite ich einen speziellen Use Case für Unternehmen vor. Dafür nutze ich analytische Methoden aus dem Bereich maschinelles Lernen. Auf Grundlage der Analyseergebnisse stelle ich dann Prognosen für die Zukunft auf, die Unternehmen als Grundalge für ihre Entscheidungen nutzen.
Gibt es noch weitere wichtige Voraussetzungen beim Umgang mit Daten?
Es ist immer wichtig, dass die Daten nicht nur einer Abteilung zur Verfügung gestellt werden (z. B. der IT-Abteilung), sondern abteilungsübergreifend verfügbar sind, damit auch andere Mitarbeitende des Unternehmens auf die Daten zugreifen und ihr Fachwissen teilen können. Denn nur so können Business-Entscheidungen richtig getroffen werden.
Wie gehst du bei der Analyse vor? Welche Methoden und Schlüsseltechnologien setzt du ein und wie entwickeln sich diese weiter?
Im Bereich Big Data gibt es eine steigende Datenmenge, daher wird es immer schwieriger einfache Datenanalyse-Methoden zu nutzen. Daher arbeiten wir mit maschinellem Lernen. Dadurch können wir viel effizienter wichtige Infos aus den Datenmassen filtern, Muster erkennen oder Vorhersagen treffen.
Ich nutze verschiedene Methoden des maschinellen Lernens – das ist immer abhängig von der Problemstellung und den zur Verfügung stehenden Daten.
Will man zum Beispiel mehr über das Kaufverhalten von Kunden erfahren und diese dafür bestimmten Käufergruppen zuordnen, eignet sich Supervised Learning, da diese Methode vor allem für Klassifikations- und Regressionsaufgaben geeignet ist. Hierzu benötige ich repräsentative, gelabelte Daten, auf welchen ich einen Algorithmus verwende, welcher Muster und Zusammenhänge erkennt und mir ein entsprechendes Modell liefert.
Dieses Modell muss allerdings immer mit aktuellen Daten versorgt werden, um automatisch aus Erfahrung zu lernen und sich zu verbessern. Daher muss ein Zugang zu neuen Daten und Datenpunkten sichergestellt werden. Denn: Je mehr qualitativ hochwertige Datenpunkte es gibt und je öfter das Modell lernt, desto besser sind die Ergebnisse für die Entscheidungsgrundlagen.
Sehr spannend. Gibt es spezielle Branchen, die besonders von der Datenanalyse und Künstlicher Intelligenz profitieren?
Heutzutage sitzt fast jedes Unternehmen auf einem großen Datensatz. Und daher werden meiner Meinung nach zukünftig alle Branchen von maschinellem Lernen profitieren, z. B bei der Schadenserkennung durch Computer Vision oder durch die maschinelle Bearbeitung von Dokumenten und Texten durch Natural Language Processing (NLP).
Ich denke aber, gerade im Gesundheits- und Medizinbereich können KI und maschinelles Lernen viel leisten – nicht nur wirtschaftlich, sondern auch gesellschaftlich. Hier helfen die Technologien, Krankheiten früher zu erkennen, Menschen besser zu versorgen oder Mediziner:innen zu entlasten. KI eignet sich zum Beispiel perfekt für die medizinische Bilddiagnose, etwa bei Röntgenbildern. Ein großes Problem für Mediziner:innen ist die Sichtung der gewaltigen Informationsmenge, beispielsweise medizinische Verfahren, Pathologieberichte oder Bilddaten. Die Algorithmen analysieren Daten automatisch und werten diese effizient aus. Diese Auswertungen können Mediziner:innen dann wiederum für ihre Entscheidung nutzen. Im Gesundheitsbereich gibt es allerdings viele personenbezogene Daten und dadurch ist es sehr schwer, eine gute Datengrundlage zu schaffen.
Auch der E-Commerce oder die Logistikbranche profitieren besonders von KI – vor allem in Kombination mit Robotik.
Du setzt dich beruflich und privat für das Empowerment von Frauen im Bereich KI ein. Warum eignet sich diese Technologie gerade so für das Thema Diversity?
KI ist eine Querschnittstechnologie. Sie ist in allen Branchen enthalten und in fast alle Lebensbereiche eingedrungen. Unsere Gesellschaft und unsere Welt sind divers. Daher benötigen wir eine Technologie, die diese Diversität nutzt, unterstützt und noch bestärkt. Und KI bietet das.
Denn obwohl wir eine sehr diverse Gesellschaft sind, haben wir viele gesellschaftliche Probleme. Wir haben zum Beispiel Bias, also Verzerrungen. Je nachdem wie eine KI gefüttert wird, kann dieser Bias verstärkt werden. Und die Leidtragenden sind – wie so oft –Minderheiten oder unterrepräsentierte Gruppen. KI zeigt uns unsere gesellschaftlichen Probleme auf. Das ist zwar angsteinflößend, aber auch faszinierend.
Darüber hinaus bist du außerhalb der Technologie sehr aktiv in der Förderung von Diversität in der Branche rund um KI.
Ja, ich bin ehrenamtlich in der Community „Women in AI“ tätig – da geht es vor allem um das Empowerment von Frauen, die in der Branche Fuß fassen wollen oder die schon Expertinnen im Bereich KI sind, denen aber einfach die Sichtbarkeit fehlt. Diesen Frauen bietet die Community eine Plattform. Zudem bin ich im Bereich Mentoring unterwegs, bei Schulklassen oder Quereinsteiger:innen im Bereich IT.
Ich möchte aber nicht per se nur Frauen unterstützen –denn es ist genauso wichtig, die andere Seite zu fördern. Leadership ist nicht nur male oder female oder divers – sondern eine Kombination aus allem. Damit es richtig funktioniert, muss es einfach ausbalanciert sein.
Dr.-Ing. Fereshta Yazdani ist seit Mitte 2019 als Consultant und Data Scientist bei Lufthansa Industry Solutions in Norderstedt beschäftigt. Sie hat Informatik an der Universität Bremen studiert und dort als wissenschaftliche Mitarbeiterin zu den Bereichen Künstliche Intelligenz und Robotik geforscht und promoviert. Vor ihrer Karriere bei LHIND hat Fereshta als Softwareentwicklerin in der Intralogistik gearbeitet. Zudem setzt sie sich ehrenamtlich für die geschlechtersensible Förderung im Bereich KI ein.