Datascience: Big Data im Mittelstand richtig nutzen
Was sind Daten und wie können Sie als kleines und mittelständisches Unternehmen von Ihren Daten profitieren? Das Mittelstand-Digital Zentrum SH unterstützt Sie mit verschiedenen Formaten dabei, die Potenziale Ihrer Daten zu heben. Zudem informieren wir Sie, wie Sie Daten in Ihrem Unternehmen richtig strukturieren und managen, um z.B. Technologien wie Künstliche Intelligenz managen zu können.
Was sind Daten?
Zugegeben, jeder Mensch hat eine gewisse Vorstellung davon, was Daten sind, wenn er danach gefragt wird. Doch der Begriff Daten meint ein breites Feld von Informationsarten mit unterschiedlichem Komplexitätsgraden. Während eine Excel-Tabelle Ihnen durch einfache Mathematik Werte ausrechnen und daraus Graphen erstellen kann, scheitert die gleiche Software daran, wenn Sie ihr die Aufgabe geben, Hunde von Katzenbildern zu unterscheiden. Dennoch sind sowohl die Zahlen als auch die Bilder Daten.
Unsere ganze Welt besteht aus Daten oder besser gesagt Informationseinheiten. Einfach gesagt sind Daten alles, was man speichern, kopieren und bearbeiten kann. Dazu gehören Texte, Bilder, Zahlen, Videos, Tabellen, Datenbanken, Audiofiles und vieles mehr. Sie sind dabei nicht auf die reine Speicherung auf einem Computer beschränkt, sondern auch Papier, Magnetbändern, Film, Vinyl, selbst Tonscherben werden zu Datenträger, sobald Informationen (z.B. Bilder) auf ihnen gespeichert werden.
Um Daten zu verstehen und damit mit ihnen arbeiten zu können, muss man sie in zwei grundlegende Datentypen unterscheiden: metrische Daten und kategoriale Daten.
Metrische Daten
Metrische bzw. quantitative Daten sind die klassischen, numerischen Daten, die sich mathematisch verarbeiten lassen. Wir können zum Beispiel mehrere Messwerte (Gehälter eines Berufes) nehmen und daraus einen Durchschnitt (Durchschnittseinkommen) bilden.
Kategoriale Daten
Bei kategorialen Daten lässt sich die mathematische Berechnung nicht direkt durchführen. Bei kategorialen Daten handelt es sich um Gruppen oder Mengen mit denselben Eigenschaften. So können wir eine Reihe von Gegenständen sammeln, die rot sind, jedoch lässt sich damit kein Durchschnitt errechnen, der eine Aussagekraft hätte. Diese Daten müssen daher quantifizierbar gemacht werden, damit sie von einem Computer berechnet werden können.
Weitere Unterscheidungen
Darüber hinaus können wir Daten auch noch in andere Kategorien unterteilen. So können sie:
- Strukturiert (Daten mit gleichartiger Struktur)
- Semistrukturiert
- Unstrukturiert (Daten ohne formalisierte Struktur)
sein. Auch der Grad ihrer Beständigkeit ist eine Kategorie, wo wir zwischen transiente (flüchtig) und persistenten (dauerhafte) Daten unterscheiden. Eingabedaten sind zu speichernde Daten und Ausgabedaten gespeicherte Daten.
Ein weiteres Instrument, um Erkenntnisse aus Daten zu erhalten, ist die Datenvisualisierung. In ihrer einfachsten Form kennen wir sie als Graphen und Diagramme. Jedoch hat sie sich inzwischen weiterentwickelt. So sind heute zum Beispiel 3D-Darstellung möglich. Auch Szenarien- und Prozessdarstellungen sowie interaktive Möglichkeiten sind inzwischen denkbar. So lässt sich zum Beispiel die Auswirkung von Starkregen auf die Kanalisation einer Stadt simulieren, um so herauszufinden, wo Versickerungsmöglichkeiten geschaffen werden müssen.
Auch Konstruktionsdaten (CAD) lassen sich z.B. mit Virtuell Reality visualisieren, um durch die Interaktionsmöglichkeiten einen Entwurf besser zu veranschaulichen. So lassen sich u.a. auch Konstruktionsfehler schneller ausfindig machen. Datenvisualisierung hat deshalb ihre Stärke, da die Vorstellungskraft des Menschen besser stimuliert wird als durch bloße Zahlen und mathematische Formeln.
Auch Sie können mit Ihrem Unternehmen von Daten profitieren. So lassen sich zum Beispiel mit ihnen Prognosen erstellen oder fehlende Effizienzen herausfiltern. Es gibt viele Datenanalysemethoden, die Unternehmen dabei helfen, das Potenzial ihrer Daten zu entdecken und ihr Geschäftsprozess zu beschleunigen.
Clusteranalyse
Unter Clusteranalysen versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen. Die Datenanalysemethode hilft Unternehmen, ihre Geschäftsergebnisse und ihre Kunden zu verstehen, um bessere Entscheidungen treffen zu können.
Datenklassifizierung
Datenklassifizierung ist ein Prozess, in dem strukturierte oder unstrukturierte Daten analysiert und aufgrund ihres Typus und Inhalts in Kategorien eingeordnet werden. Mithilfe der Datenklassifizierung können Unternehmen entsprechende Geschäftsprozesses digitalisieren.
Ausreißererkennung
Die Ausreißerkennung ist eine Datenanalysemethode, die ungewöhnliches Verhalten aufdecken soll. Diese Datenanalysemethode wird in vielen Bereichen eingesetzt. Zum Beispiel in der Betrugserkennung im Finanzbereich, bei der medizinische Diagnose im Gesundheitswesen und zur Produktionsüberwachung in der Fertigungsindustrie.
Regressanalyse
Eine statistische Methode, die die Beziehung zwischen zwei oder mehr Faktoren untersucht, z.B. das Verhältnis zwischen der Anzahl der Werbeaktivitäten und dem Verkauf. Diese Technik wird zur Vorhersage, Zeitreihenmodellierung und Ermittlung von Kausaleffekten zwischen den Faktoren verwendet.
Datenbegriffe kurz erklärt
Im Bezug auf Daten sind inzwischen viele Begriffe im Umlauf, die verschiedene Kategorien, Technologien, Auswertungsmethoden und Berufe meinen. Wir wollen Ihnen hier einen kurzen Überblick über einzelne Begriffe aus verschiedenen Bereichen geben.
Unter Open Data versteht man sämtliche Datenbestände, die im Interesse der Allgemeinheit ohne Einschränkungen zur weiteren Nutzung zugänglich gemacht werden. Dabei handelt es um Daten, die nicht dem Datenschutz unterliegen.
Metadaten sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten. Dabei kann es sich zum Beispiel um den Autorennamen auf einem Buchtitel handeln. Besonders bekannt sind Metadaten bei Bilddateien und Webseiten.
Blockchain ist eine Methode, mit der Daten verschlüsselt werden können. Eine Blockchain ist eine kontinuierlich erweiterbare Liste von Datensätzen (Blöcken), die mittels kryptographischer Verfahren miteinander verkettet sind. Jeder Block enthält einen kryptographisch sicheren Hash (Streuwert) des vorhergehenden Blocks, einen Zeitstempel und Transaktionsdaten.
Ein Algorithmus ist ganz allgemein eine Reihe von Anweisungen, die Schritt für Schritt ausgeführt werden, um eine Aufgabe zu bewältigen. Vor allem in der Mathematik und in der Informatik sind sie ein wichtiges Thema. Der bekannteste Algorithmus ist der Suchalgorithmus von Google. Aber auch in anderen Bereichen finden sie Anwendung.
Im Gegensatz zu einfachen Algorithmen sind KIs so gebaut, dass sie mehr oder weniger Probleme durch Lernen lösen können. Diese Intelligenz unterscheidet sich jedoch deutlich von der des Menschen, die allenfalls nur simuliert werden kann.
Data Science fasst eine Reihe von wissenschaftlichen Methoden zusammen, um Wissen aus Daten zu extrahieren. Die wissenschaftliche Fachrichtung verwendet Techniken und Theorien aus den Fächern Mathematik, Statistik und Informationstechnologie.
Der Begriff bezeichnet alle Methoden des Informationsmanagements. Ein Data Engineer kümmert sich um die Prozesse rund um die Generierung, Speicherung, Pflege, Aufbereitung, Anreicherung und Weitergabe von Daten.
Big Data mit dem Mittelstand-Digital Zentrum SH kennenlernen
In vielen kleinen und mittelständischen Unternehmen werden die Potenziale der unternehmensinternen Daten nicht wirklich genutzt. Oft liegen diese sogar unstrukturiert und ohne Management vor. Wir helfen Ihnen dabei, verschiedene Methoden und Möglichkeiten kennen zu lernen. In regelmäßigen Abständen können Sie sich zudem für eine kostenlose Datenpotenzial-Analyse bewerben.
Das Mittelstand-Digital Zentrum unterstützt Sie mit Workshops, Informationsveranstaltungen und Sprechstunden. Oder starten Sie direkt ein Projekt mit uns und nutzen Sie unsere Expertise, um die Daten in Ihren Unternehmen in den Blick zu nehmen und Veränderungen anzustoßen.
Veranstaltungen zum Thema Daten
Starten Sie Ihr erstes Daten-Projekt mit uns
Die Bundesinitiative Mittelstand Digital ermöglicht Ihnen eine kostenlose Zusammenarbeit mit unseren Hochschulpartnern. So können Sie die ersten Schritte in ihr Projekt machen, mit kompetenten Experten an Ihrer Seite.
Das sind Ihre Vorteile:
- Kennenlernen bewährter Methoden und Technologien
- Analyse Ihrer Datenbestände und Hebung von Potentialen
- Datenmanagement systematisch in ihren Betrieb integrieren
- Vernetzung mit anderen Unternehmen
Das haben andere Unternehmen mit uns umgesetzt
Ihr Daten-Expertise-Team
- 0451 3101-5741
- E-Mail schreiben