Direkt zum Inhalt

Datascience: Big Data im Mittelstand richtig nutzen

Was sind Daten und wie können Sie als kleines und mittelständisches Unternehmen von Ihren Daten profitieren? Das Mittelstand-Digital Zentrum SH unterstützt Sie mit verschiedenen Formaten dabei, die Potenziale Ihrer Daten zu heben. Zudem informieren wir Sie, wie Sie Daten in Ihrem Unternehmen richtig strukturieren und managen, um z.B. Technologien wie Künstliche Intelligenz managen zu können.

Was sind Daten?

Zugegeben, jeder Mensch hat eine gewisse Vorstellung davon, was Daten sind, wenn er danach gefragt wird. Doch der Begriff Daten meint ein breites Feld von Informationsarten mit unterschiedlichem Komplexitätsgraden. Während eine Excel-Tabelle Ihnen durch einfache Mathematik Werte ausrechnen und daraus Graphen erstellen kann, scheitert die gleiche Software daran, wenn Sie ihr die Aufgabe geben, Hunde von Katzenbildern zu unterscheiden. Dennoch sind sowohl die Zahlen als auch die Bilder Daten.

Unsere ganze Welt besteht aus Daten oder besser gesagt Informationseinheiten. Einfach gesagt sind Daten alles, was man speichern, kopieren und bearbeiten kann. Dazu gehören Texte, Bilder, Zahlen, Videos, Tabellen, Datenbanken, Audiofiles und vieles mehr. Sie sind dabei nicht auf die reine Speicherung auf einem Computer beschränkt, sondern auch Papier, Magnetbändern, Film, Vinyl, selbst Tonscherben werden zu Datenträger, sobald Informationen (z.B. Bilder) auf ihnen gespeichert werden.

Was sind Datenkategorien?

Um Daten zu verstehen und damit mit ihnen arbeiten zu können, muss man sie in zwei grundlegende Datentypen unterscheiden: metrische Daten und kategoriale Daten.

Metrische Daten

Metrische bzw. quantitative Daten sind die klassischen, numerischen Daten, die sich mathematisch verarbeiten lassen. Wir können zum Beispiel mehrere Messwerte (Gehälter eines Berufes) nehmen und daraus einen Durchschnitt (Durchschnittseinkommen) bilden.

Kategoriale Daten

Bei kategorialen Daten lässt sich die mathematische Berechnung nicht direkt durchführen. Bei kategorialen Daten handelt es sich um Gruppen oder Mengen mit denselben Eigenschaften. So können wir eine Reihe von Gegenständen sammeln, die rot sind, jedoch lässt sich damit kein Durchschnitt errechnen, der eine Aussagekraft hätte. Diese Daten müssen daher quantifizierbar gemacht werden, damit sie von einem Computer berechnet werden können.

Weitere Unterscheidungen

Darüber hinaus können wir Daten auch noch in andere Kategorien unterteilen. So können sie:

  • Strukturiert (Daten mit gleichartiger Struktur)
  • Semistrukturiert
  • Unstrukturiert (Daten ohne formalisierte Struktur)

sein. Auch der Grad ihrer Beständigkeit ist eine Kategorie, wo wir zwischen transiente (flüchtig) und persistenten (dauerhafte) Daten unterscheiden. Eingabedaten sind zu speichernde Daten und Ausgabedaten gespeicherte Daten.

Was ist Datenvisualisierung?

Ein weiteres Instrument, um Erkenntnisse aus Daten zu erhalten, ist die Datenvisualisierung. In ihrer einfachsten Form kennen wir sie als Graphen und Diagramme. Jedoch hat sie sich inzwischen weiterentwickelt. So sind heute zum Beispiel 3D-Darstellung möglich. Auch Szenarien- und Prozessdarstellungen sowie interaktive Möglichkeiten sind inzwischen denkbar. So lässt sich zum Beispiel die Auswirkung von Starkregen auf die Kanalisation einer Stadt simulieren, um so herauszufinden, wo Versickerungsmöglichkeiten geschaffen werden müssen.

Auch Konstruktionsdaten (CAD) lassen sich z.B. mit Virtuell Reality visualisieren, um durch die Interaktionsmöglichkeiten einen Entwurf besser zu veranschaulichen. So lassen sich u.a. auch Konstruktionsfehler schneller ausfindig machen. Datenvisualisierung hat deshalb ihre Stärke, da die Vorstellungskraft des Menschen besser stimuliert wird als durch bloße Zahlen und mathematische Formeln.

Welche Methoden der Datenanalyse gibt es?

Auch Sie können mit Ihrem Unternehmen von Daten profitieren. So lassen sich zum Beispiel mit ihnen Prognosen erstellen oder fehlende Effizienzen herausfiltern. Es gibt viele Datenanalysemethoden, die Unternehmen dabei helfen, das Potenzial ihrer Daten zu entdecken und ihr Geschäftsprozess zu beschleunigen.

Clusteranalyse

Unter Clusteranalysen versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen. Die Datenanalysemethode hilft Unternehmen, ihre Geschäftsergebnisse und ihre Kunden zu verstehen, um bessere Entscheidungen treffen zu können.

So funktioniert Clustering

Datenklassifizierung

Datenklassifizierung ist ein Prozess, in dem strukturierte oder unstrukturierte Daten analysiert und aufgrund ihres Typus und Inhalts in Kategorien eingeordnet werden. Mithilfe der Datenklassifizierung können Unternehmen entsprechende Geschäftsprozesses digitalisieren.

Ausreißererkennung

Die Ausreißerkennung ist eine Datenanalysemethode, die ungewöhnliches Verhalten aufdecken soll. Diese Datenanalysemethode wird in vielen Bereichen eingesetzt. Zum Beispiel in der Betrugserkennung im Finanzbereich, bei der medizinische Diagnose im Gesundheitswesen und zur Produktionsüberwachung in der Fertigungsindustrie.

Regressanalyse

Eine statistische Methode, die die Beziehung zwischen zwei oder mehr Faktoren untersucht, z.B. das Verhältnis zwischen der Anzahl der Werbeaktivitäten und dem Verkauf. Diese Technik wird zur Vorhersage, Zeitreihenmodellierung und Ermittlung von Kausaleffekten zwischen den Faktoren verwendet.

Datenbegriffe kurz erklärt

Im Bezug auf Daten sind inzwischen viele Begriffe im Umlauf, die verschiedene Kategorien, Technologien, Auswertungsmethoden und Berufe meinen. Wir wollen Ihnen hier einen kurzen Überblick über einzelne Begriffe aus verschiedenen Bereichen geben.

Open Data

Unter Open Data versteht man sämtliche Datenbestände, die im Interesse der Allgemeinheit ohne Einschränkungen zur weiteren Nutzung zugänglich gemacht werden. Dabei handelt es um Daten, die nicht dem Datenschutz unterliegen.

Meta Daten

Metadaten sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten. Dabei kann es sich zum Beispiel um den Autorennamen auf einem Buchtitel handeln. Besonders bekannt sind Metadaten bei Bilddateien und Webseiten.

Blockchain

Blockchain ist eine Methode, mit der Daten verschlüsselt werden können. Eine Blockchain ist eine kontinuierlich erweiterbare Liste von Datensätzen (Blöcken), die mittels kryptographischer Verfahren miteinander verkettet sind. Jeder Block enthält einen kryptographisch sicheren Hash (Streuwert) des vorhergehenden Blocks, einen Zeitstempel und Transaktionsdaten.

Algorithmus

Ein Algorithmus ist ganz allgemein eine Reihe von Anweisungen, die Schritt für Schritt ausgeführt werden, um eine Aufgabe zu bewältigen. Vor allem in der Mathematik und in der Informatik sind sie ein wichtiges Thema. Der bekannteste Algorithmus ist der Suchalgorithmus von Google. Aber auch in anderen Bereichen finden sie Anwendung.

Künstliche Intelligenz (KI/AI)

Im Gegensatz zu einfachen Algorithmen sind KIs so gebaut, dass sie mehr oder weniger Probleme durch Lernen lösen können. Diese Intelligenz unterscheidet sich jedoch deutlich von der des Menschen, die allenfalls nur simuliert werden kann.

Data Science

Data Science fasst eine Reihe von wissenschaftlichen Methoden zusammen, um Wissen aus Daten zu extrahieren. Die wissenschaftliche Fachrichtung verwendet Techniken und Theorien aus den Fächern Mathematik, Statistik und Informationstechnologie.

Data Engineering

Der Begriff bezeichnet alle Methoden des Informationsmanagements. Ein Data Engineer kümmert sich um die Prozesse rund um die Generierung, Speicherung, Pflege, Aufbereitung, Anreicherung und Weitergabe von Daten.

Big Data mit dem Mittelstand-Digital Zentrum SH kennenlernen

In vielen kleinen und mittelständischen Unternehmen werden die Potenziale der unternehmensinternen Daten nicht wirklich genutzt. Oft liegen diese sogar unstrukturiert und ohne Management vor. Wir helfen Ihnen dabei, verschiedene Methoden und Möglichkeiten kennen zu lernen. In regelmäßigen Abständen können Sie sich zudem für eine kostenlose Datenpotenzial-Analyse bewerben.

Das Mittelstand-Digital Zentrum unterstützt Sie mit Workshops, Informationsveranstaltungen und Sprechstunden. Oder starten Sie direkt ein Projekt mit uns und nutzen Sie unsere Expertise, um die Daten in Ihren Unternehmen in den Blick zu nehmen und Veränderungen anzustoßen.

Veranstaltungen zum Thema Daten

Aktuell sind keine Termine vorhanden.

Starten Sie Ihr erstes Daten-Projekt mit uns

Die Bundesinitiative Mittelstand Digital ermöglicht Ihnen eine kostenlose Zusammenarbeit mit unseren Hochschulpartnern. So können Sie die ersten Schritte in ihr Projekt machen, mit kompetenten Experten an Ihrer Seite.

Das sind Ihre Vorteile:

  • Kennenlernen bewährter Methoden und Technologien
  • Analyse Ihrer Datenbestände und Hebung von Potentialen
  • Datenmanagement systematisch in ihren Betrieb integrieren
  • Vernetzung mit anderen Unternehmen
Datenpotenzial-Analyse

Mit einer Datenpotenzial-Analyse prüfen wir mit Ihnen, welche Art von Daten in Ihrem Unternehmen vorliegen und wie Sie diese optimal nutzen können.

Impulswerft

In der ImpulsWerft durchleuchten wir mit Ihnen gemeinsam, wo die konkreten Potenziale der Digitalisierung in ihrem Unternehmen liegen.

Projekt

Mit einem Projekten begleiten wir Sie mit unsere Fachexpertise über mehrere Wochen oder Monate.

Das haben andere Unternehmen mit uns umgesetzt

Medizintechnik
Visotec GmbH: Daten für mobile Augendiagnostik sicher übertragen
Sensorik
Grand Hotel Seeschlösschen: Kontaktnachverfolgung mit LoRaWAN
Künstliche Intelligenz
WISKA Hoppmann GmbH: Fehlerkategorisierung mit KI

Ihr Daten-Expertise-Team

Philipp Bende
Philipp Bende Vernetzung, Blockchain und KI
Christoph Linse
Christoph Linse Künstliche Intelligenz (KI)

Diese Themen könnten Sie ebenfalls interessieren