Statistics Toolbox

Multivariate Statistik

Multivariate Statistik stellt Algorithmen und Funktionen zur Analyse von mehrfachen Variablen zur Verfügung. Typische Anwendungsgebiete sind:

  • Überführung korrelierter Daten in eine Menge unkorrelierter Komponenten durch Rotation und Zentrierung (Hauptkomponentenanalyse)
  • Untersuchung der Beziehungen zwischen Variablen mithilfe von Visualisierungstechniken wie Scatter-Plot-Matritzen und klassische mehrdimensionale Skalierung
  • Segmentierung von Daten mithilfe der Clusteranalyse
Beispiel: Angleichung einer orthogonalen Regression mit der Hauptkomponentenanalyse

Angleichung einer orthogonalen Regression mit der Hauptkomponentenanalyse (Beispiel)
Implementierung der Deming-Regression (Total Least Squares).

Eigenschaftstransformation

Mit Eigenschaftstransformationstechniken kann eine Verringerung der Dimensionalität erreicht werden, in der die transformierten Eigenschaften einfacher geordnet werden können als die ursprünglichen. Die Statistics Toolbox bietet drei Klassen von Eigenschaftstransformationsalgorithmen:

  • Hauptkomponentenanalyse zur Zusammenfassen von Daten in weniger Dimensionen
  • Nichtnegative Matrizenfaktorisierung, wenn Modellbegriffe für nichtnegative Mengen stehen müssen
  • Faktoranalyse zum Aufbau von Erklärungsmodellen für Datenkorrelation
Beispiel: Partial Least Squares Regression und Principal Components Regression

Partial Least Squares Regression und Principal Components Regression (Beispiel)
Modell einer Antwortvariablen in Gegenwart von hoch korrelierten Prädiktoren.

Multivariate Visualisierung

Statistics Toolbox bietet Graphen und Tabellen, mit denen Sie multivariate Daten visuell untersuchen können, darunter sind:

  • Scatter-Plot-Matritzen
  • Dendogramme
  • Biplots
  • Parallel-Koordinaten-Tabellen
  • Andrews-Diagramme
  • Glyph-Diagramme
Gruppen-Scatter-Plot-Matrix, die zeigt, wie das Modelljahr die unterschiedlichen Variablen beeinflusst.

Gruppen-Scatter-Plot-Matrix, die zeigt, wie das Modelljahr die unterschiedlichen Variablen beeinflusst.

Biplot, das die ersten drei Lasten einer Hauptkomponentenanalyse zeigt.

Biplot, das die ersten drei Lasten einer Hauptkomponentenanalyse zeigt.

Andrews-Diagramm, das die Auswirkung des Ursprungslandes auf die Variablen zeigt.

Andrews-Diagramm, das die Auswirkung des Ursprungslandes auf die Variablen zeigt.

Clusteranalyse

Statistics Toolbox bietet verschiedene Algorithmen für die Clusteranalyse, darunter:

  • Hierarchisches Clustering, das einen agglomerativen Cluster erzeugt, der normalerweise als Baum dargestellt wird.
  • K-Mittelwert-Clustering, was dem Cluster Datenpunkte mit nächstgelegenem Mittelwert zuweist.
  • Gaußsche Mischungen, die sich durch die Kombination multivariater, normaldichter Komponenten ergeben. Cluster werden durch Auswählen der Komponente zugewiesen, die die posteriore Wahrscheinlichkeit maximiert.
Zwei-Komponenten-Gauß-Modell für eine Mischung von bivariaten Peak-Funktionen (Gauß).

Zwei-Komponenten-Gauß-Modell für eine Mischung von bivariaten Peak-Funktionen (Gauß).

Ergebnis der Anwendung eines Clusteralgorithmus auf dasselbe Beispiel.

Ergebnis der Anwendung eines Clusteralgorithmus auf dasselbe Beispiel.

Dendogramm eines Modells mit vier Clustern.

Dendogramm eines Modells mit vier Clustern.

Weiter: Wahrscheinlichkeitsverteilungen

Probieren Sie Statistics Toolbox

Testsoftware anfordern

Multilevel Mixed-Effects Modeling Using MATLAB

Webinar anzeigen