click below
click below
Normal Size Small Size show me how
Data Analytics #2
| Question | Answer |
|---|---|
| Welche 3 Maßzahlen für eine ordinale Variable gib es | 1, alle wie bei nominale 2,komulierte absolute Häufigkeit 3,komulierte relative Häufigkeit (beide wegen Reihenordnung) |
| Welche 4 Merkmale für eine ordinale Variable gib es | 1, Modus (wie bei nominale) 2, Median 3,Perzentille 4, Extreme Werte (Maximum und Minimum) |
| Welche 4 Maßzahlen für eine metrische Variable gibt es | 1, alle Maßzahlen für nominale oder ordinale ABER bei stetigen keine relative,absolute oder perzentuelle Maßzahlen ( P=0 grundsätzlich für 2 gleiche Werte) 2, Lagemaßen 3,Steuuungsmaßen 4,Schiefemaße = Skewness |
| Welche 2 Lagemaßen bei metrische Variable gib es | 1, aritmetischer, geometrischer oder harmonischer (Durchschnitt von Raten wie km/h) Mittel 2, ungewichtete (keine Wertunterschiede) oder gewichtete (GPA) Mittel |
| Welche 5 Streuungmaßen bei metrische Variablen gib es | 1,Varianz 2, Standartabweichung 3, Varianzkoefizient 4,Spannweite 5, Quartilabstand |
| Was ist links/rechtschief zu positive/negative Schiefe | negativ = Linksschief (rechtsbügend) - Median höher als Mittelwert positiv = Rechtsschief (linksbügend) - Mittelwert höher als Median |
| Was sind Formeln für 1, Varianzkoefizient 2,Quartilabstand | 1, Varianzkoefizient v = (s/x̄) *100 2,Quartilabstand .. 3.Quartil - 1.Quartil |
| Was ist Formel für Schiefe | m3= 1/n ∑(xi−x̄)³ m2 (Varianz) = 1/n ∑(xi−x̄)² σ3 =m3 / (√m2)³ |
| Welche Grafik kann man bei Nominal-Univariat nutzen (3) | 1, Säulendiagramm 2,Balkendiagramm 3,Kreisdiagramm |
| Welche Grafik kann man bei Nominal-Bivariat nutzen (2) | 1, gruppiertes Balkendiagramm 2,gestapeltes Balkendiagramm |
| Welche Grafik kann man bei Ordinal nutzen (1) | Summenpolygone = für komulative Häufigkeiten |
| Welche Grafik kann man bei Metrisch nutzen (2) | 1, Histogramm 2, Box-Whiskers-Plot |
| Was ist Unterschied zwischen Histogramm und Säulendiagramm | Histogramm = Fläche ist representativ Säulejndiagamm = Höhe ist representativ |
| Welche 4 Fragen soll man sich in bivariate Regression stellen | 1, Gibt es Zusammen zwischen den Variablen? (irgendwelche Muster) 2,Ist der Zusammenhang linear? (lineare Muster) 3,Wie stark ist der Zusammenhang? 4, Gibt es Ausreißen in den Daten? (Passt irgendwas nicht in Daten rein oder liegt zu weit weg) |
| Was kann direkte Linie in Scatter Plot bedeuten | kann täuschen sein und nur von Skalierung/Große abhängen (km anstatt m) |
| Was misst Korrelationskoefizient (2) | 1, stärke des LINEAREN Zusammenhang 2, r=0 bedeutet deswegen es könnte ein anderes als LINEAREN Zusammenhang geben |
| Welche Formel hat Pearson´s r (Korrelation) | r= Cov(x,y) / sx*sy wenn r negativ muss Cov negativ sein |
| Welche Formel hat Kovarianz | Cov(x,y)= 1/(n-1) ∑(xi−x̄)(y-ȳ) Cov(x,y) auch als Sxy bezeichnet |
| Welcher Effekt können Ausreißen an Zusammenhang haben | können Zusammenhang verstärken wenn an lineare Linien liegen oder auch schwächen |