Diese Seite beschreibt das Handling mit "R". Für Erklärungen zu den statistischen Inhalten besuchen Sie bitte die Vorlesung und die Übungen, und arbeiten Sie bitte Vorlesungs- und Übungsskripten durch!
Bei der Schlachtleistungsprüfung wird u.a. auch die Nettozunahme in Gramm pro Tag (Schlachtkörpergewicht/Mastdauer) festgestellt. Die Werte für Rinder verschiedener Rassen sind in der Datei: 'Tageszunahme.csv' angegeben.
Im Beispiel werden diese Daten in die Datenmatrix mast
eingelesen.
Wie Sie CSV-Dateien importieren können, haben Sie bereits gelernt. Falls Sie sich nicht mehr erinnern, lesen Sie bitte nochmal nach: Dateneingabe und Einlesen von Beispieldateien.
Die Dateneingabe für die Varianzanalyse bereitet immer wieder Verständnisprobleme. Beachten Sie bitte, dass die gemessenen Werte alle untereinander in einer Spalte stehen müssen, und die jeweils entsprechenden Faktorstufen in der Spalte daneben. Sehen Sie sich dazu bitte das Beispiel unten an.
Geben Sie folgenden Befehl ein:
str(NameIhrerDatenmatrix)
Beispiel:
Die Variable, welche die kontinuierliche Zielgröße der Varianzanalyse bildet, muss natürlich numerisch sein, also den Datentyp int
(integer, ganzzahlig) oder num
(numerisch) aufweisen. Wenn die Zielgröße nicht numerisch ist, haben Sie bei der Dateneingabe oder beim Import Fehler gemacht.
Falls die Werte des Faktors numerisch sind, müssen diese unbedingt in Faktoren umgewandelt werden.
Wenn die Werte des Faktors aus Text bestehen, ist das nicht erforderlich.
'Datenmanagement' > 'Variablen bearbeiten' > 'Konvertiere numerische Variablen in Faktoren …'
Ein gruppierter Boxplot gibt einen Überblick über die Daten.
'Grafiken' > 'Boxplot …'
Wählen Sie eine Variable, und klicken Sie auf 'Grafik für Gruppen'. Wählen Sie dann eine Gruppierungsvariable.
Geben Sie im Reiter 'Optionen' Achsenbeschriftung und Titel der Grafik ein.
Die Darstellung zeigt, dass die Verteilungen der einzelnen Gruppen ungefähr symmetrisch sind und es keine Ausreißer gibt. Die Varianzen sind etwa gleich groß, es bestehen aber deutliche Unterschiede bezüglich der mittleren Tageszunahmen.
Die Nullhypothese für die einfache Varianzanalyse lautet: "Die theoretische mittlere Tageszunahme ist für alle Rassen gleich." Die Alternativhypothese lautet: "Die theoretische mittlere Tageszunahme unterscheidet sich für mindestens zwei Rassen." Das Risiko 1. Art wird mit $\alpha=0.05$ festgelegt.
Kleine p-Werte sprechen gegen die Nullhypothese. Da der p-Wert ($8.853e-10 = 8.853 \cdot 10^{-10}$) unter dem Risiko 1. Art $\alpha=0.05$ liegt, kann die Nullhypothese verworfen werden. Es besteht also ein Unterschied in den Tageszunahmen der verschiedenen Rassen. Die 'Signif. Codes' geben an, auf welchem Niveau der Test signifikant ist. Die Mittlere Quadratsumme des Fehlers (735) entspricht der Fehlervarianz se2.
Voraussetzung für die Varianzanalyse ist, dass die Varianzen für alle Gruppen gleich sind. Dies kann mit Hilfe eines Levene-Tests überprüft werden. Die Nullhypothese lautet: "Die Varianzen aller Gruppen sind gleich." Die Alternativhypothese lautet: "Die Varianzen von mindestens zwei Gruppen sind unterschiedlich." Das Risiko 1. Art wird wie üblich mit $\alpha=0.05$ festgesetzt.
'Statistik' > 'Varianzen' > 'Levene-Test …'
Da der p-Wert ($0.379$) über $\alpha=0.05$ liegt, kann die Nullhypothese gleicher Varianzen beibehalten werden.
Diese Seite beschreibt das Handling mit "R". Für Erklärungen zu den statistischen Inhalten besuchen Sie bitte die Vorlesung und die Übungen, und arbeiten Sie bitte Vorlesungs- und Übungsskripten durch!