Statt mit Formelsalat versuche ich meist die Gemüter mit einfachen Beispielen zu beruhigen. Ein relativ anschauliches Beispiel ist Hotellings Wiegeproblem (Harold Hotelling – Some Improvements in Weighing and Other Experimental Techniques; Annuals of Mathematical Statistics 15 (1944) p.297-306).
Ziel
Mit diesem Beispiel soll die Befürchtung, dass systematisches Arbeiten gleichbedeutend mit Mehraufwand ist, relativiert werden. Das geschieht indem man zeigt, wie viel mehr an Info
rmation in einem einfachen Beispiel gewonnen werden kann ohne dass mehr Experimente durchgeführt werden müssen. (Die Varianz wird durch das systematische Vorgehen im Vergleich zum naiven Vorgehen auf ein Viertel gesenkt!)
Fragestellung
Es sollen 7 Gegenstände mit einer Balkenwaage gewogen werden. Ziel ist es mit möglichst wenigen Wägungen eine möglichst genaue Gewichtsangabe für die einzelnen Gegenstände machen zu können. Dabei ist auch ein Versuch zu berücksichtigen mit dem die Waage auf 0 eingestellt wird.
Es wird angenommen, dass jedes Wiegen ein Messvorgang mit einer Standardabweichung von σ ist.
Naives Vorgehen
In dieser Situation ist das einfachste Vorgehen natürlich jedes Objekt einzeln zu Wiegen. Einschließlich der „Null“ Messungen werden also 8 Versuche oder Messungen durchgeführt.
Damit ergibt sich für jedes Wiegen eine Standardabweichung von 2σ. Die 2σ kommen zustande, da die Bestimmung des Gewichts eines Gegensandes aus dem Vergleich von 2 Messungen hervorgeht.
Die Waage wird auf die 0 eingestellt. Dieser Vorgang ist, da er eine Messung darstellt, mit dem Fehler σ behaftet.
Es wird das Gewicht des Gegenstandes auf der Waage gemessen. Dieser Messvorgang hat auch wieder eine Standardabweichung von σ.
Um das Gewicht des Gegenstandes zu bestimmen werden also 2 Messwerte verglichen. Die Messung ohne den Gegenstand und die Messung mit dem Gegenstand.
Fazit: Die Messung jedes Gegenstandes hat eine Varianz von 4σ².
Hotellings Vorschlag
Statt jeden Gegenstand einzeln zu wiegen werden immer mehrere Gegenstände, die hier mit den Buchstaben A, B, C,...G bezeichnet werden, gleichzeitig auf die Waage gelegt. Wir beginnen mit dem Wiegen von allen Gegenständen gemeinsam.
Anschließend wird jeder Gegenstand noch 3 mal gewogen.
Dabei werden immer 3 Gegenstände gemeinsam gewogen.
Es soll jeder Gegenstand noch genau einmal mit jedem anderen Gegenstand gewogen werden.
Damit ergibt sich folgendes Schema:
Tabelle 1: Die verschiedenen Messungen nach Hotelling
Ausrechnen der Einzelgewichte
Diese Gleichungen lassen sich relativ leicht lösen, um die einzelnen Gewichte zu erhalten:
Es müssen jeweils alle Gleichungen die den Gegenstand enthalten aufaddiert werden und anschließend alle Gleichungen, die den Gegenstand nicht enthalten subtrahiert werden. Das Resultat ist das vierfache des Gewichts des jeweiligen Gegenstandes. Für Gegenstand A sieht das also so aus:
4*A = Y1+Y2+Y3+Y4-Y5-Y6-Y7-Y8
(Rechnen Sie es einfach mal nach.) D.h. Wir erhalten das Gewicht von A als:
A = (Y1+Y2+Y3+Y4-Y5-Y6-Y7-Y8)/4
Es werden also 8 Messwerte (Zufallsvariablen) aufaddiert, die jeweils mit dem Wert ¼ multipliziert werden. Was bedeutet das für die Varianz unserer Messung?
Erwartete Varianz der Resultate nach Hotellings Vorgehen
Wir benutzen zwei einfache Regeln der Varianzrechnung:
Die Varianz zweier unabhängiger Zufallsvariablen ist gleich der Summe der Varianzen der einzelnen Zufallsvariablen:
Var(A+B) = Var(A) + Var(B).
Multipliziert man eine Zufallsvariable mit einer Zahl c, so wirkt diese Zahl quadratisch auf die Varianz der Zufallsvariable:
Var(c*A) = c*c*Var(A).
Damit ergibt sich für unseren Fall:
Var(A) = 1/16 Var(Y1) + 1/16Var(Y2) + … + 1/16Var(Y8)
Da die Varianz jeder Messung gleich σ² ist ergibt sich:
Var(A) = 8/16 σ² = ½ σ²
Fazit: Durch geschickte Methodik beim Messen können wir die Genauigkeit unserer Aussagen verbessern. Die Varianz der Messungen in unserem Beispiel verringert sich von 2σ² auf ½ σ², während sich die Standardabweichung um den Faktor 1/Wurzel(2) verringert. Dabei wurden nicht mehr Messungen durchgeführt, als wenn nur die einzelnen Gegenstände gemessen worden wären.
Probieren wir das mal aus an einem ...
Beispiel
Es liegen die 7 Gegenstände A, B, C, D, E, F und G vor. Da ich keine Waage zur Hand habe simuliere ich meine Messungen. Ich muss also auch die wahren Gewichte vorgeben.
Tabelle 2: Überblick über die simulierten Gewichte
Ich simuliere also in JMP jeweils 15 naive Messungen pro Gegenstand. Es wird also auf den wahren Wert des Gegenstandes ein zufälliger Fehlerterm aufaddiert. Hier nehme ich Zufallszahlen aus einer Standardnormalverteilung.
Für Hotellings Methode gehe ich ähnlich vor. Ich simuliere zunächst die Messungen Y1, Y2, … , Y8. Ich kenne für jede Messung den wahren Wert. Auch hier wird ein Fehlerterm aus einer Standardnormalverteilung hinzugezählt. Im Anschluss können die Gewichte, wie oben beschrieben ausgerechnet werden.
Abbildung 1: Simulierte Messungen: a,b,c,... naiv, A2,B2,C2,... nach Hotelling
Berechnet man nun die Standardabweichung für die Messungen jedes Gegenstandes und für jede Methode getrennt bestätigen sich die theoretischen Überlegungen.
Tabelle 3: Vergleich der Standardabweichungen für die Messung der Gewichte pro Gegenstand
In der Grafik sieht man gut, dass die Standardabweichung der Messungen nach Hotellings Methode (fast) durchgehend bei etwa 0.7 liegen. Die 0.707 ist die Standardabweichung der naiven Methode (=1) geteilt durch Wurzel(2).
Abbildung 2: Graphischer Vergleich der Standardabweichungen
Histogramme: Verteilung der Resultate mit beiden Wiegemethoden
Was hat das jetzt mit Versuchsplanung zu tun? Werfen wir mal einen Blick auf den einen Versuchsplan, wie ihn JMP für diese Situation erstellt.
Wir definieren 7 zwei-stufige Faktoren A,B,C,...G (z.B. A der Gegenstand wird gewogen werden oder nicht gewogen). Wir interessieren uns nur für Haupteffekte und erstellen deshalb einen teilfaktoriellen Plan mit Resolution III. Dieser Plan wird manchmal auch als „Taguchi L8“ bezeichnet.
Abbildung 3: Taguchi-Versuchsplan in JMP
In der Muster-Spalte finden wir genau die von Hotelling beschriebene Systematik wieder.
Es gibt noch eine Möglichkeit noch effizienter zu messen. Die bessere Lösung wird vielleicht beim nächsten Mal vorgestellt.
Literatur:
Harold Hotelling – Some Improvements in Weighing and Other Experimental Techniques; Annuals of Mathematical Statistics 15 (1944) p.297-306