4. Lehreinheit

\(\newcommand{\diff}{{\rm d}}\) \(\newcommand{\pdiff}{{\partial}}\)

Messen in der Chemie – Sommersemester 2022
4. Vorlesung (16.05.2022)

4 — Einiges aus der messtechnischen Statistik

4.1.– Softwarenutzung in der Physikalisch-Chemischen Messtechnik und Datenverarbeitung.

Praktisch jeder moderne Messaufbau in der Physikalischen Chemie ist computergestützt (im PC-Praktikum gibt es hiervon Ausnahmen, aber das sind dann keine zeitgemäßen Versuchsaufbauten, vielmehr dienen sie didaktischen Zwecken). Rechner spielen eine zentrale Rolle in verschiedenen Phasen (Abschnitten) eines Experimentes:

Messinstrumente werden von Computern über eine Schnittstelle (z.B. USB, RS-232, IEEE-488 (HP-IB)) angesteuert und ausgelesen.
Die Rohdaten werden graphisch dargestellt.
Datensätze werden statistisch bearbeitet, um Mittelwerte, Streuungen etc. zu ermitteln.
Die Rohdaten werden verarbeitet, kalibriert, normiert, auf andere Datensätze bezogen und so weiter.
Theoriefunktionen werden an einen Datensatz angepasst, um theoretische Parameter zu ermitteln (Curve Fitting, das spielt eine wichtige Rolle im PC-Praktikum).
(… hier könnte man noch viele weitere Punkte aufführen; die genannten spielen im PC-Praktikum eine große Rolle.)

Datenanalyse-Software enthält oft umfangreiche Mathematik-Pakete, die eine Auswertung der Messdaten überhaupt erst ermöglichen (Beispiel: Fourier-Transformation von Interferogrammen in der FTIR-Spektroskopie).

Neben Datenanalyse-Programmen gibt es auch reine Mathematik-Programme, die das Leben erheblich erleichtern, weil sie umständliche und fehleranfällige mathematische Prozeduren übernehmen, wie z.B. das Ableiten und Integrieren einer Funktion, oder das Auflösen einer Gleichung nach einer darin auftretenden Größe. Programme, die mit symbolischer Mathematik umgehen können, also z.B. das Ingetral \(\int x^2 \cdot \exp(-x) \diff x\) ausrechnen, oder den Grenzwert von \(\frac{\sin x}{x^2} \) an der Stelle \(x=0\) ermitteln können, werden CAS-Programme (CAS = Computer Algebra System) genannt.

Kommerzielle CAS-Programme können sehr viel Geld kosten. Es gibt aber einige kostenfreie Möglichkeiten, Mathematik am Computer zu betreiben, wenn man es nicht hauptberuflich tut; hier werden nur zwei aufgelistet.

WolframAlpha ist eine Webseite des Herstellers der Mathematik-Software Mathematica. Das oben genannte Integral \(\int x^2 \cdot \exp(-x) \diff x\) wird problemlos damit ermittelt (der Link enthält die Aufgabenstellung, klicken Sie mal, Sie werden sich wundern): WolframAlpha. Wenn Sie sich einen (kostenlosen) Basic Account zulegen, erhöht sich die Ihnen täglich zur Verfügung stehende Prozessorzeit.
Der Nachteil von Webseiten ist natürlich, dass sie nicht offline funktionieren. Es gibt eine Vielzahl von CAS-Programmen, die man kostenlos auf seinem Rechner installieren kann. Yacas ist für viele Zwecke ausreichend und kann auf den üblichen Computersystemen (MS Windows, MacOS, Linux) installiert werden.

Für unsere Zwecke sind Numerik-Programme aber viel wichtiger als CAS-Programme. Diese liefern nicht symbolische Lösungen eines Problems, sondern Zahlenwerte, beispielsweise die Fläche unter einer experimentell bestimmten Kurve.

Speziell zur zahlenmäßigen Flächenbestimmung gab es früher die Methode der Chemiker-Integration: die auf Papier aufgetragene Kurve wurde bis zur Abszisse mit der Schere ausgeschnitten und auf eine Analysenwaage gelegt. Das ist heute nicht mehr zeitgemäß, da die Messdaten ohnehin digital vorliegen und dementsprechend mit einem Programm ausgewertet werden können.

Ein für unsere Zwecke fast immer geeignetes Programm zur Datenerfassung, -auswertung und -darstellung ist die Software Igor Pro des Herstellers WaveMetrics, das zur Nutzung im Rahmen des Praktikums und begleitender Lehrveranstaltungen (also auch Messen in der Chemie) allen Teilnehmern kostenlos zur Verfügung gestellt wird.

Im Folgenden werden wir mit Igor auf Tuchfühlung gehen; im weiteren Verlauf dieser Lehrveranstaltung werden wir es häufig nutzen.

4.2 — Einführung in Igor Pro

Wenn Sie das Programm starten, öffnet Igor zwei Fenster: (a) eine Tabelle zum Eintragen von Daten; (b) ein Kommandofenster zum Eingeben und Auflisten von Befehlen (siehe Abb. 4-1).

Schließen Sie bitte das Tabellenfenster, dieses werden wir vorläufig nicht brauchen.

Abb. 4-1: Das Kommandofenster der Software Igor Pro.

Den lästigen Symbolstreifen (Toolbar) unter der Titelleiste des Kommandofensters werden Sie los, indem Sie im Menü Windows auf Hide Toolbar klicken. Im folgenden wird das Kommandofenster ohne den (die? das?) Toolbar gezeigt.

Unter dem roten Streifen des Kommandofensters ist die eigentliche Befehlszeile. Hier spielt die Musik.

Geben Sie dort bitte ein:

print 2+3

und betätigen Sie die Return-Taste Ihrer Tastatur zum Abschicken des Befehls. Igor macht jetzt folgendes:

Er liest und interpretiert den Befehl; wenn sich ein Fehler im Befehl befindet, beschwert er sich mit einer Fehlermeldung (probieren Sie mal pprint 2+3).
Er führt den Befehl aus und kopiert den Befehl und das Ergebnis des Befehls in den oberen Bereich des Kommandofensters, die History:

Abb. 4-2: Ein einfacher Befehl und seine Ausführung.

Mathematische Funktionen haben die in Computersprachen üblichen Bezeichnungen, so ist zum Beispiel die Quadratwurzel aus 2 durch folgenden Befehl zugänglich:

print sqrt(2)

Das Argument der Wurzelfunktion wird in Klammern hinter das Wurzelzeichen sqrt geschrieben.

Dies gilt ganz allgemein: \(\ln 2\) wird erhalten durch den Befehl ln(2), der Sinus von 1.3 \(\rm rad\) durch sin(1.3).

Damit Ihre Daten nicht verloren gehen, sollten Sie das Projekt jetzt auf Ihrem Rechner abspeichern; dabei kann ein beliebiger Name und ein beliebiger Speicherort verwendet werden. Igor verwendet die Endung pxp als Dateinamenserweiterung. Das hier gezeigte Igor-Projekt wurde unter dem Namen IgorIntro abgespeichert; der Name des Projektes erscheint nachfolgend in der Titelleiste des Kommandofensters.

Datentypen.— Wie jede Programmierumgebung verfügt auch Igor über spezielle Datentypen. Wir stellen hier zunächst zwei besonders wichtige vor:

(1) Datentyp variable: Der elementarste Datentyp heißt variable und entspricht einfach einer Zahl. Geben Sie bitte ein, und bestätigen Sie jeweils mit Return:

variable var1 (die Variable var1 wird deklariert, d.h. ab jetzt gibt es sie);
var1 = sqrt(3) (die Variable var1 wird definiert, d.h. ihr wird ein Wert zugeordnet);
print var1 (der Wert wird in der History ausgedruckt, und Igor weiß ab jetzt, wofür var1 steht):

Abb. 4-3: Deklaration und Definition einer Variablen in der Software Igor Pro. Beachten Sie, dass sämtliche Befehle in der History aufgelistet sind. Sie können daher später immer nachschauen, was Sie bereits gemacht haben.

Die Variable var1 existiert nur innerhalb des aktuellen Igor-Projektes (hier also IgorIntro). Wenn Sie ein neues Projekt anfangen, kennt Igor var1 nicht.

(2) Datentyp wave: Das ist der wichtigste Datentyp. Eine Wave entspricht einer geordneten Liste von Zahlen, also ungefähr dem, was in einem Tabellenkalkulationsprogramm wie MS Excel in einer Spalte der Tabelle dargestellt wird.

Mit »geordnet« ist hier nicht gemeint, dass die Werte nach ihrer Größe oder einem sonstigen Kriterium sortiert sind; sondern dass es auf Reihenfolge der Elemente der Wave ankommt.
Hier ein Gegenbeispiel: Nehmen wir an, Sie haben folgende Einkaufsliste beim Besuch im Supermarkt dabei: Eier, Mohrrüben, Milch, Müsli.
Hier kommt es auf die Reihenfolge der Liste nicht an. In Ihrer Einkaufstüte würde sich nach dem Verlassen des Ladens dasselbe befinden, wenn auf Ihrem Einkaufszettel statt dessen gestanden hätte: Milch, Mohrrüben, Eier, Müsli.

Geradeso wie Variablen haben auch Waves stets einen Namen. Zum Erzeugen einer Wave gibt es den Befehl make, wie wir hier an einem Beispiel zeigen:

make testW = {1, 1.5, 1.8, 1.4, 1.7, 1.5, 1.9}

Die Wave heißt also testW, die einzelnen Zahlen stehen in geschweiften Klammern dahinter, durch ein Komma separiert. Beachten Sie, dass als Dezimalseparator ein Punkt verwendet wird.

Zur Namensgebung von Variablen und Waves gibt es einige Regeln, die zu beachten sind.

Der Name darf nicht mit einer Ziffer beginnen: myWave1 ist erlaubt, aber 1myWave ist nicht erlaubt.
Es dürfen alle Buchstaben des Alphabetes, alle Ziffern sowie der Unterstrich _ verwendet werden. Umlaute, Leeranschläge und sonstige Sonderzeichen sind nicht erlaubt.
Igor ist nicht Groß- und Kleinbuchstaben-sensitiv: myWave1 und Mywave1 bezeichnen dasselbe Objekt.
Es dürfen nicht zwei Vertreter eines Datentyps denselben Namen haben.
Zwei Vertreter unterschiedlicher Datentypen dürfen denselben Namen haben. Es darf also eine Wave xxx und eine Variable xxx geben, aber es ist keine gute Idee.
Die Namen von Variablen und Waves sollten nach Möglichkeit aussagekräftig sein; man weiß sonst später nicht, worum es sich handelt. myWave1 ist also kein guter Name.

Wenn eine Wave mit dem Namen testW nicht allzu viele Elemente enthält, kann man sie mit dem Befehl print testW in der History ausdrucken.

Das ist alles, was wir im Augenblick brauchen; weitergehende Funktionalität werden wir später kennenlernen. Wir werden im folgenden Abschnitt Igor-Waves benutzen, um an Datensätzen Statistik zu betreiben.

4.3.– Streuung von Messdaten.–

Mittelwert, Varianz, Standardabweichung.

Wiederholte Messungen liefern nicht stets dasselbe Ergebnis. Beispiel: Wir setzen eine Lösung an, die nach einer bestimmten Zeit einem plötzlichen Farbumschlag unterworfen sein soll. Wird dieser Versuch einige Male wiederholt, so unterscheiden sich die Versuchsbedingungen doch jedes Mal geringfügig: die Konzentration der Lösung ist nicht dieselbe, die Temperatur kann geringfügig höher sein, die Helligkeit im Labor ist nicht dieselbe, die Adaptierung der Augen ist etwas anders als zuvor usw. Diese und ähnliche Änderungen in den äußeren Umständen führen zu zufälligen Schwankungen der gemessenen Zeit bis zur Wahrnehmung des Farbumschlags.

Aus den Beobachtungen werden Messwerte gewonnen; diese bilden zunächst eine Reihe von Zahlenwerten.

Hier ist ein Beispiel einer solchen Messreihe:

6,86; 6,85; 7,39; 6,98; 8,02; 7,62; 6,30; 6,80; 7,03; 7,80; 7,2; 8,19

Die Messreihe ist eine Liste von Zahlenwerten (die zugeordnete Einheit ist hier ganz belanglos, es könnten also z.B. titrierte Milliliter sein). Für den \( i \)-ten Messwert wollen wir das Symbol \( x_{i} \) verwenden.

Der wichtigste Informationsgehalt einer Messreihe, bei der wiederholt dieselbe Größe gemessen wird, ist ihr Mittelwert \( \mu \).

Es lässt sich theoretisch zeigen, dass der Mittelwert \(\mu\) mit größerer Wahrscheinlichkeit dem wahren Wert entspricht als irgendeiner der Einzelwerte.

In vielen Fällen gibt es aber in der Realität nichts, was einem wahren Wert entsprechen könnte. Beispiel: wenn wir das Körpergewicht aller Teilnehmer an dieser Lehrveranstaltung messen, entsteht eine Liste aus Zahlenwerten, aber dem Mittelwert entspricht nicht eine reale Person.

Der Mittelwert \(\mu\) einer Liste von \(N\) Messpunkten ist definiert als \begin{equation} \label{eqMittelwert} \mu = \frac{1}{N} \cdot \sum_{i=1}^{i=N} x_{i}. \end{equation}

Wir haben also insgesamt \(N\) Messpunkte; wir summieren alle Messwerte \(x_i\), also \(x_1\), \(x_2\), \(x_3\) und so weiter, und teilen diese Summe durch die Anzahl \(N\) der Messungen. Unter das Summenzeichen \(\sum\) schreibt man den Startwert der Laufzahl \(i\), also den Index des ersten Messwerts \(x_1\), und über das Summenzeichen die Laufzahl des letzten der \(N\) Messwerte, also \(N\). Der Einfachheit halber lässt man bei der Obergrenze das \(i=\) gewöhnlich weg und schreibt einfach \(N\), wenn das eindeutig ist. So wollen wir auch im Folgenden verfahren.

Der Mittelwert ist auf den meisten wissenschaftlichen Taschenrechnern als Funktion vorhanden, das Zeichen dafür ist häufig \( \mu \) oder \( \bar{x} \) (lies: x quer). Machen Sie sich bitte mit der entsprechenden Funktionalität Ihres Taschenrechners anhand der Betriebsanweisung vertraut.

Eine Liste kann in Igor importiert werden. Eine Liste wird in Igor als Wave repräsentiert, denn eine Wave ist ja zunächst nichts weiter als eine Liste von Zahlenwerten.

Damit wir mit der Liste in Igor bequem arbeiten können, definieren wir sie und geben ihr einen Namen, zum Beispiel L1. Geben Sie also bitte an der nächsten Befehlszeile ein (copy-paste funktioniert):

make L1 = {6.86, 6.85, 7.39, 6.98, 8.02, 7.62, 6.30, 6.80, 7.03, 7.80, 7.2, 8.19}

Sie können also eine Werteliste wie in der eben gezeigten Zeile in eine Igor-Wave schreiben. Hierzu müssen Sie beachten, dass (a) die Zahlen mit einem Punkt als Dezimalseparator geschrieben werden und (b) die Einzelwerte durch Kommata separiert werden. Dies ist eine sehr bequeme und häufig genutzte Möglichkeit, eine Werteliste zu übertragen. Andere Möglichkeiten sind:

Kopieren in eine Igor-Tabellenspalte. Der Befehl edit öffnet eine leere Tabelle, jetzt können Sie aus der Zwischenablage Werte in eine Spalte pasten. Die Werte müssen dann aber durch ein Zeilenende-Zeichen voneinander separiert sein, nicht durch Kommata.
Igor-Menü Data → Load Waves → Load General Text… Hierzu müssen die Werte als Textdatei vorliegen; dies ist die am häufigsten verwendete Methode, um Daten zu übertragen.
Dann gibt es auch noch die Möglichkeit, Igor mit einem Messgerät sprechen zu lassen, also die Daten direkt aus einem Messgerät über eine geeignete Schnittstelle (z.B. RS-232) in Igor einzulesen.

Bitte beachten Sie:

Die Wave L1 ist jetzt definiert. Igor verfügt über Funktionen, die auf die Liste wirken.

Den Mittelwert der Listenelemente der Liste L1 erhalten wir durch Anwendung der Funktion mean auf die Wave, die wir aus der Liste erzeugt haben. Sie führt unsere Gleichung \ref{eqMittelwert} aus:
print mean(L1)
Dies liefert den Mittelwert \(7,2533\dots\) Wir können den Mittelwert, falls wir ihn später benötigen sollten, auch in einer Variable abspeichern:
variable meanL1 = mean(L1)
In dieser Befehlszeile wurden Deklaration und Definition der Variablen meanL1 zusammengezogen.
Der Igor-Befehl sum(L1) summiert alle Elemente der Liste (also der Wave).
Der Igor-Befehl numpnts(L1) gibt die Anzahl der Elemente der Wave zurück; folglich muss folgender Befehl ebenfalls den Mittelwert ergeben:
print sum(L1)/numpnts(L1)
Probieren Sie es doch aus!

Damit sind wir mit der Bestimmung des Mittelwertes auch schon fertig. In der Abbildung 4 sehen Sie Ein- und Ausgabe im Kommandofenster:

Abb. 4: Definition einer Datenliste als Wave mit dem Namen L1 und Berechnung der Summe aller Elemente (Befehl sum) sowie des Mittelwertes (Befehl mean).

Streuung um den Mittelwert.– Neben dem Mittelwert interessiert uns die Frage, in welchem Ausmaß die Einzelwerte um dieses Mittel schwanken, oder, wie wir lieber sagen, streuen. Wir wollen ja wissen, wie nahe unsere Einzelwerte beim Mittelwert liegen.

Man könnte vielleicht zunächst geneigt sein, analog zur Mittelwertbildung die Schwankung der Werte durch den Mittelwert der Abweichung \(x_i-\mu\) der Einzelwerte vom Mittelwert \(\mu\) der Liste zu definieren, also den Ausdruck \[ \frac{1}{N} \cdot \sum_{i=1}^{N} \left(x_{i}- \mu\right) \] zu verwenden, aber man überzeugt sich leicht, dass dieser Ausdruck stets Null ergibt (das liegt daran, dass die positiven und negativen Abweichungen der Einzelwerte vom Mittelwert sich immer genau kompensieren, probieren Sie es ruhig mit der Liste L1 aus!). Das funktioniert also prinzipiell nicht.

Um die gegenseitige Kompensation der Abweichungen vom Mittelwert zu eliminieren, könnte der Ausdruck \[ \frac{1}{N} \sum_{i=1}^{N} \left|{x_{i}- \mu}\right| \] verwendet werden (also unter Nutzung der Beträge der Abweichungen); aber auch dieser schafft Probleme. Dies ist in der Abb. 5 gezeigt.

Abb. 5: Verwendet man den Ausdruck \begin{equation*} \tfrac{1}{N} \cdot \sum \left|{x_{i}- \mu}\right| \end{equation*} zur Charakterisierung der Streuung, so liefern die beiden Situationen in der Abbildung dieselbe Streuung, obwohl die Streuung der unteren Messung größer ist.

Als Maß der Streuung wird häufig die Varianz \( V \) verwendet. Sie ist wie folgt definiert: \begin{equation} \label{eqDefVariance} V = \frac{1}{N} \cdot \sum_{i=1}^{N} \left(x_{i} - \mu \right)^{2.} \end{equation} Beachten Sie das Quadrat in der Summe. Wir summieren also die Quadrate der Abweichungen.

Auch bei der Varianz als Maß der Steubreite treten Probleme auf:

Die Varianz hat nicht dieselbe Einheit wie die Größe, die beschrieben wird, sondern das Quadrat dies Einheit; das ist unschön.
Die Varianz gibt stark abweichenden Einzelwerten ein höheres Gewicht als solchen Einzelwerten, die vom Mittelwert nicht stark abweichen, weil kleine Größen beim Quadrieren noch kleiner werden, und große Werte werden beim Quadrieren erst recht groß.

Im PC-Praktikum, und generell in der Physikalischen Chemie, wie die Standardabweichung \( \sigma \) als Maß der Streuung der Einzelwerte verwendet. \(\sigma\) ist definiert als die Quadratwurzel aus der Varianz: \begin{equation} \label{eqDefStdDev} \sigma = \sqrt{V} = \sqrt{ \frac{1}{N} \cdot \sum_{i=1}^{N} \left(x_{i} - \mu \right)^{2} } \end{equation}

Die in Gl. \ref{eqDefStdDev} definierte Größe \( \sigma \) wird auch als Gesamtstandardabweichung bezeichnet. Man muss tiefer in die Urgründe der Statistik einsteigen, um den Hintergrund dieses Begriffes zu verstehen.

Neben dieser Gesamtstandardabweichung \(\sigma\) wird die Probenstandardabweichung \( \sigma_{P} \) verwendet; diese ist definiert als \begin{equation} \label{eqProbenstandardabweichung} \sigma_{P} =\sqrt{ \frac{1}{N-1} \cdot \sum_{i=1}^{N} \left(x_{i} - \mu \right)^{2} } \end{equation}

Sie unterscheidet sich von der in Gl. \ref{eqDefStdDev} definierten Gesamtstandardabweichung (die wir auch als Standardabweichung schlechthin bezeichnen) durch das Auftreten der Größe \(N-1\) statt \(N\) im Nenner vor dem Summenzeichen. Für große \(N\) ist der Unterschied irrelevant. Auf Taschenrechnern ist meist \( \sigma_{P} \) verfügbar (dies muss im Handbuch des Taschenrechners nachgelesen werden).

Zur Gesamtstandardabweichung \( \sigma \) entsprechend Gl. \ref{eqDefStdDev} gelangt man, indem man in den Taschenrechner zunächst alle Werte in das Summenregister eingibt, dann den Mittelwert \(\mu\) berechnen lässt, diesen dann ebenfalls in das Summenregister eingibt und erst danach die Standardabweichung vom Taschenrechner mit der entsprechenden Befehlstaste errechnen lässt.

Der Unterschied zwischen der Standardabweichung der Gesamtheit \( \sigma \) und der Standardabweichung der Probe \( \sigma_{P} \) ist fast immer belanglos. Um Dinge nicht allzu kompliziert zu machen, können Sie in der Regel mit demjenigen \( \sigma \) rechnen, das Ihr Computerprogramm bzw. Taschenrechner anbietet, außer es wird ausdrücklich Wert auf den Unterschied gelegt.

Mit der Software Igor können Sie die Standardabweichung der Werte aus der Liste L1 (siehe oben) erhalten. Es gibt aber (meines Wissens zumindest) keinen Befehl, der unmittelbar \(\sigma\) liefern würde. Statt dessen verwenden wir den Befehl wavestats, der eine Fülle von statistischen Informationen über den Datensatz liefert. Führen Sie also den folgenden Befehl aus:

wavestats L1

Die Ausgabe sieht dann wie folgt aus:

Abb. 6: Der Befehl wavestats angewendet auf die Wave L1 und die Ausgabe des Ergebnisses in der History.

Igor schreibt die Ergebnisse in temporäre Variablen, die nur solange existieren, bis wavestats erneut auf eine andere Wave angewendet wird. Die bisherigen Werte werden dann überschrieben (stehen aber natürlich noch in der History).

Hier die wichtigsten der erzeugten Variablen (sie beginnen alle mit V_):

V_npnts: Die Punktzahl in der Wave, entspricht numpnts(L1).
V_numNaNs: Liefert die Zahl derjenigen Elemente der Wave, die keine Zahlen sind (z.B. weil das Messgerät eine Fehlermeldung ausgibt; für uns von geringer Bedeutung.
V_numINFs: Summiert die Zahl der Elemente, die unendlich enthalten; für uns von geringer Bedeutung.
V_avg: Liefert den Mittelwert aller Elemente der Wave, entspricht dem Befehl mean(L1)
V_sum: liefert dasselbe wie sum(L1).
V_sdev: liefert die Probenstandardabweichung \(\sigma_P\).
V_sem: sehr wichtig, liefert den Fehler des Mittelwertes (siehe nächster Abschnitt).
V_skew und V_kurt kenne ich nicht und brauchte ich noch nie → keine Ahnung was das ist. 😐
V_minloc und V_maxloc liefern die Nummer der Punkte mit dem kleinsten bzw. größten Datenwert (Minimum und Maximum).
V_min und V_max: die Werte der Datenpunkte V_minloc und V_maxloc, also das Minimum und das Maximum der Punkte.
V_minRowLoc etc (letzte Zeile): diese Daten sind nur wichtig, wenn die Liste zweidimensional ist, für uns also belanglos.

Warum man besser mehr Datenpunkte aufnimmt\( \dots \)

Die Aufnahme von mehr Datenpunkten verbessert die Statistik, aber nur im folgenden Sinne:

Die Standardabweichung wird nicht kleiner! Denn wenn hundert Messdatenpunkte um einen Mittelwert in einer bestimmten Weise streuen, warum sollten dann 1000 Datenpunkte plötzlich weniger stark streuen?
Der Mittelwert \( \mu \) wird genauer \( \to \) der Fehler des Mittelwertes \( \Delta \mu \) wird kleiner.

Der Fehler des Mittelwertes ist nicht dasselbe wie die Standardabweichung. \(\sigma\), die Standardabweichung, gibt an, wie stark Messpunkte um einen Mittelwert streuen. Der Fehler des Mittelwertes, den wir mit \(\Delta \mu\) bezeichnen, gibt an, wie genau der Mittelwert \(\mu\) bekannt ist; wie groß seine Unsicherheit \(\Delta \mu\) ist. \(\Delta \mu\) hängt aber eng mit der Standardabweichung \(\sigma\) zusammen und ist definiert als \begin{equation} \label{eqErrorOfMean} \Delta \mu = \frac{\sigma}{\sqrt{N}}. \end{equation}

Probieren Sie es aus; geben Sie ein:

print V_sdev/sqrt(V_npnts)

und Sie erhalten den Zahlenwert von \(\Delta \mu\).

Um den Fehler des Mittelwertes zu erhalten, teilen wir also die Standardabweichung \(\sigma\) nochmals durch die Wurzel aus der Zahl der Messdaten.

Gegeben sei eine Standardabweichung von \(\sigma=3.5\) bei einer Anzahl von 20 Datenpunkten. Der Fehler des Mittelwertes ist dann gegeben zu

\[ \Delta \mu_1 = \frac{3.5}{\sqrt{20}};\] wenn wir aber 40 Messpunkte aufnehmen, so erhalten wir: \[ \Delta \mu_2 = \frac{3.5}{\sqrt{40}}.\] Teilen wir die beiden \(\Delta \mu\)-Werte durcheinander, so finden wir: \[ \frac{\Delta \mu_1}{\Delta \mu_2} = \frac{3,5 \cdot \sqrt{40}}{\sqrt{20}\cdot 3,5} = \frac{\sqrt{40}}{\sqrt{20}} = \sqrt{\frac{40}{20}} = \sqrt{2}.\]

Bei der halben Anzahl an Messpunkten (20 statt 40) ist also der Fehler des Mittelwertes \(\Delta \mu\) um den Faktor \(\sqrt{2}\) größer. Um einen zehnfach kleineren Fehler des Mittelwertes \(\Delta \mu\) zu erhalten, müssen wir die Anzahl an Messungen verhunderfachen.

Wenn Sie aus einer Messreihe den Mittelwert und den Fehler des Mittelwertes angeben wollen, so verwenden Sie für den Fehler des Mittelwertes bitte den Ausdruck in der Gl. \ref{eqErrorOfMean}.

Mittelwertbildung fehlerbehafteter Größen.–

Die bisherigen Gleichungen gehen davon aus, dass die Messwerte in statistischer Weise um einen Mittelwert schwanken, und es wurden die üblichen statistischen Methoden verwendet, um einen Mittelwert, die Standardabweichung und den Fehler des Mittelwertes zu ermitteln.

Häufig kennen wir aber zusätzlich den individuellen Fehler \(\Delta x_i\) der Messwerte \(x_i\). Wir erhalten z.B. aus verschiedenen Messverfahren eine gewisse Größe mit unterschiedlichem Einzelfehler (es könnte sich z.B. um die Messung einer Naturkonstante mit unterschiedlichen Messmethoden handeln). Hierfür gibt es besondere Vorschriften, die wir hier nicht herleiten, sondern nur mitteilen.

Dabei gelten die folgenden Gleichungen: \begin{equation} \label{eqMittelwertFehlerbehaftet} \mu = \frac{\sum_{i=1}^{N}\frac{x_{i}}{\left(\Delta x_i\right)^{2}}}{{\sum_{i=1}^{N}\frac{1}{\left(\Delta x_i\right)^{2}}}} \end{equation} und \begin{equation} \label{eqFehlerMittelwertFehlerbehaftet} \Delta \mu = \sqrt{\frac{1}{{\sum_{i=1}^{N}\frac{1}{\left(\Delta x_i\right)^{2}}}}}. \end{equation}

Diese Gleichungen gelten auch für den wichtigen Sonderfall, dass alle Fehler \(\Delta x_i\) einander gleich sind.

Die Gleichungen \(\ref{eqMittelwertFehlerbehaftet}\) und \(\ref{eqFehlerMittelwertFehlerbehaftet}\) sehen furchterregend aus, sie können aber mit Hilfe eines Tabellenkalkulationsprogrammes wie MS Excel oder auch mit Igor ohne viel Mühe genutzt werden.

Wir führen hier vor, wie man \(\mu\) und \(\Delta \mu\) in Igor ermittelt; dabei lernen wir gleichzeitig einiges Neue über das Programm kennen.

Die Messdatenreihe weise die folgenden Elemente auf:
{6, 5.8, 6.3, 6.1, 5.9, 6.2, 6.1}

Die Fehler der Einzelmessungen seien wir folgt gegeben:
{0.2, 0.3, 0.2, 0.4, 0.1, 0.1, 0.2}

Man geht also wie folgt vor:

Wir erzeugen aus den Daten und den Fehlern jeweils eine Wave:

make dataW = {6, 5.8, 6.3, 6.1, 5.9, 6.2, 6.1}

make errorW = {0.2, 0.3, 0.2, 0.4, 0.1, 0.1, 0.2}
Wir erzeugen eine weitere Wave, die die Kehrwerte der Quadrate von errorW enthält (wir könnten auch gleich errorW quadrieren, aber die in die Rechnung eingegangenen Rohdaten lässt man besser unverändert, damit man auf sie zurückgreifen kann, wenn beim Rechnen etwas schiefgeht):
duplicate errorW invErrorQuadratW
Mit dem duplicate-Befehl erzeugen wir unter einem neuen Namen eine Kopie des Originals. Dann bilden wir den Kehrwert des Quadrates:
invErrorQuadratW = 1/(invErrorQuadratW * invErrorQuadratW)
Wie Sie sehen, kann man auch an Waves Rechenoperationen ausführen; wenn Sie eine Wave mit sich selbst multiplizieren, dann quadrieren Sie jedes einzelne Element der Wave.
(Wenn Sie sich die Waves in einer Tabelle ansehen wollen, geben Sie ein:
edit dataW, errorW, invErrorQuadratW
Igor erzeugt dann eine tabellarische Ansicht der Daten; Sie können die Elemente in der Tabelle auch editieren, also verändern.)
Wir berechnen den Nenner von Gl. \ref{eqMittelwertFehlerbehaftet}:
variable invErrorQuadratSum = sum(invErrorQuadratW)
Den Zahlenwert der Summe im Nenner der Gl. \ref{eqMittelwertFehlerbehaftet} können Sie sich mit dem Befehl print invErrorQuadratSum ansehen; er beträgt 292,361.
Zum Berechnen des Zählers von Gl. \ref{eqMittelwertFehlerbehaftet}; hierzu erzeugen wir eine neue Wave, die die einzelnen \(\frac{x_i}{\Delta x_i^{2}}\) enthält; als Namen der Wave habe ich zWave (Zählerwave) gewählt; ein Name ist so gut wie der andere:
duplicate dataW zWave

zWave = zWave * invErrorQuadratW
Bitte beachten Sie, dass wir hier die Multiplikation und nicht die Division benutzen, da die Wave invErrorQuadratW ja bereits die Kehrwerte der Quadrate der Fehler enthält.
Wir berechnen die Summe der Elemente von zWave:
variable zWaveSum = sum(zWave)
Wir berechnen den Quotienten aus zWaveSum und invErrorQuadratSum:
variable mittelwert = zWaveSum /invErrorQuadratSum

print mittelwert
Der Mittelwert ergibt sich zu \(\mu = 6,06295\).
Die Berechnung des Fehlers des Mittelwertes entsprechend gleich Gl. \(\ref{eqFehlerMittelwertFehlerbehaftet}\) geht schnell:
variable deltaMu = sqrt(1/invErrorQuadratSum)
Der Fehler des Mittelwertes beträgt \( \Delta \mu =0,0584844\).
Damit erhalten wir als Endergebnis entsprechend der Spielregeln für die Angabe von Wert und Fehler: \[\mu = 6,06 \pm 0,06.\]

Bitte beachten Sie, dass der Fehler des Mittelwertes deutlich kleiner ist als die Einzelfehler!

In der Abb. 4-7 ist die Abfolge der Befehle zu sehen. Es sind nur wenige Zeilen:

Abb. 4-7: Ermittlung des gewichteten Mittelwertes und des Fehlers des Mittelwertes.

Es sei zugestanden, dass diese Lerneinheit vollgestopft mit unhandlichen Gleichungen ist. Wegen der ständig auftretenden Summenzeichen ist es schwierig, die entsprechenden Rechnungen auf Papier von Hand auszuführen. Mindestens benötigt man einen wissenschaftlichen Taschenrechner. Wenn Sie keinen solchen haben, sollten Sie sich einen zulegen; es gibt sie für unter 20 Euro zu kaufen. Achten Sie beim Kauf darauf, dass der Rechner Statistikfunktionen hat.

Wir wollen zur Erheiterung nun ein Computerspiel machen, das Ihnen einen Eindruck von den Ursachen der Streuung von Messdaten vermitteln kann. Das Spiel heißt Quincunx und zeigt die Verteilung von zufälligen Ereignissen. Hier ist der Link auf Quincunx. Klicken Sie bitte auf den Link, so dass sich ein weiteres Browserfenster öffnet und Sie das Spiel sehen.

So sieht die Spielfläche von Quincunx aus:

Abb. 4-8: Quincunx, ein Spiel, das Zufallsverteilungen liefert.

Stellen Sie bitte den Schieberegler Size auf den Maximalwert (15) und Speed auf 50. Klicken Sie dann Restart.

Die blauen Bälle, die nach unten fallen, treffen auf Stangen (die Sie von vorne sehen). Die Wahrscheinlichkeit, dass ein Ball links an der Stange entlang fällt, ist gerade so groß, wie dass er rechts daran herabfällt. So hüpft jeder Ball beim Fallen immer zwischen Stangen hin und her. Unten im Bild sehen die die Häufigkeiten, mit denen die Bälle schließlich in den einzelnen Bereichen unter den Stangen auftreffen. Sie werden feststellen, dass die meisten Bälle nahe der Mitte des Feldes landen, aber eben nicht alle Bälle. Einige treffen auch weit entfernt von der Mitte auf. Da die Verteilung rein zufällig ist, werden Sie bei einer Wiederholung des Spieles während einer gleich langen Zeit nicht wieder genau dieselbe Verteilung erhalten, sondern nur eine ihr ähnliche.

Bitte lassen Sie nach Möglichkeit das Spiel über Nacht laufen. Im Laufe der Zeit wird die Verteilung der Bälle auf die zur Verfügung stehenden Plätze immer regelmäßiger. Dahinter steckt eine strenge Gesetzmäßigkeit, die man Binomialverteilung nennt.

In der nächsten Lerneinheit werden wir diese Verteilung genauer unter die Lupe nehmen. Wir werden herausfinden, was geschieht, wenn wir die Zahl der Auftreffplätze unendlich groß machen (jedes Intervall also unendlich klein), und auch die Zahl der Bälle unendlich groß werden lassen. Dabei ergibt sich eine mathematische Funktion mit faszinierenden Eigenschaften, die wir mit Igor untersuchen werden. Dabei werden wir Igor auch als Graphik-Maschine kennenlernen. Wir werden lernen, dass es diese Funktion ist, die den Schlüssel zu dem Formelsalat liefert, den wir bisher im Rahmen der Fehlerrechnung besprochen haben. Lassen Sie sich überraschen, bleiben Sie (im Wortsinn!) am Ball, und die nächste Teillieferung kommt in einer Woche!

Danke für die Lektüre!

R.F.