Inhalte
Wozu werden A/B‑Tests eingesetzt?
A/B‑Tests (auch Split-Tests genannt) helfen Ihnen, die Reaktion von Menschen auf alternative Angebote zu testen. Hier sind einige Beispiele:
Politische Parteien finden mit A/B‑Tests heraus …
- welches von drei Wahlplakaten die höchste Sympathie für die Kandidatin hervorruft.
- welcher Wahlslogan sich am besten einprägt.
- welcher Wahlslogan die höchsten Sympathiewerte hervorruft.
- welcher Punkt in einem Wahlprogramm ganz oben stehen sollte, um die höchste Zustimmung für das Programm zu erreichen.
Unternehmen nutzen A/B‑Tests, um zu entscheiden, …
- welche Farben oder welche Bilder im Webshop die höchste Kaufrate erzeugen.
- welcher Anzeigentext die meisten Bestellungen generiert.
- an welchen Wochentagen ein Sonderangebot ihnen den größten Nutzen bringen.
- bei welcher Beschallung ein Schuhgeschäft den höchsten Umsatz erzielt.
Wie Sie mit A/B‑Tests Entscheidungsfehler vermeiden
A/B‑Tests sind meist einfach durchzuführen. Das Besondere an ihnen ist, dass sonstige Einflüsse zuverlässig eliminiert werden.
Schauen wir uns das Beispiel der Hintergrundmusik im Schuhgeschäft an. Der Schuhhändler könnte einfach eine Woche Volksmusik abspielen und die folgende Woche Popmusik. Die Musik, die er in der Woche mit dem höchsten Umsatz gespielt hat, spielt er in Zukunft nur noch.
Eine gute Entscheidung? Nicht wirklich!
Neben der Beschallung gab es nämlich eine Menge weiterer Einflüsse, die zwischen den beiden Wochen variiert haben. Diese Einflüsse können sein: Wetter, Schulferien, Monatsanfang vs. Monatsende, gute oder schlechte Nachrichten in der Zeitung, und so weiter.
Der Schuhhändler läuft also Gefahr, künftig eine Musikart abzuspielen, die seinen Umsatz mindert. Und zwar um einen spürbaren Betrag.
Genau diese Art von Entscheidungsfehlern ist es, die sich mit A/B‑Tests einfach vermeiden lassen.
Wie führt man A/B‑Tests durch?
Das Wichtigste beim A/B‑Test ist das Randomisieren. Wenn Sie wissen wollen, ob die Wurst sich mit der Windmühle oder mit dem Bauernhof auf dem Etikett besser verkauft, stellen Sie abwechselnd das eine oder das andere Produkt ins Regal. Wann genau welches Produkt angeboten wird, muss randomisiert, also zufällig sein.
Sie würden beispielsweise jeden Tag eines der Produkte anbieten. Welches Produkt an einem bestimmten Tag ins Regal kommt, können Sie auswürfeln. Zum Beispiel: ungerade Zahl = Windmühle; gerade Zahl = Bauernhof. Jeder neue Datenpunkt ist ein Experiment. Eine Kombination aus Zeit und Produkt.
Sie notieren für jede Variante den Tagesabsatz an den betreffenden Tagen. Mit einem einfachen statistischen Verfahren stellen Sie fest, wann Sie genügend Stichproben für eine eindeutige Aussage haben. Dann können Sie das Experiment beenden.
Es gibt kein anderes Werkzeug, mit dem Entscheidungen so verlässlich getroffen werden, wie mit randomisierten (Zufalls-) Experimenten.
Wann funktionieren A/B‑Tests (nicht)?
Ganz pauschal: Es muss möglich sein, eine Anzahl randomisierter Experimente durchzuführen. Experimente, bei denen Sie die A- und B‑Varianten ausprobieren. A/B‑Tests machen dann Sinn, wenn nach den Experimenten ein längerer Zeitraum folgt, in dem die überlegene Variante eingesetzt wird. Schauen Sie sich doch noch einmal die Anwendungen im ersten Abschnitt an.
A/B‑Tests sind nicht möglich, wenn Sie die Entscheidung vor ihrer Umsetzung nicht experimentell simulieren können. Beispiel dafür: Sie müssen aus zwei Kandidaten für eine Stelle einen auswählen. Sie haben Ihre Entscheidung für ein neues Auto auf zwei Modelle eingegrenzt und müssen sich nun für eins entscheiden.
Bei der Personalauswahl ist es möglich, mit Strategien der Personalauswahl zu experimentieren. Hier ein Vorschlag für Experimentierfreudige:
- Beschreiben Sie zwei Strategien oder Vorgehensweisen der Personalauswahl. Die erste könnte zum Beispiel darin bestehen, Bewerbungsgespräche telefonisch durchzuführen. Bei der zweiten Strategie wird traditionell face-to-face interviewt.
- Formulieren Sie eine testbare Hypothese. Zum Beispiel: “Die Inhaber von Stellen, die durch Bewerbungsgespräche im Büro besetzt werden, werden nach einem Jahr von ihren Vorgesetzten besser bewertet also solche, die auf Grundlage von Telefongesprächen ausgewählt wurden.”
- Bei den nächsten 20 bis 30 Bewerbungen führen Sie randomisierte Experimente durch. Für jede zu besetzende Stelle lassen Sie die Münze entscheiden, ob Sie Vor-Ort- oder telefonische Interviews durchführen.
- 12 Monate später beginnen Sie, Bewertungen einzuholen und Mittelwerte und Standardabweichungen zu berechnen. Differenziert nach der jeweils angewandten Auswahlstrategie.
- Prüfen Sie, ob die Unterschiede zwischen den beiden Strategien statistisch signifikant sind. Im Internet gibt es diverse kostenlose Signifikanzrechner. Zur Interpretation, besonders des p‑Wertes, hier ein Link: https://jacobfricke.de/statistisch-signifikant-ab-test/ .
Wie können Sie die Methode einführen?
So gehe ich bei unseren SolidDecisions-Kunden gerne vor:
- Verschiedene Bereiche und Themen des Unternehmens auflisten. Ich mache das gerne mit einer Mindmap.
- Mit den Stakeholdern (Bereichsleiter, Projektverantwortliche) sprechen und aktuelle Probleme, Ziele, Erfolgskriterien in Erfahrung bringen. Die Ergebnisse in die Mindmap einfügen.
- Auf Grundlage der Ergebnisse etwa zehn Ideen für provokante Hypothesen formulieren. Denn nichts ist wirkungsvoller, als mit dem A/B‑Test-Pilotprojekt gleich eine heilige Kuh zu schlachten.
- Gemeinsam mit den Stakeholdern drei bis vier Hypothesen für das Einführungsprojekt auswählen und eventuell verbessern.
- Einen (agilen) Umsetzungsplan festlegen und machen.
Dieser Ansatz ist zugegeben etwas ungewöhnlich. 99,9% der Anwender setzen A/B‑Tests für Optimierungsentscheidungen ein. Wie in den Beispielen im ersten Abschnitt.
In meinen typischen Projekten geht es dagegen um Disruption, um das Hinterfragen von Paradigmen, von festsitzenden Annahmen darüber, wie die Welt funktioniert und wie man Dinge tut.
Support
Wenn ich Ihnen im Rahmen eines kompakten Telefongesprächs oder einer Email weiterhelfen kann: Das mache ich gerne kostenlos. Schreiben Sie mir einfach eine NachrichtFür Trainings, Webinare, Workshops oder Tele-Coaching finden Sie über den Link mehr Informationen.
Unbekannte Begriffe?
Autor
Übrigens ...
Das ist ihre größte Schwäche. Denn die Menschen, die sie nutzen, sind nicht objektiv und rational. Sie sind allgemein tendenziös, manipulierbar, unzureichend informiert und machen logische Fehler.
Die Folgen von Fehlentscheidungen können katastrophal sein, siehe Dieselgate.
Das SolidDecisions-Framework sorgt dafür, dass diese Einflüsse minimiert und die Entscheidungsqualität gesteigert wird.