Der bekannteste A/B-Test der Welt ist die Farbe des „Jetzt kaufen“-Buttons. Rot oder Grün? Die Antwort ist inzwischen so oft getestet worden, dass du sie fast nicht mehr selbst testen musst: Eine bestätigende Farbe wie Grün funktioniert in den meisten Fällen besser als ein alarmierendes Rot. Trotzdem wird genau so etwas immer noch getestet – während die Fragen, die wirklich über den Umsatz entscheiden, unbeantwortet bleiben.
A/B-Testing hat bei vielen kleinen und mittleren Unternehmen einen merkwürdigen Status. Die einen halten es für ein Werkzeug, das nur Amazon und Zalando etwas bringt. Die anderen testen munter drauflos, ändern dabei aber fünf Dinge gleichzeitig und messen am Ende Kennzahlen, die mit dem Geschäftsergebnis wenig zu tun haben. Beides führt zum selben Ergebnis: Es kommt nichts dabei heraus.
Meine These: A/B-Testing zahlt nur dann auf den Umsatz ein, wenn drei Dinge stimmen. Genug Datenvolumen, die richtige Metrik und das Commitment, einen Test auch durchzuhalten, wenn er zwischendurch wehtut. In diesem Artikel zeige ich dir, welche Fehler ich in der Praxis am häufigsten sehe, wie ich selbst vorgehe und welche Tests sich für dich tatsächlich lohnen.
Zusammenfassung
- A/B-Testing zahlt nur dann auf den Umsatz ein, wenn Datenvolumen, Metrik und Commitment stimmen.
- Längst beantwortete Fragen wie Button-Farben musst du nicht testen; bekanntes Wissen wendest du an und sparst den Traffic für echte Unbekannte.
- Sauber testen heißt, eine Variable zu isolieren oder bewusst zwei Landingpage-Konzepte gegeneinander zu vergleichen.
- Ein Test läuft mindestens 30 Tage; kleine Dellen gehören dazu, die Notbremse ziehst du nur bei einem rapiden Einbruch.
- Der Erfolg eines Tests misst sich an qualifizierten Anfragen und Umsatz im CRM, nicht an der Conversion Rate allein.
Was A/B-Testing kann – und was nicht
Beim A/B-Testing schickst du deinen Traffic auf zwei Varianten einer Seite und misst, welche besser abschneidet. Der eigentliche Wert liegt darin, dass Daten deine Meinung ersetzen. Denn häufig gewinnt eben nicht die Variante, die du selbst schöner findest, sondern die, die der Besucher besser versteht.
Das funktioniert allerdings nur mit ausreichend Datenvolumen. Ein Test braucht genug Conversions auf beiden Seiten, damit das Ergebnis kein Zufall ist. Genau hier scheitern viele Projekte schon im Ansatz: Wer 20 Anfragen im Monat bekommt, kann keinen Unterschied von zehn Prozent zwischen zwei Varianten nachweisen. Das Konfidenzniveau bleibt so niedrig, dass jedes Ergebnis auch reines Rauschen sein kann. Wie viele Besucher du für eine belastbare Aussage brauchst, kannst du vorab mit einem Stichproben-Rechner wie dem von Evan Miller überschlagen.
Die Konsequenz daraus ist aber nicht „dann lassen wir das eben“. Sie lautet: Teste weniger, dafür die richtigen Dinge – und hole dir bekannte Antworten nicht per Test, sondern aus der Erfahrung.
Die häufigsten Fehler beim A/B-Testing
Kleinkram testen, der längst entschieden ist
Die Button-Farbe ist das beste Beispiel. Diese Frage ist tausendfach getestet worden, das Ergebnis ist bekannt. Wer sein knappes Traffic-Budget für solche Tests verbrennt, hat am Ende weder eine neue Erkenntnis noch mehr Umsatz. Bekanntes Wissen wendest du einfach an. Getestet wird das, was für dein Geschäft wirklich offen ist.
Zu viele Dinge auf einmal ändern
Hier eine Layout-Änderung, da zwei Buttons mehr, dort noch ein neues Bild – und am Ende weißt du nicht, welche der Änderungen den Unterschied gemacht hat. Ein sauberer Test isoliert eine Variable. Die Ausnahme: Du vergleichst bewusst zwei grundsätzlich verschiedene Typen von Landingpages miteinander. Dann testest du nicht ein Detail, sondern ein Konzept gegen ein anderes. Das ist legitim und oft sogar der sinnvollere Test, solange dir klar ist, dass du danach das Konzept kennst, das besser funktioniert – nicht die einzelne Stellschraube.
Die falsche Metrik messen
Getestet wird auf Klicks oder Conversion Rate, entschieden wird im Geschäft aber über qualifizierte Anfragen und Umsatz. Eine Variante, die mehr Formular-Absendungen bringt, aber schlechtere Anfragen, ist keine Verbesserung. Sie ist ein teurer Umweg. Der Erfolg eines Tests zeigt sich deshalb nicht im Testing-Tool, sondern im CRM.
Testen ohne Hypothese
Wild variieren ist kein Testen, sondern Raten mit Werkzeug. Eine gute Hypothese entsteht vorher aus den Daten: aus GA4, aus der Search Console, aus Session Recordings. Erst wenn du eine überprüfbare Vermutung hast, warum eine Seite nicht konvertiert, lohnt sich ein Test.
Ohne Commitment kein valider Test
Der Punkt, der in der Praxis am meisten unterschätzt wird: Ein A/B-Test kostet etwas, bevor er etwas bringt. Du schickst 50 Prozent deines Traffics auf eine Variante, von der du nicht weißt, ob sie ähnlich gut konvertiert. Im schlechtesten Fall bedeutet das über die Testlaufzeit spürbar weniger Conversions. Wer schon auf einem akzeptablen Niveau ist, gibt dieses Niveau vorübergehend her – gegen die Chance auf ein besseres.
Das muss man aushalten können. Gerade wenn der Traffic nicht besonders hoch ist, schwanken die Zwischenstände deutlich. Wer bei jeder kleinen Beule nervös eingreift, die Verteilung anpasst oder den Test abbricht, misst am Ende gar nichts. Meine Faustregel: Ein Test läuft mindestens 30 Tage. Erst danach schaust du, ob A oder B gewonnen hat. 30 Tage sind dabei das Minimum, keine Garantie für Signifikanz. Bei wenig Traffic heißt auswerten auch: ehrlich anerkennen, wenn das Ergebnis keine klare Antwort hergibt – und den Test verlängern, statt einen Zufallssieger zu küren.
Eine Ausnahme gibt es: Bricht die Conversion Rate rapide ein, ziehst du die Notbremse. Ein Test soll Erkenntnisse bringen, kein Geschäftsrisiko werden. Aber zwischen einer kleinen Delle und einem echten Einbruch liegt ein großer Unterschied – und die meisten Abbrüche, die ich sehe, passieren bei der Delle, nicht beim Einbruch.
Wie ich vorgehe: erst Diagnose, dann Test
Wenn ein Kunde mehr Conversions will, fange ich nicht mit einem Test an, sondern mit den Daten. Zuerst schaue ich mir Traffic und Conversion Rate an, dann die offensichtlichen Lecks: Wo steigen Besucher aus? Funktioniert die Seite mobil? Lädt sie schnell genug? Vieles davon muss man nicht testen, sondern schlicht beheben. Die typischen Baustellen habe ich in den Artikeln zur Landingpage-Optimierung und zu den mobilen Conversion-Killern beschrieben.
Erst wenn die offensichtlichen Probleme behoben sind, kommen Tests ins Spiel – und zwar für die Fragen, auf die es keine bekannte Antwort gibt. Welches Nutzenversprechen zieht bei dieser Zielgruppe? Welcher Landingpage-Typ passt zu diesem Angebot? Das sind echte Unbekannte, und genau dafür ist A/B-Testing das richtige Werkzeug. Reicht der Traffic für einen sauberen Split-Test nicht aus, ist ein Vorher-Nachher-Vergleich oft die ehrlichere Alternative: eine Änderung, ein fester Zeitraum, danach der Vergleich mit dem Zeitraum davor.
Gemessen wird dabei bis zum Schluss: nicht nur, welche Variante mehr Anfragen bringt, sondern welche die besseren Anfragen bringt. Diese Antwort steht nicht im Testing-Tool, sondern im CRM oder spätestens im Auftragsbuch. Genau so arbeite ich auch in der laufenden Conversion-Optimierung mit meinen Kunden.
Welche A/B-Tests wirklich auf den Umsatz einzahlen
Wenn du nur begrenzt Traffic hast, priorisiere Tests, deren Ausgang du nicht kennst und deren Ergebnis groß genug ist, um im Umsatz sichtbar zu werden:
- Das Nutzenversprechen im oberen Seitenbereich: Was verspricht die Seite in den ersten Sekunden – und wem? Hier entstehen die größten Unterschiede.
- Zwei Landingpage-Konzepte gegeneinander: Kompakt gegen ausführlich, produktzentriert gegen problemzentriert. Ein Konzepttest bewegt mehr als zehn Detailtests.
- Das Formular: Anzahl und Art der Felder verändern nicht nur die Menge der Anfragen, sondern auch deren Qualität – in beide Richtungen.
- Die Preisdarstellung: Ob und wie du Preise oder Pakete zeigst, beeinflusst direkt, wer anfragt und mit welcher Erwartung.
Nicht auf diese Liste gehören Button-Farben, Schriftgrößen und andere Fragen, die längst beantwortet sind. Das Wissen dazu ist frei verfügbar – wende es an und spare dir den Traffic für die echten Unbekannten.
Häufige Fragen zum A/B-Testing
Es gibt keine feste Untergrenze, aber eine ehrliche Daumenregel: Du brauchst pro Variante genug Conversions, damit ein Unterschied kein Zufall ist – je nach erwartetem Effekt meist mehrere hundert. Bei sehr wenig Traffic sind Vorher-Nachher-Vergleiche über längere Zeiträume oder qualitative Analysen oft der bessere Weg.
Mindestens 30 Tage, damit Wochentags- und Monatseffekte sich ausgleichen und genug Daten zusammenkommen. Ein Test, der nach einer Woche „entschieden“ wird, misst meist Zufall. Zwischenstände sind Zwischenstände – ausgewertet wird am Ende.
Die größte Unbekannte mit dem größten Umsatzhebel. In der Praxis ist das fast immer das Nutzenversprechen im oberen Seitenbereich oder der grundsätzliche Aufbau der Landingpage – nicht die Farbe eines Buttons.
Nicht zwingend. Wenn bereits ein Testing-Tool im Einsatz ist, nutzt du das. Bei bezahltem Traffic können Google Ads und Meta Ads die Besucher selbst auf zwei Landingpages verteilen. Für viele Projekte ist das der pragmatischste Weg.
Aushalten – solange es eine Delle ist und kein Einbruch. Ein Test kostet vorübergehend Conversions, das gehört dazu. Nur bei einem rapiden Einbruch der Conversion Rate brichst du ab. Ansonsten gilt: Laufzeit einhalten, dann entscheiden.
Fazit
A/B-Testing ist kein Werkzeug für Konzerne und kein Spielzeug für Button-Farben. Es ist der sauberste Weg, echte Unbekannte in deinem Marketing zu entscheiden – wenn die Voraussetzungen stimmen. Genug Datenvolumen, eine Metrik, die am Geschäftsergebnis hängt, und die Bereitschaft, einen Test über die volle Distanz laufen zu lassen.
Der größte Hebel liegt dabei oft vor dem ersten Test: bekannte Fehler beheben, Hypothesen aus Daten bilden und nur das testen, was für dein Geschäft wirklich offen ist. Wer so vorgeht, braucht keine zehn Tests im Jahr. Zwei oder drei richtige reichen.
Wenn du unsicher bist, ob deine Website überhaupt genug Daten für valide Tests liefert oder wo der größte Hebel liegt: Im Erstgespräch schauen wir uns das gemeinsam an. Und wenn A/B-Testing bei deinem Traffic (noch) nicht das richtige Werkzeug ist, sage ich dir das auch.