什麼是 A/B 測試? (定義 + 如何運行 A/B 測試)

已發表: 2022-08-09

如果您正在開展營銷活動、發送電子郵件或試圖從您的網站獲得潛在客戶,那麼您正在定期為您的關注者製作有價值的內容。

但是您知道這些內容的表現如何嗎?

您對所看到的結果滿意嗎? 如果您一直試圖弄清楚為什麼某些內容似乎比其他內容更成功,您可能需要考慮運行 A/B 測試。

這個有價值的工具可以消除您的內容策略中的猜測,並為您提供為您的業務做出最佳決策所需的數據。 不確定什麼是 A/B 測試或如何進行測試? 我們將通過本指南直接了解基礎知識,因此您將能夠立即運行自己的測試!

什麼是 A/B 測試?

成功營銷策略的一個關鍵組成部分是了解有效的方法並利用這些信息。 A/B 測試為您提供了這一關鍵洞察力,無需猜測什麼是最有效的。 通過 A/B 測試,您可以使用與不同組共享的兩個相似內容進行隨機實驗,並監控哪一個產生所需的結果。

這通常通過電子郵件完成,其中可能使用不同的主題行或角度來測試哪些會導致更高的打開率。 或者,您可以針對相同的報價測試兩個廣告,但副本略有不同,以查看哪個版本會帶來更高的點擊率。

產生更好結果集的內容片段被視為“獲勝”樣本,並用於未來的活動或創建其他營銷材料。 如果您發現兩個樣本具有相同或相似的結果,則可能意味著您需要使每個樣本更加不同才能正確測試它們。

當然,這並不意味著“失敗”的樣本不好。 事實上,對其性能的洞察力對於幫助您決定如何與一小部分受眾進行最佳溝通或將來避免做什麼至關重要。

為什麼要進行 A/B 測試?

如果沒有 AB 測試,您實際上是在盲目飛行。 您正在分享內容,並希望您已經為您想要吸引的觀眾製作了正確的信息。 進行 A/B 測試的主要原因是深入了解您的受眾以及他們如何響應您的內容。 這為您提供了數據,然後您可以使用這些數據來改進您正在製作的內容、共享的頻率,甚至是發布它的平台。

在最初的內容製作階段,您使用一般信息來指導您,但 A/B 測試允許您微調您的方法。 如果您對一封電子郵件進行了 A/B 測試,並在上午 10 點將其發送給一個小組,而在下午 3 點將其發送給另一個小組,您可以使用每個小組的打開率來確定發送電子郵件的最佳時間。 同樣,您可以對主題行或電子郵件預覽進行細微更改,以查看哪個可以從您的訂閱者中獲得更好的響應。

A/B 測試如何工作?

A/B 測試聽起來相當簡單,但需要正確執行才能產生可靠的結果。 您正在處理許多不受控制的變量,例如時間、軟件和人員,因此存在很大的錯誤空間。 這是適當的計劃可以提供幫助的地方。 以下是您應該遵循的一些關鍵步驟,以運行成功的 AB 測試並產生準確的結果。

第 1 步。確定要測試的變量

第一步是確切地知道你將要測試什麼。 對於您運行的每個 AB 測試,您只需要專注於一件事。 此變量可能是您的主題行或對一組電子郵件的個性化使用或用於號召性用語的副本。 雖然您可以為一個內容測試多個變量,但請務必在不同時間測試每組變量。 如果您嘗試一次測試多個變量,您將無法判斷哪個變量真正更有效。

此外,通過縮小要測試的範圍,您可以更好地決定如何創建變量。 如果您想測試個性化在提高打開率方面的有效性,您知道一組電子郵件需要包含個性化,而另一組則不需要。 同樣,如果您的重點是您的副本如何影響您的點擊率,您的重點將是創建兩組不同的號召性用語副本。

第 2 步:確定要關注的指標

您還需要知道要測量的內容。 是你的點擊率嗎? 你的開盤率? 新訂戶數量? 通過明確指標,您可以確切地知道在決定哪個版本最有效時要關注哪些數據。

在某些情況下,特別是如果您有現有數據,那麼在頭腦中製定一個實際目標甚至是一個假設都會有所幫助。 例如,您可能已經註意到某些詞會對您的打開率產生負面影響,並且您打算運行 AB 測試以查看這是否屬實。 您的假設可能是在我的主題行中使用“倦怠”一詞會使我的打開率降低 3% 。 您的目標是確定哪個主題行會導致更高的打開率。

步驟 3. 設置控制和挑戰者

通過完成前兩個步驟,您已經確定了變量和您想要的結果。 現在您將準備好決定您的“控制”和“挑戰者”是什麼。 為了您的控制,您將像往常一樣創建您的內容。

回到我們試圖通過測試主題行來提高打開率的示例,您將使用包含“倦怠”一詞的主題行的典型格式。 例如,十種行之有效的防止倦怠的創造性方法

你的挑戰者是你開始根據你的假設進行調整的地方。 在這種情況下,您的主題行可能如下所示:激發您的創造力的十種方法。

第 4 步。如果需要,將樣品均勻分配

如何拆分樣本取決於您要測試的內容類型和使用的工具。 對於電子郵件,您通常將樣本平均劃分,因此每個組都非常相似,但您也可以選擇由 AB 測試工具隨機劃分。

對於您無法控制的其他內容(例如著陸頁或廣告),您的樣本將被隨機拆分。

第 5 步:選擇您的樣本量

就像選擇如何劃分樣本一樣,您將根據您使用的工具和您正在測試的內容來確定實際樣本量。 對於電子郵件,您通常可以將控制和挑戰者發送到電子郵件列表的一小部分。 一旦達到特定目標,“獲勝者”將被發送給剩餘的聯繫人。

網頁和廣告有很大的不同,因為您沒有一定數量的人希望看到它們。 因此,您的樣本量將取決於內容被分享的時長或在廣告上花費的金額。

無論使用哪種方法,您都希望確保讓您的測試運行足夠長的時間來獲得確鑿的結果。

第 6 步:確定結果的重要性

還記得之前確定要關注的指標的步驟嗎? 這是變得特別重要的地方。 您需要確定結果的重要性才能選擇“贏家”或效果更好的內容。 這裡統計顯著性開始發揮作用。 如果你已經有一段時間沒有上統計課了,那麼是時候快速復習一下了。

統計顯著性說明您的結果有多大可能是由於錯誤或偶然性造成的。 您的統計顯著性越高,您的結果就越可靠,因為這意味著您的結果不太可能是隨機的或錯誤獲得的。

請記住,您的測試輸出將用於確定您的營銷策略、您如何預算廣告支出以及您如何與受眾溝通。 因此,您希望盡可能確定指導這些決策的數據是準確的。 通常您希望至少有 95% 的置信水平,但您可以達到 99%。

計算您的統計顯著性和置信水平可能是一個相當複雜的過程,但幸運的是,有一些方便的工具可以為您解決這個問題。

第 7 步:選擇 A/B 測試工具

市場上許多流行的數字營銷工具都可用於運行 A/B 測試。 Facebook Ads Manager、Google Optimizer、Hubspot、ActiveCampaign、Adobe Target 和 Visual Website Optimizer 等工具只是可以對電子郵件、網頁或廣告進行 A/B 測試的幾個軟件示例。

在選擇工具時,您要考慮如何使用它、要測試的內容或活動類型、可負擔性和易用性。 另一個需要關注的關鍵特性是如何收集和共享數據。 這些數字是您需要的最重要的輸出,因此您希望選擇一種工具,以易於理解的格式提供詳細報告。

步驟 8. 同時測試版本 A 和 B

您的測試需要同時與您的控制和挑戰者一起完成。 這意味著您不能在今天發送電子郵件 A 並在下週發送電子郵件 B 或將每個廣告分開幾天。 它們需要在相同的條件下進行測試,唯一的區別是改變的元素和看到內容的實際個人。

此規則的唯一例外是當測試與您的時間相關時。 如果您試圖找到合適的時間或日期來接觸您的受眾,那麼您自然會在不同的時間分享您的內容。 然而,在這種情況下,控制者和挑戰者之間的唯一區別是時間

第 9 步:將分析重點放在您的主要目標上

運行測試並開始收集結果後,您將被數據淹沒。 雖然所有這些都是相關的,但您需要優先考慮您已設定要衡量的指標。 如果您的主要目標是找出最適合您的打開率的方法,那麼這需要成為您分析的重點。 這將是決定因素或兩者中的哪一個成功。

這並不是說您應該丟棄剩餘的數據。 這可用於幫助您更好地了解您的受眾,甚至進一步改進您的內容。 要記住的重要一點是,擁有這些額外的數據很不錯——不是測試的主要重點。

第 10 步。使用 A/B 測試計算器衡量您的結果

在這個階段,您擁有所有數據,並且您正在傾注數字。 那麼,您如何實際衡量您的結果並確定它們是否足以改變您的策略呢?

Hubspot 或 Survey Monkey 的 A/B 測試計算器等工具可以消除猜測。 使用這些工具,您將輸入收到每個變量的人數以及採取行動的人數。 這將產生每個的轉化率,並明確指示哪個表現更好。

第 11 步。使用您的結果來指導您的下一步行動

現在您擁有可靠的數據,您可以自信地使用它來確定您的策略需要進行哪些更改(如果有的話)。 請注意,AB 測試並不總是一項一次性活動。 您可以針對其他挑戰者測試您的獲勝內容,以獲得更多洞察力,直到您對自己製作的內容會產生最佳結果感到滿意為止。

如果您對結果不滿意,您可以隨時使用全新的內容集重新開始。 很棒的是,即使結果不令人滿意,它們仍然為您提供了可以使用的有價值的信息。

如何解讀 A/B 測試結果

我們談了很多關於從您的測試中獲得的信息的價值,但是您如何正確解釋它? 再次,您需要專注於您的主要目標。 如果您關注的指標是開放率,那麼您將首先查看這些指標。 這是您將插入 A/B 測試工具的數字。

接下來,您將了解轉換率的差異。 您可能已經看到電子郵件 A 的轉換率為 3%,但電子郵件 B 的轉換率為 7%,置信度為 95%。 這些結果被認為具有統計顯著性,您可以預期使用電子郵件 B 作為未來電子郵件的模型應該會帶來更高的轉化率。

您還可以進一步了解其他洞察力——受眾人口統計數據,例如年齡、性別、位置、設備類型或打開電子郵件的時間。 所有這些信息讓您更廣泛地了解您的受眾是誰以及什麼可能對他們有用。

要避免的常見 A/B 測試錯誤

即使是經驗豐富的營銷人員也會在 AB 測試中犯錯誤,這會對他們的結果產生負面影響,進而影響策略。 以下是一些最常見的錯誤以及您可以採取的避免犯錯的步驟。

不允許測試運行足夠長的時間

AB 測試通常通過特定平台完成,這些平台實時提供數據。 現在,只要您有耐心,這將是一個很大的好處。 很容易看到測試的初始性能並提前結束它,因為您想快速做出決定。 問題是您不允許測試運行足夠長的時間來讓您了解全局。 如果您在幾個小時後結束測試,那將沒有足夠的時間來收集真實結果。

為避免這種情況,請在計劃階段確定您希望測試運行多長時間。 如果您決定 24 小時,那麼在這 24 小時內甚麼也不做,無論內容的表現如何。

還有一個問題是人們沒有留出足夠的時間來運行他們的測試。 請記住,不同類型的內容需要在不同的情況下進行測試。 例如,您的廣告無法在與您的電子郵件或著陸頁相同的時間段內進行測試。 此外,您需要為更多的受眾留出更多時間。 可以預期,一個小至 50 人的小組將在比 35,000 人的小組更短的時間內產生顯著的結果。

一次測試太多變量

將其稱為 AB 測試是有原因的——您正在測試元素 A 和元素 B。雖然存在多變量測試,但這是一種完全不同的測試形式,並且是在不同的條件下完成的。 當您運行 AB 測試並包含太多變量時會發生什麼結果是不可信的。 會有太多可能影響結果的錯誤或隨機機會實例。 如果您在不同時間發送電子郵件,這可能是強制打開率而不是主題行的原因。 如果您更改號召性用語按鈕副本的設計,您將無法確定是哪一個有所不同。

這就是為什麼了解您的目標並使用它來指導您的測試如何進行至關重要的原因。 如果您想關注開放率,您的變量應該與此相關。 如果你想獲得更多的網站訪問量,你應該只有一個與之相關的變量,沒有別的。 當你這樣做時,你可以更自信地依賴結果。

測試太早了

這可能聽起來有點令人困惑,但請耐心等待。 您擁有的流量越多,您的受眾就越大,您可以在測試中包含的越多,您的結果就越可靠。

這並不是說您不應該在剛開始時測試您的內容,而是您不能過於依賴所獲得的數據。 隨著人數的增長,您需要再次重新測試。 另一個需要注意的是,過早的測試可能是由一種絕望的感覺驅動的,因為它無法看到更好的數字,這可能會扭曲你的測試。 這會讓您在運行測試時變得不耐煩,並且您可能會陷入過早結束測試的陷阱,從而留下不確定或失敗的數據。

避免犯這個錯誤的最好方法就是耐心等待。 等到您的原始內容有機會執行,然後再決定是否有改進的餘地。 給自己一些時間來開始擴大您的受眾並吸引您的理想目標,以便數據實際上與您相關。 很有可能,如果有足夠的時間,您就不需要進行測試了——您的廣告系列將開始加快速度,如果沒有,那麼您可以做出決定。

準備好使用 AB 測試來改進您的營銷策略了嗎?

毫無疑問,A/B 測試是任何成功營銷策略的重要組成部分,但需要很好地執行。 這意味著確定您的目標、主要指標、您需要使用的工具以及確定您的變量。

如果您已經使用上述步驟正確地計劃了您的測試,那麼收集和解釋結果應該很簡單。 將數據輸入您的計算器並確定差異是否足夠顯著以更改您的內容。

如果是這樣,請花時間真正查看數據並解釋您的結果。 然後利用您的發現來推動您的營銷策略。

在不知不覺中,您和您的企業將受益於 AB 測試。