A/B 测试:它是如何工作的以及你为什么需要它
已发表: 2020-07-14数据无处不在。 无论您是个人、小公司还是跨国公司,您都必须处理大量数据,包括迎合客户和提高利润所需的客户数据。
营销人员使用各种技术来增加利润。 可以理解的是,并非所有技术都有效,也不是所有技术都同样有效。
您不能根据预感或感觉创建广告系列。 您需要数字,但它们可能并不总是很清楚。 这就是企业需要 A/B 测试的原因,这是一种帮助企业选择正确路线的独特方法。
在本文中,我们将讨论 A/B 测试并重点介绍其优势,同时还会重点介绍一些最好的 A/B 测试软件。
开始吧:
什么是 A/B 测试?
A/B 测试可以定义为一种比较用于实现相同目标的两个选项的方法,以找出提供更好结果的选项。
我们几乎每天都使用 A/B 测试,据说该技术已有 100 多年的历史。 但是,由于引入了在线营销,它现在变得越来越流行。 营销人员使用 A/B 测试来比较两种营销方法,以找到一种提供最佳投资回报的方法; 然而,这并不是 A/B 测试的唯一用途。
生物学家和统计学家 Ronald Fisher 在 1920 年代进行了随机对照实验。 他弄清楚了基本的数学和原理,并将这个想法变成了一门科学。
费舍尔进行了几次农业实验,以寻找基本问题的答案,例如如果我更换肥料或使用更多肥料会发生什么。
他介绍的原理被证明是正确的,科学家们在 1950 年代初正式开始在医学领域进行临床试验。
营销人员在 1960 年代后期采用了该技术。 他们想要评估直接活动,即:个性化信件或明信片是否提供更多销售。
然而,A/B 测试与当时不同。 它在 1990 年代中期形成目前的形式。 它使用相同的概念,但已转移到虚拟环境中并实时进行。
A/B 测试的好处是什么?
现在您已经了解了 A/B 测试的定义,是时候了解 AB 测试的主要优势了。
省钱
A/B 测试允许企业通过识别提供更好回报的流程来节省资金。 没有两个营销活动会提供类似的回报,一个总会以某种方式比另一个更好。
在 A/B 测试数据科学的帮助下,企业可以找到提供更好回报的选项,并摆脱提供较低回报的过程,并将钱花在支付更多的地方。
增加利润
正如 AB 测试定义中所强调的那样,它通过提高转化率和允许企业接触更多人来帮助增加利润。 大约 60% 的企业认为它有助于提高转化率。
除此之外,A/B 测试结果可以提高跳出率并增加参与度。 这些因素对于帮助企业发展很重要。 归根结底,由于成本降低和销售额增加,企业开始赚更多的钱。
帮助识别问题
许多营销活动因小错误而失败。 最好的 AB 测试工具可以识别这些错误,从而使企业能够顺利运行。
它可以帮助识别很多问题,例如糟糕的用户体验设计。 这很重要,因为更好的设计可以将转化率提高多达 400%。
改进内容
尽管每个人都这么说,但内容仍然是规则。 然而,问题是有很多选项可供选择,包括书面内容、视觉内容等。
除非您有可靠的 A/B 测试数据分析,否则您无法始终确定哪些有效,哪些无效。
有利于商业形象
A/B 测试变得非常流行,超过 70% 的公司每月至少进行两次测试。 网站的 A/B 测试允许企业摆脱给客户留下不良印象的流程或步骤。
结果,形象得到提升,商誉增加。
使分析更容易
大约 77% 的企业在其网站(包括登录页面)上运行 A/B 测试,以识别设计、字体和其他此类问题。
这有助于通过突出显示导致买家中止购物车的原因来减少购物车放弃。 可能有多种原因,例如布局不佳、隐藏成本等。
通过 A/B 测试,企业可以找到真正的原因并进行处理。
更多参与
公司寻找忠实的追随者和买家,因此 59% 的企业对电子邮件进行 A/B 测试也就不足为奇了。 它可以帮助企业确定哪种内容更有效,以便他们可以更加专注于它。
A/B 测试如何工作?
A/B 测试听起来像是一个复杂的现象,但实际上非常简单。 第一步是决定你想测试什么以及为什么。
假设您想测试您网站上“立即购买”按钮的大小,以查看如果您更改大小,即:增大或减小大小,有多少人“购买”。 一旦明确了要测试的内容,就需要确定将如何评估性能。
例如,有多少人点击按钮可以很好地表明按钮的大小如何影响感知。
您也可以使用最终购买者的数量来做出判断,但这可能不是一个公平的选择,因为访问者也可能因其他原因放弃购买。
在下一步中,您必须将用户分为两组。 该集合必须是随机的,除非您尝试研究特定人群的使用对变化的反应。
接下来,创建两个相似但按钮大小不同的页面。 现在,查看分析并查看哪个页面获得更多点击。
点击的决定取决于几个因素,例如按钮的大小、文本的颜色、使用的设备。 为清楚起见,您可以将用户分为特定的组,即:移动用户和桌面用户。
这是因为同一个按钮对于移动用户和桌面用户可能不同。 通过这种方式,您将能够知道为特定用户提供哪个按钮。
“A/B 测试可以被认为是最基本的随机对照实验,”Kaiser Fung 说,他是《数感:如何利用大数据发挥优势》等几本书的作者。
“在最简单的形式中,有两种治疗方法,一种作为另一种的对照,”他补充道。 确保正确估计样本的大小,以便结果正确,而不是由于背景噪音。
其他一些变量会影响结果。 例如,移动用户可能不喜欢点击按钮,或者按钮在您网站的桌面版本上可能没有正确定位。
随机化可能导致一组包含比另一组更多的移动用户,这可能导致一组具有更低或更高的速率,而不管按钮的大小如何。
避免这种偏见的最好方法是将访问者按桌面和移动用户划分,然后将他们随机分配到特定的集合。 这个技巧被称为阻塞。
A/B 测试和结果:如何解释
这是一个基本的例子。 在现实世界中,您不仅会检查大小,还会检查其他因素,包括按钮的文本、位置和颜色。
众所周知,A/B 测试分析师会运行顺序测试来比较不同的元素。 他们将首先测试按钮的大小(小或大),然后移动到颜色(红色或蓝色),然后是位置(顶部或底部)等。
这有助于他们达到完美的页面版本。 这很重要,因为一次更改多个因素可能会导致难以确定导致行为发生变化的原因(即:点击次数)。
但是,我们现在拥有可以处理复杂测试的 A/B 测试工具。
“对于 A/B 测试,我们倾向于同时运行大量独立的测试,这在很大程度上是因为大脑会考虑可以测试的可能组合的数量,”Fung 说。
“使用数学,你可以巧妙地选择和运行这些治疗的某些子集; 然后你可以从数据中推断出其余的,”他建议道。
这个技巧被称为“多元”测试。 这是 A/B 测试的一种形式。 这意味着不仅要运行 A/B 测试,还要运行 A/B/C 测试等等。
A/B 测试和结果:如何解释
大多数营销人员和分析专家使用不同的拆分测试工具来执行此类测试。 您会发现有许多 AB 测试软件,但并非所有软件都适合您。
您必须知道如何进行 A/B 测试才能解释结果。 请记住,正确的工具取决于您要测试的内容。
例如,Adoric 可以处理各种任务,包括 A/B 测试。
Adoric 是一款完整的软件,可帮助您运行、管理和分析营销活动,以便您确定最佳营销活动并以正确的方式使用您的资源。
A/B 测试的主要目的是提高转化率。 您可以通过更改各种元素(例如字体大小、文本和图像的使用)来实现此目的。 您还可以使用它来测试网站设计元素和其他此类功能。
Adoric 主要专注于弹出窗口,这是一种营销工具,如果使用得当,可以提供 11% 的转化率。 我们的软件可以帮助您比较不同的弹出窗口设计和选项,以选择合适的弹出窗口设计和选项。
Adoric 被 P&G、PMI 和 Toyota 等名称使用。 相信您喜爱的品牌所信赖的名称。
您需要寻找不仅能提供数字而且能解释数字含义的软件。 否则,您将不得不聘请 A/B 测试人员或统计人员来解释结果。
有付费和免费的拆分测试软件; 但是,我们建议您购买付费版本,因为它们更详细且更易于使用。 此类软件通常会显示转化率或报告:
一种适用于看到您的典型页面的用户
另一个为看到测试页的用户
该报告通常强调几个因素。 寻找重要数字之间的差异,例如点击次数。
您可能还会看到以下信息:
- 控制:15% (+/- 2.2%)
- 变化 18% (+/- 1.9%)
这意味着大约 18% 的访问者或读者打开了带有新主题行的电子邮件。 该数字具有误差幅度 - 2.3%。
这并不意味着实际比率介于 16.1% 和 19.9% 之间。
“真正的解释是,如果您多次运行 A/B 测试,则 95% 的范围将捕获真正的转化率——换句话说,转化率有 5% 的时间落在误差范围之外(或其他任何情况)您设置的统计显着性水平),”Fung 解释说。
如果这太难理解,那么请知道您不是唯一一个。 求助于能够以简洁的方式呈现这些信息的软件,以便您轻松理解和使用。
基于这个结果,我们可以说新方法更有效,因为它导致更多人打开电子邮件。 但是,由于存在误差,我们无法保证确切有多少人会打开一封电子邮件,但根据数量会高于当前的打开率。
A/B 测试:要避免的错误
以下是一些最常见的 A/B 测试错误。 确保避免这些:
过早结束测试
据信,大约 57% 的实验者一旦看起来他们的原始假设得到证实,就会结束 A/B 测试。 被称为 p-hacking,这是一种通货膨胀偏见,被认为是“选择性报告”,可能会导致糟糕的结果。
即使您能够实时查看结果,也必须让每个测试按原样进行。
没有像样的样本
根据 VentureBeat 的这篇文章,A/B 测试需要大约 25,000 名访问者才能获得重要样本。
可悲的是,大多数营销人员使用较小的样本量,这不是总人口的真实代表,因此结果最终“不可靠”。
小复测
很少有公司选择重新测试。 大多数人测试一次并相信它。 研究证明,由于存在误报的风险,一次可能还不够。
此外,您应该每隔几个月尝试一次,因为情况可能会发生变化。 例如,您可能会获得可能喜欢不同颜色或大小的按钮的新访问者。
如果不重新测试,您将永远无法找到正确的选项。
计算太多指标
虽然复杂的测试很有用,但它们可能并不总是有效的。 一次查看过多指标可能会导致“虚假相关性”。
即使您的软件提供了太多指标,您也必须知道要关注哪些指标。 这将有助于避免随机波动,并让您专注于重要的数字。
A/B 测试:常见问题
大公司会使用 A/B 测试吗?
是的,他们这样做。 谷歌在 2000 年进行了第一次测试,以确定每页的正确结果数量。 该公司仍在积极使用 A/B 测试,并在 2011 年进行了 7,000 多次测试。
其他大牌如 Booking.com、Facebook 和亚马逊也定期进行受控实验。 此外,它还用于政治。
由于改进了 A/B 营销的决策,奥巴马竞选团队又筹集了 7500 万美元。 它还使捐赠转化率提高了约 79%。
A/B 测试持续多长时间?
它们可以持续一小时到一周,具体取决于您要测试的内容。
例如,测试订阅模式的公司应该至少试用一个月。
另一方面,电子邮件营销测试将在 24-48 小时内为您提供结果,因为超过 50% 的人仅在大约 24 小时内阅读与工作相关的电子邮件。
谁需要 A/B 测试?
每个在线营销人员或在线业务都需要 A/B 测试来确定正确的营销技巧。
它用于比较所有可能影响最终买家决定的因素。 你会看到它被用于搜索引擎优化、电子邮件营销、网络开发等。
A/B 测试:结论
简而言之,A/B 测试用于比较两个选项并找到提供更好结果的选项。 不要让任何事情迷惑您,如果您正在寻找友好的 A/B 测试软件并观察您的利润增长,请尝试 Adoric。
免费试用 Adoric