政策资讯协会

SEM | 如何将机器学习应用到SEM账户中

来源:jiuzhilan    发布时间:2019-12-29 20:58:08

A computer is like a bicycle for the mind. -- Steve Jobs

电脑就像有头脑的自行车。-- 史蒂夫 · 乔布斯


这句话通常被理解为:以同样的方式,自行车可以提升人力的移动效率,电脑可以提高人脑力的生产力与输出效率。


那么能否将机器学习(Machine Learning)应用到你的PPC账户中, 从而提高效率,为你的PPC活动找到新的关键词呢?




SEMer在开展PPC活动时面临的最大问题是如何提高效率。如果给你足够的时间去构建并优化一项PPC活动,你想做的远远多于你能做的。因此,问题的关键就是要明确优先顺序,高效利用你的时间。


在这篇文章中,我们将会谈论机器学习的概念,以及机器学习是如何潜移默化地提升效率的。我会使用关键词分类来作为示例,探索机器学习对关键词短语的设置会起到怎样的作用。

 

我们所说的机器(Machine Learning)学习指的是什么?


对于这一短语的定义,我认为以下说法较为权威:


机器学习是一种通过设计模型或计算方法从而进行预测的方法。这些模型能够产出令人信赖的、可重复的决定,并能够根据过往学习经验,根据数据判断未来发展方向。


这些令人信赖的、可重复的决定,正是我们在本文中想要谈论的核心价值!


在一个较高的层面上,机器学习算法的目标是输出一项预测的计算公式,并计算出相关系数,将错误出现的概率降到最低,也就是说,要达到最好的预测效果。


机器学习能解决两个核心问题 - 分类问题(classification)与回归问题(regression)。分类问题用于将事务打上一个标签,将数据与预测标签相关联,比如判断某个用户是男还是女,且最终正确结果只有一个;而回归问题通常用来预测一个值,比如产品的真实价格,所以这是一种逼近预测。



分类   回归


关键词分类是典型的分类问题。


关于关键词分类,我们的目标是将展示文案的分类应用到新关键词短语的摆放位置,并将这一过程通过机器学习自动决策。这是一项琐碎但是非常重要的实践,因为在待选关键词短语非常多的情况下,完成这一过程会非常耗时。


解决该分类问题的首要前提就是要有一些已分类的数据,即依据已有的付费搜索账户的关键词“分类”。接下来抓住“特征”,且这些特征能够被用于预测这些新的数据应该怎么分类。


“特征”的基本定义是建立这一模型的因素——预测变量。


将广告文案的数据转化为“词袋”(bag of words) -- 对计算方法非常有用。这一简单的矢量包含了在某一给定的文案中某一个单词出现的次数。在下面这个案例中,我们把关键词看作是一个简短的广告文案。




左侧:(可以将广告文案看成是由各种短语组成)

人工智能研究杂志

人工智能研究杂志覆盖了人工智能领域,并且在互联网上免费刊出。这一杂志的每一专栏都由摩根·考夫曼出版。


右侧:(数字为出现次数)

0  学习

3  杂志

2  智能

0  文本/文案

1  互联网

0  监视工具

0  脚本语言5

………

1  专栏


注释:在实践中,由于我们的“文案”(也就是关键词)很短,我们能够得到的矢量数据也由于缺少了多样性而不够有意义,但是如果跳出了这一文章的范围,就能够挖掘其更深刻的意义。


选择合适的计算方法


对于各式各样不同类型的问题,也会有各式各样不同的计算方法。下面这幅图告诉我们在实际应用中如何选择合适的模型,并向我们展示了做出一项合适的选择背后隐藏着怎样既定的逻辑。



图片来自Scikit-learn.org


本文不会详细描述如何应用这一模型,而是分享如何将上图中的方法进行应用 -- 这也是我想要说明“利用机器学习对大量编码进行预测是可以实现的“的原因。

 

以下是一些关键步骤:


①准备好建模需要的数据(将约2万个关键短语进行提前分类)。


②将数据划分为训练所需与测试所需的子集(这是非常必要的,这样我们才能够测试出我们的模型将会确切地预测出未来的数据,而不仅仅是描述历史数据)。


③创造基本的传递途径:一来可以创造出讨论得出的特征(CountVectorizer),二来可以应用已选择的方法(MultinomialNB)。


④预测“测试”设置的价值,并测算这一标签相对于“真实”价值的准确程度。



将编程看作是一种达到数学目的的途径。


结论


所以,机器学习到底有多高效呢?上述案例的结果:通过使用简单的工具测定其准确性之后,这一方法准确分类了91%的“新”关键词短语(4869个关键词短语中的4431个)。


看起来虽然测试结果相当不错,但我们将这一模型投入实践之前还是要做很多微调与测试。


测试证据表明,机器学习为企业提供了一个相关的途径,能够帮助他们提升并自动化关键词投放这一进程,通过做出令人信赖的、可重复的决定来大规模提高效率。(就像开篇所说的那样)


九枝兰SEM优化工具可以帮助企业主精确的跟踪从PV到转化的完整数据,由此分析出关键词的效果,并通过设定转化标识ROI、CPA等指标,帮助企业主找到关键词的最佳出价、匹配模式、投放地域。本着为客户的最终转化结果负责的宗旨,承诺同样的转化数量,降低CPA 5%-10%或同样的投放预算,提升转化结果 5%-10%。


注:本文内容由九枝兰团队翻译,转载请加上九枝兰微信ID:jiuzhilan或二维码。对于不署名者,九枝兰将保留追究的权利。


原作者:David Fothergill
译者:鲍子贤@九枝兰


协会简介

  政策资讯协会是由民间人士依据相关法律自发组织成立的一个公益性组织,协会提供各个地区的相关政策及政府动态。

组织机构

待定

协会宗旨

  协会致力于向各地民众提供当地政府出台的相关政策,使得民众更加关心国家政策。