根据泄露的 Google Content API Warehouse 文档,人们已经分享了许多见解和意见:
但是链接构建者和数字公关可以从这些文档中学到什么?
自从泄露的消息传出后, Digitaloft 的 SEO 主管花了很多时间调查文档告诉我们的有关链接的内容。
我们对文件进行了分析,试图围绕几个关键问题获得见解:

链接仍然重要吗?
某些链接是否比其他链接更有可能有助于 SEO 成功?
Google 如何定义垃圾链接?
需要明确的是,泄露的文档不包含已确认的排名因素。它包含 2,500 多个模块和 14,000 多个属性的信息。
我们不知道它们是如何加权的,哪些用于生产,哪些可能用于实验目的。
但这并不意味着我们从中获得的见解没有用处。只要我们将任何发现视为谷歌可能奖励或降级的事物,而不是它们本身的事物,我们就可以使用它们来构成我们自己的测试的基础,并就什么是排名或不是排名得出我们自己的结论。因素。
以下是我们在文档中发现的链接构建者和数字 PR 应密切关注的内容。它们基于我自己对文档的解释以及我 15 年的 SEO 经验。
Google 可能会忽略并非来自相关来源的链接
长期以来,相关性一直是数字公关中最热门的话题,而且从来都不容易衡量。毕竟,相关性的真正含义是什么?
Google 是否会忽略并非来自相关内容的链接?
泄露的文件明确表明情况确实如此。
我们看到Compressed Quality Signals模块中引用了一个清晰的anchor Mismatch Demotion:
锚点不匹配降级
虽然我们几乎没有额外的上下文,但我们可以从中推断出,当存在不匹配时,可以降级(忽略)链接。我们可以假设这意味着源页面和目标页面或源页面和目标域之间不匹配。
除了相关性之外,不匹配还可能是什么?
特别是当我们考虑到在同一模块中,我们还看到topic Embeddings Versioned Data的属性时。
主题嵌入版本化数据
主题嵌入通常用于自然语言处理 (NLP),作为理解文档中主题语义的一种方式。在文档的上下文中,这应该是网页的意思。
我们还看到Per Doc Data模块中引用了webref Entities(引用网页相关实体)属性。
Webref实体
这是什么?它是与文档关联的实体。
我们无法确定 Google 是如何衡量相关性的,但我们可以相当肯定,anchor Mismatch Demotion 涉及忽略并非来自相关来源的链接。
相关性应该是获得链接时最大的关注点,优先于几乎任何其他指标或措施。
本地相关链接(来自同一国家)可能比来自其他国家的链接更有价值
AnchorsAnchorSource模块使我们能够深入了解 Google 存储的有关链接源页面的内容,该模块表明本地相关性可能有助于提高链接的价值。
该文档中有一个名为localCountryCodes的属性,它存储页面所在的国家/地区和/或最相关的国家/地区。
长期以来,数字公关领域一直在争论来自其他国家和语言的网站的链接是否有价值。这给了我们一些关于答案的暗示。
首先也是最重要的,您应该优先考虑从与本地相关的网站获得链接。如果我们考虑一下为什么谷歌可能会更重视这些链接,这是完全有道理的。
本地相关链接(不要将其与本地出版物混淆,本地出版物通常会获得数字公关的链接和覆盖范围;这里我们谈论的是国家层面)更有可能提高品牌知名度,带来销售并获得更准确的认可。
但是,我不认为来自其他语言环境的链接是有害的。比国家级相关性匹配的权重更大的那些要多。

谷歌全站权威评分
谷歌有一个全站权威评分,尽管声称他们不计算像DA或DR这样的权威衡量标准
对于大多数阅读文档的 SEO 来说,最大的惊喜可能是 Google 有一个“网站权威”分数,尽管一再声明他们没有像Moz 的域名权威 (DA)或 Ahrefs 的域名评级 (DR) 那样的衡量标准。
2020 年,谷歌的约翰·穆勒 (John Mueller) 表示:
“需要明确的是,在搜索抓取、索引或排名方面,Google 根本不使用域名权重。”
但那年晚些时候,确实暗示了一项全站范围的措施,包括域名权威:
“我不知道我是否会称其为权威,但我们确实有一些更多在网站级别的指标,一些更多在页面级别的指标,以及其中一些网站范围级别的指标可能类似于类似事物的映射。”
很明显,在泄露的文件中,我们看到了网站权威分数。
网站权威
但需要注意的是,我们不知道这是否与 DA 或 DR 相一致。这也可能是谷歌通常以与此主题相关的方式回答问题的原因。
Moz 的 DA 和 Ahrefs 的 DR 是基于链接的质量和数量的分数。
我怀疑 Google 的 siteAuthority 是否完全基于链接,因为感觉更接近 PageRank。我更倾向于建议这是基于页面级质量得分的某种形式的计算得分,包括点击数据和其他 NavBoost 信号。
可能性是,尽管有类似的命名约定,但这与 DA 和 DR 不一致,特别是考虑到我们在CompressedQualitySignals模块中看到了这一点,而不是特定于链路的模块。
新页面中的链接可能比旧页面中的链接更有价值
一个有趣的发现是,在某些情况下,来自新页面的链接看起来比来自旧内容的链接权重更大。
我们在锚点(链接)的上下文中看到对sourceType的引用,其中链接源页面的质量是与页面的索引层相关的记录。
源类型
不过,这里值得注意的是,对新发布的内容 ( freshdocs ) 的引用是一个特例,被认为与“高质量”链接相同。
我们可以清楚地看到,链接的来源类型可以用作重要性指标,这表明这与链接的加权方式有关。
然而,我们必须考虑的是,链接可以被定义为“高质量”,而不是新页面,只是这些被认为是相同的质量。
对我来说,这支持了持续赚取链接的重要性,并解释了为什么 SEO 继续建议链接建设(无论以何种形式,这不是我们在这里讨论的)需要分配一致的资源。它需要是一项“永远在线”的活动。
Google 越信任某个网站的主页,该网站的链接可能就越有价值
我们在文档中(同样是在AnchorsAnchorSource模块中)看到一个名为homePageInfo的属性的引用,这表明 Google 可以将链接源标记为不可信、部分可信或完全可信。
主页信息
它所定义的是,该属性与源页面是网站主页且将not_homepage值分配给其他页面的实例相关。
那么,这意味着什么呢?
这表明谷歌可能在算法中使用网站主页“信任”的某种定义。如何?我们不确定。
我的解读:内部页面很可能会继承主页的可信度。
需要明确的是:我们不知道 Google 如何定义页面是完全可信、不可信还是部分可信。
但内部页面继承了主页的可信度,并且在某种程度上用于链接的加权,并且来自完全受信任的站点的链接比来自不可信站点的链接更有价值,这是有道理的。
谷歌专门标记来自高质量新闻网站的链接
有趣的是,我们发现,当链接被识别为来自“新闻、高质量”网站时,Google 会存储有关该链接的附加信息。
编码新闻锚数据
这是否意味着来自新闻网站(例如《纽约时报》、《卫报》或 BBC)的链接比来自其他类型网站的链接更有价值?
我们不确定。
但当你看到这一点时——除了这些类型的网站通常是最权威和最值得信赖的在线出版物,以及那些历史上工具栏 PageRank 为 9 或 10 的网站之外——它确实会让你思考。
但可以肯定的是,利用数字公关作为从新闻出版物中获取链接的策略无疑是非常有价值的。这一发现正好证实了这一点。
种子网站链接的价值
来自种子网站的链接或来自这些网站的链接可能是您可以获得的最有价值的链接
在我看来,种子网站和链接距离排名是一个没有得到应有的频繁讨论的话题。
不过,这并不是什么新鲜事。事实上,已故的 Bill Slawski在2010 年、2015 年和2018 年曾写过相关内容。
泄露的 Google 文档表明,原始形式的 PageRank 早已被弃用,并被 PageRank-Nearest Seeds 取代,事实上它将其定义为要使用的生产 PageRank 值。这可能是文档中最清楚的事情之一。
页面排名
如果您不熟悉种子网站,好消息是它并不是一个需要理解的非常复杂的概念。
Slawski 关于该主题的文章可能是最好的参考点:
“该专利提供了两个[种子网站]示例:谷歌目录(首次提交专利时它仍然存在)和纽约时报。我们还被告知:“种子集需要可靠、足够多样化,以涵盖广泛的公共利益领域,并与其他网站建立良好的连接。” 此外,他们应该拥有大量有用的传出链接,以方便识别其他有用且高质量的页面,充当网络上的“枢纽”。
“根据 PageRank 专利,页面的排名分数是根据它们与这些种子集的距离以及这些页面的其他功能来确定的。”
– Bill Slawski,PageRank 更新(2018 年)
谷歌可能正在使用“可信来源”来计算链接是否是垃圾链接
当查看IndexingDocjoinerAnchorSpamInfo模块时(我们可以假设该模块与垃圾链接的处理方式相关),我们看到了对“可信来源”的引用。
索引DocjoinerAnchorSpamInfo
看起来谷歌可以根据链接到页面的可信来源的数量来计算垃圾链接的概率。
我们不知道什么构成“可信来源”,但当与我们的其他发现一起整体审视时,我们可以假设这可能基于“主页”信任。
来自可信来源的链接能否有效淡化垃圾链接?
这绝对是可能的。

负面SEO攻击
Google 可能正在识别负面 SEO 攻击并通过测量链接速度忽略这些链接
一段时间以来,SEO 社区对于负面 SEO 攻击是否是一个问题存在分歧。谷歌坚信他们能够识别此类攻击,而许多 SEO 则声称他们的网站受到了此问题的负面影响。
该文档让我们深入了解 Google 如何尝试识别此类攻击,包括考虑以下属性:
垃圾链接被收录的时间范围。
垃圾邮件的平均每日发现率。
当峰值开始时。
短语锚垃圾邮件
这也可能考虑到旨在操纵 Google 排名系统的链接,但对“锚垃圾邮件尖峰”的提及表明,这是识别大量流量的机制,我们知道这是负面 SEO 攻击面临的常见问题。
在决定如何忽略峰值期间获取的链接时,可能还有其他因素在起作用,但我们至少可以开始拼凑谷歌如何试图防止此类攻击对网站产生负面影响的谜团。
基于链接的处罚或调整可能适用于指向页面的部分或全部链接
谷歌似乎有能力对链接垃圾邮件进行处罚,或者在逐个链接或所有链接的基础上忽略链接。
这可能意味着,给定一个或多个未经确认的信号,谷歌可以定义是否忽略指向某一页面的所有链接或仅忽略其中一些链接。
这是否意味着,在指向某个页面的垃圾链接过多的情况下,Google 可以选择忽略所有链接,包括那些通常被认为是高质量的链接?
我们不能确定。但如果是这种情况,则可能意味着垃圾链接并不是唯一在检测到时被忽略的链接。
这是否可以抵消所有页面链接的影响?这绝对是有可能的。
有毒链接
有毒链接确实存在,尽管谷歌声称它们不是
就在上个月,穆勒(再次)表示有毒链接是一个虚构的概念:
“有毒链接的概念是由 SEO 工具构成的,因此您需要定期向它们付费。”
不过,在文档中,我们看到了对“BadBackLinks”的引用。
不良反向链接
此处给出的信息表明,页面可能会因具有“不良”反向链接而受到惩罚。
虽然我们不知道这采取什么形式,也不知道这与 SEO 工具给出的有毒链接分数有多接近,但我们有大量证据表明,至少有一个布尔值(通常是真值或假值)衡量页面是否有指向该页面的不良链接。
我的猜测是,这与我上面提到的链接垃圾邮件降级结合使用,但我们不确定。
链接的上下文语境
链接周围的内容与锚文本一起提供上下文
SEO 长期以来一直利用链接的锚文本作为提供目标页面上下文信号的方式,并且Google 的搜索中心有关链接最佳实践的文档确认“此文本告诉人们和 Google 有关您链接到的页面的信息。”
但上周泄露的文件表明,用于理解链接上下文的不仅仅是锚文本。链接周围的内容也可能被使用。
上下文
完整左上下文
全右语境
该文档引用了context2、fullLeftContext和fullRightContext,它们是链接附近的术语。
这表明不仅仅使用链接的锚文本来确定链接的相关性。一方面,它可以简单地用作消除歧义的一种方式,但另一方面,它可能有助于加权。
这形成了普遍的共识,即相关内容中的链接的权重远高于非相关内容中的链接。
链接构建者和数字公关的主要学习内容和要点
链接仍然重要吗?
我当然会这么说。
这里有大量的证据表明链接仍然是重要的排名信号(尽管我们不知道这次泄露的排名信号是什么),但这不仅仅是一般的链接。
Google 奖励或不忽略的链接更有可能对自然可见度和排名产生积极影响。
也许文档中最大的收获是相关性非常重要。谷歌很可能会忽略并非来自相关页面的链接,这使得这成为链接构建者和数字公关等成功的优先衡量标准。
但除此之外,我们还更深入地了解了谷歌如何潜在地重视链接以及那些可以比其他人更重要的东西。
这些发现是否应该改变您进行链接建设或数字公关的方式?
这取决于你所使用的策略。
如果您仍在使用过时的策略来获得质量较低的链接,那么我会说是的。
但是,如果您的链接获取策略是基于通过高质量新闻出版物的公关策略赚取链接,那么主要的事情是确保您正在推销相关的故事,而不是假设来自高权威出版物的任何链接都会获得奖励。
对于我们许多人来说,不会有太大改变。但这具体证实了我们所依赖的策略是最合适的,也是我们看到公关赚取的链接对有机搜索成功产生如此积极影响的原因。