Google 证实:不小心上传到 Github 的搜寻、演算法机密文件是真的

近日,有关 Google 搜寻演算法、网站排名机制的「流量机密」被 Google 自己上传到 Github 上,这些共 2500 份的秘密文件就这样被摊在阳光下,引发讨论,Google 近日证实这些机密都是真实的,但拒绝对此发表评论。

这些文件当中详细记录了 Google 蒐集资料的细节,其中部份数据可能被应用在谷歌极为神秘、严加把关的搜寻排名演算法之中,虽然细节仍然不全。

Google 发言人近日向外媒《THE VERGE》证实,这些文件是真实的,并且提醒外界勿根据这些不完整的资讯,对 Google 搜寻排名做出臆测,「我们已公开详细资料,解释搜寻系统的运作模式以及所考量的各项因素指标,同时也在积极防范演算法遭受人为操弄。」

首先披露这批内部文件的是几位知名搜寻引擎优化(SEO)专家,包含 Rand Fishkin 和 Mike King,他们在本周稍早便已分析这批文件内容并展开初步评论。不过直到今天,Google 才对这份大规模资料外泄事件正面回应。

从这批泄漏文件可得知,除了公开承认的排名参数外,Google 可能还会蒐集像是点击纪录、Chrome 使用者资料等,同时将这类数据纳入演算法运作考量。可是仍然缺乏「细节」:这些文件未透露相关因子在演算法中的权重比重,也不知道哪些资料仅供系统训练、哪些虽蒐集却未实际应用的。

尽管如此,这份文件预计仍然会掀起一阵风暴,因为 Google 向来对其核心搜寻演算法的运作机制严加保密,而其标准也关乎所有网路业者(小型独立出版商或餐饮业者、网路商店)的利益。Google 近日也面临美国政府发起的反垄断调查,其中大部分讨论围绕在该公司有如黑盒子般神秘的搜寻机制。

责任编辑:Sisley
核稿编辑:Jocelyn

本文初稿为 INSIDE 使用 AI 进行编撰。快加入 INSIDE …