谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕

2024年 5月 30日 69.8k 0

谷歌今年 3 月 27 日不小心将其部分内部 API 文档发布到 GitHub 上,直到 5 月 7 日才被删除。这些内部文件披露了 Google 搜索引擎相关的敏感信息。

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕-1

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕-2

据市场和受众研究公司SparkToro在官网博客发布的文章,本次泄露文档中的部分内容与谷歌公开表态的信息以及2023年的美国司法部起诉谷歌的反垄断案件中的证词相矛盾。比如,谷歌曾一再否认使用点击导向的排名机制,否认子域名在排名中被单独考虑,否认收集或考虑域名的年限等等。但泄露文档证实,这些因素都是谷歌搜索引擎排名机制中的一环。

此次泄露的谷歌搜索API文档共计2500余页,共包含14014个属性特征。这些文档据称是谷歌内部“Content API Warehouse”的一部分,并在代码托管平台GitHub上不慎公开了一段时间。

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕-3

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕-4

博客作者Rand Fishkin在多位前谷歌员工的沟通中确认,泄露的文档具备谷歌内部API文档的特征。Rand Fishkin与和技术SEO(搜索引擎优化)专家Mike King进行交流,并再次验证了这些文档的真实性。

这些文档的泄露可能对搜索营销领域产生深远的影响,因为它们提供了对谷歌搜索引擎内部工作机制的前所未有的洞察,包括它如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量来影响搜索结果排名。

谷歌今天已证实被泄露的2500份内部文件是真实的,文件中详细描述了该公司收集的数据。在此之前,谷歌一直拒绝对这些材料发表评论。

谷歌发言人戴维斯-汤普森(Davis Thompson)在一封电子邮件中表示:"我们提醒大家不要根据断章取义、过时或不完整的信息对搜索做出不准确的假设。我们已经分享了有关搜索如何工作以及我们系统权衡的因素类型的大量信息,同时也在努力保护我们结果的完整性,使其免受操纵。"

详情查看:https://sparktoro.com/blog/

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论