2023-12-29 Google Search technical requirements 这篇文章重点讲了,对于网站收录而言,一些最低的技术标准是什么。 一是,网站不能屏蔽谷歌爬虫,这点在 robot.txt 文件中进行控制即可,至于具体的爬虫报告,可以在 GSC 后台里面查看。 二是,页面能正常访问,也就是从技术层面上的说的 HTTP 状态码是 200,当然速度得有一定的保障,这会对爬虫爬取效率有益。 三是,页面上有可索引收录的内容。这里的可所索引内容,主要指的是谷歌搜索引擎支持的文字性内容(也包括媒体素材),并且这些内容不能违反谷歌的垃圾政策。 其实,这篇文章读下来,都是很基础的链接收录细节,及各种概念性说明。 对于理解收录是什么,以及收录中涉及的各种技术标准,很有帮助。 链接:https://developers.google.com/search/docs/essentials/technical