作者最近收到反馈,称其网站无法访问。经过排查,发现问题并非运营商或主机提供商的问题,而是网站自身被自动屏蔽导致的。
作者解释,这是因为一些 Feed 阅读器不遵守最佳实践,在收到 429 错误码(表示请求过多)后仍然继续发送请求。这些请求都是无条件的,即没有使用条件请求来检查内容是否更新。服务器在收到大量无条件请求后,会自动屏蔽这些请求源,以保护自身资源。
作者举了一个例子:一个 Feed 阅读器每 20 分钟发送一次无条件请求,导致服务器每小时收到 3 次请求,每天收到 72 次请求,产生大量无用的流量。如果多个 Feed 阅读器都这样,服务器的负担就会变得很大。
为了帮助用户了解自己的 Feed 阅读器行为,作者开发了一个名为“Feed 阅读器评分”的项目,用户可以将自己的 Feed 阅读器指向一个特殊的 URL,就能获得一个报告,其中包含其阅读器的行为分析。
作者提到,目前这个项目只能分析一部分 Feed 阅读器的行为,因为有些 Feed 阅读器会自行生成请求路径,或者发送对根目录或 favicon 等文件的请求,这些请求都无法被现有的程序捕获。因此,作者需要开发更强大的工具来应对这些情况。
作者最后总结说,需求通常是在开始着手做事情之后才逐渐明朗的。这是一个“第二个系统”的开发契机,将会有更多改进和完善。