小红书禁止所有搜索引擎抓取其内容所以只能通过站内手动搜索了-学习笔记-橙子系统站

百度搜索目前已经收录小红书网站上 7 亿 9807 万个网页，谷歌则只索引了小红书网站的首页，为什么呢？因为小红书早已禁止所有搜索引擎抓取小红书的内容。

蓝点网接到网友提醒称小红书的 robots.txt 文件已经明确禁止所有搜索引擎抓取内容，不过蓝点网检索后发现实际上小红书是在 2023 年 4 月 2 日修改 robots.txt 文件的，转眼间这都修改了 1 年。

目前并不清楚小红书为什么禁止搜索引擎抓取内容，从 SEO 角度来说，允许搜索引擎抓取有助于给小红书带来更多流量，毕竟现在百度都索引了 7 亿多个网页。

而且小红书是去年 4 月修改的，所以估计也不是因为防止被抓取内容训练 AI 吧？但小红书目前的内容库拿去训练 AI 确实很有价值，毕竟巨量文字和图片内容。

不过 robots.txt 文件只是君子协定，属于防君子不妨小人的那种，除了会导致用户无法从搜索引擎直接查询小红书内容外，其实帮助也不大，毕竟其他非搜索引擎的爬虫也会继续抓取内容，小红书肯定也做了反爬措施了。

现在国内的网站禁止搜索引擎抓取已经是个很常见的事情，或者专门预留一些层级目录供搜索引擎抓取想要获得一些流量，更有甚者甚至别说搜索引擎了，就连正常的用户访问也会被拦截，必须注册账号登录后才能继续访问，这显然不是一个好事情。

附小红书 2023 年 4 月 2 日的 robots.txt 信息：

User-agent:GooglebotAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:BaiduspiderAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:bingbotDisallow:/User-agent:Sogou web spiderAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:Sogou wap spiderAllow:/discovery/item/Allow:/explore/Allow:/sitemap.xmlDisallow:/user/profile/*/User-agent:YisouSpiderDisallow:/User-agent:BaiduSpider-adsAllow:/activity/sem/kratosAllow:/activity/sem/walleUser-agent:*Disallow:/

下面是小红书最新的 robots.txt 信息：

User-agent:GooglebotDisallow:/User-agent:BaiduspiderDisallow:/User-agent:bingbotDisallow:/User-agent:Sogou web spiderDisallow:/User-agent:Sogou wap spiderDisallow:/User-agent:YisouSpiderDisallow:/User-agent:BaiduSpider-adsDisallow:/User-agent:*Disallow:/

(adsbygoogle = window.adsbygoogle || []).push({});
本文来源蓝点网，由本站收集整理，其版权均为原网址所有，文章内容系作者个人观点，不代表本站对观点赞同或支持。如需转载，请注明文章来源。

版权声明 1 本网站名称：橙子系统
2 本站永久网址：https://www.czgho.com
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 EMAIL:mail@czgho.com进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们将尽力更新找回，如无法找回请谅解。

THE END