目前百度这个搜索引擎提供普通收录提交url的方式有三种,分别为sitemap、手动提交、主动推送。其中sitemap与手动提交大家都比较熟了,今天的重点主要我们说下主动推送。

主动推送的意思就是对接百度推送的API接口进行提交,如何获取接口地址本文底部有截图,需要的可以直接到本文底部浏览。

我们先看下使用说明

1、普通收录工具可以向百度搜索主动推送资源,缩短爬虫发现网站链接的时间,不保证收录和展现效果。

2、API提交和手动提交共享配额,sitemap提交配额不与其他方式共享,具体配额以站点页面显示数据为准 。配额不可累计,当日有效。

3、若链接存在跳转关系,请直接提交跳转后链接。如网站换域名,需提交新域名资源;进行HTTPS改造页面,请提交HTTPS资源。


QQ截图20240529025510.jpg


百度搜索资源平台公众号曾发布主动推送api接口提交的URL,收录速度更快,预估排名更靠前。实际上在对接这个api时,很多人都因为不注意细节,导致效果大大折扣。下面给大家说一些对接API接口常见的细节,希望能帮助到大家。

1、请提交https资源

目前很多站点在网站上线时,都安装了SSL证书,提交时,推送的链接可能都是如:www.xxx.com、www.xxx.com/123等,虽然不带https协议的链接,也可以推送成功。但是这个搜索引擎会默认你推送的是http开头的链接,而不是https,为此会造成双路径收录的情况。当然在网站刚在百度搜索资源平台添加完成后,需要先确保https认证成功后,再进行推送哦,不然也会造成双收录的情况。

2、请不要保存就推送

很多人在对接api时,想着省事。在新增的页面如产品、新闻资讯页保存时就自动推送走了,这会造成很多垃圾页面被推送给搜索引擎。举个例子,你在更新一个产品或新闻,人习惯性的会先保存下看看前端页面,或者是有什么事打断了,这个时候需要先保存。在保存的那一瞬间已经推送出去了,这个时候页面可能还不是完整的,搜索引擎抓取收录后对这种页面的评价很低,当然也有可能直接不收录了。为此我们最好改成手动点推送,如我们确保内容无问题后,再进行推送。

3、请注意返回剩余条数

比如我本人在对接这个API时,一开始推送失败了,后面发现是一次性提交的太多了,而自己的域名配额一天仅有10条。为此这个可以考虑拖入站点后台,每次推送后显示出剩余额度,方便当日再推送其他的URL。

4、请获取推送记录

很多开发者对接API时,推送完成并没有把自己站点的推送记录保存下来,导致有时候会遇见一个这样的场景:刚推送了哪几条,自己给忘了。再次推送可能还是一开始推送的那几条,造成了配额浪费,因此获取推送过的记录还是很有必要的。

5、单独再做个指定url推送

这个主要是针对于配额较多或者是新站上线时,有些页面是单页,不是新闻产品这样的列表。可以单独批量复制url进行推送,如下图这样的。

1700738159861.jpg

当然为了方便获取整站的url、后期优化收录的情况排查。大家可以考虑给站点后台补充一个导出整站url的功能,格式excel或者csv均可。建议到处的表格是三列数据,分别为:url、网页标题、所属栏目。

6、看数据反馈

到底有没有推送成功,搜索引擎有没有收到,需要用实时来检测的。搜索资源平台里面有数据反馈,大家推送后,第二天可以去看一看,具体对不对。如果不对,就调整调整。如果还有什么问题

以上内容就是百度主动推送API对接容易忽略的细节。

百度搜索资源平台地址:https://ziyuan.baidu.com/

接口调用地址在验证百度搜索资源平台后下图位置调取;

QQ截图20240529030229.jpg