一、数据提交
1、普通收录
(1)普通收录工具可以向百度搜索主动推送资源,缩短爬虫发现网站链接的时间。
(2)普通收录的三种提交方式:
△资源提交—普通收录—API提交方式
△资源提交—普通收录—手动提交方式
△资源提交—普通收录—sitemap文件提交
(3)注意事项:
· 如链接存在跳转关系,直接提交跳转后的链接;
· 如网站更换了域名,需要提交新的域名资源。
(4)最新变化:
· 为了提升站点提交的优质资源的处理效率,搜索资源平台上线了配额机制,对平台工具的sitemap文件提交配额进行限制,包括“资源提交-普通收录-sitemap提交”和“链接提交-死链提交”。平台将基于站点资源质量和搜索用户喜欢程度综合评估计算站点提交配额,站点不同,提交配额也可能不同。
· 索引型sitemap文件不予处理,且若存在索引型sitemap,将不允许提交新文件,需删除索引型sitemap后再尝试提交数据。
(5)数据反馈:显示当天通过不同提交方式提交成功的去重后的链接数量。
△资源提交—普通收录—数据反馈页面
2、快速收录
(1)快速收录工具可以向百度搜索主动推送资源,缩短爬虫发现网站链接的时间,对于高实效性内容推荐使用快速收录工具,实时向搜索推送资源。一般情况下48小时内即可收录。
(2)快速收录的提交方式:
△资源提交—快速收录—手动提交方式
△资源提交—快速收录—API提交方式
(3)注意事项:
· 快速收录仅限于提交移动端页面及移动端自适应页面。
· 提交的资源应符合移动体验标准,判断站点是否符合移动体验标准,请参考《百度搜索优质内容指南》及《百度APP移动搜索落地页体验白皮书5.0》。
· 如果网站已通过HTTPS认证工具验证为HTTPS网站,请确保所提交链接的协议头为HTTPS。
(4)数据反馈
· 开发者们可以在”快速收录—数据反馈“页面查看当天累计提交的去重后的已收录量和未收录量;
· 开发者们可以查看“最近7天”和“最近30天”的数据。
△资源提交—快速收录—数据反馈
3、死链提交
(1)死链提交工具是网站向百度提交死链的数据推送工具,被推送死链将被百度搜索屏蔽。网站存在大量死链,将影响网站的站点评级,建议存在大量死链内容的网站,使用本工具。
△资源提交—死链提交
(2)配额:见页面提示,站点不同,提交配额也可能不同。
(3)注意事项:
· 请勿提交索引型sitemap,索引型不予处理,且若存在索引型sitemap,将不允许提交新文件;请删除索引型sitemap后再尝试提交数据;
· · 文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;
· 如果验证了网站的主域,那么sitemap文件中可包含该网站主域下的所有网址;您每次最多可提交20条文件地址;
· 仅识别404数据,请勿提交非死链内容;如误使用本工具,且站点内容不为死链,则提交不会生效。
· 死链抓取后生效时间为1周,如超时未生效,请在反馈中心提交反馈。
(4)近期变化:
· 为了提升站点提交的优质资源的处理效率,搜索资源平台上线了配额机制,对平台工具的sitemap文件提交配额进行限制,包括“资源提交-普通收录-sitemap提交”和“链接提交-死链提交”。平台将基于站点资源质量和搜索用户喜欢程度综合评估计算站点提交配额,站点不同,提交配额也可能不同。
· 请勿提交索引型sitemap,索引型不予处理,且若存在索引型sitemap,将不允许提交新文件;请删除索引型sitemap后再尝试提交数据
· 已处理完毕的死链文件可以在”死链提交—数据反馈“中删除,释放文件余额。
· 尚未处理完毕的历史死链文件可以通过重新提交加快处理速度。
(5)数据反馈:
开发者们可以在”死链提交—数据反馈”板块查看死链文件状态和死链处理状;开发者们可以点击异常状态,如“抓取失败”、“索引型文件不予处理”等,查看文件错误详情和修改建议。
△资源提交—死链提交—数据反馈—死链文件状态
△资源提交—死链提交—数据反馈—死链处理状态
△开发者们可以查看文件错误详情和修改建议。
4、移动适配
(1)移动适配:百度移动搜索提供“移动适配”服务,如果开发者们同时拥有PC站和手机站,且二者能够在内容上对应,即主体内容完全相同,您可以通过移动适配工具进行对应关系提交。
(2)作用:
提升搜索用户在百度移动搜索的检索体验,且有利于站点的移动页面在搜索结果中获得更多展现与点击。
(3)注意事项:
· 自适应站点不需使用移动适配工具;
· 移动适配工具不能解决移动端排序问题,搜索排序异常请在反馈中心提交;
· 移动适配工具校验时间为14天,如数据提交14天后仍未校验完成,请尽快在反馈中心提交问题;
(4)适配方式:
△资源提交—移动适配—提交单条规则
△资源提交—移动适配—提交多条规则
(5)数据反馈
开发者们在移动适配工具中的数据反馈板块,查看点击量和适配索引量情况。
△资源提交—移动适配—数据反馈—点击量
△资源提交—移动适配—数据反馈—适配索引量
(6)状态反馈
提交适配规则之后,开发者们可以在”移动适配“工具页面中查看处理状态;一共会出现8种情况。
· 校验中
· 校验失败:原因可能是页面不相似/移动页不友好/含有死链链接/PC页面或移动页面没有收录/数据校验失败等
· 校验成功
· 校验部分成功
· 未达到校验标准:原因可能是页面未收录或者展现过少
· 适配成功
· 适配部分成功
· 内容重复
△开发者们可以在”移动适配“工具页面中查看处理状态
(7)如何提升/优化移动适配效果:
1)保持:已有的对应关系保持适配,确保已经提交的对应关系准确。
2)提升:不断建设新的对应关系,增加适配覆盖的范围。
3)自查:常见错误小结如下↓,开发者们可以及时自查修改。
· 移动页不可用,如死链;
· robots封禁,开发者们需要解除对Baiduspider的robots封禁;
· 移动页使用了ajax等异步加载的方法加载内容主体;
· 格式错误,如正则格式错误、文件格式错误等;
5)PC站和移动站的对应关系错误。
二、数据统计
1、索引量
(1)索引量: 索引量指可以被搜索用户搜索到的网站数据库。
(2)索引量工具
· 索引量工具可以支持查看总索引量,同时支持站点自定义想要关注的目录,查看某一目录规则下的索引量。
· 更新频率:百度索引数据最快每天更新一次,最迟一周更新一次,不同站点的更新日期可能不同。
· 开发者们可以在”索引量“工具中查看“最近30天”与自定义日期的索引情况。
· 您可以查询到近一年中每天的索引量数据,一年前的索引量数据为每月索引量数据。
△资源统计—索引量
(3)注意事项
· 索引量不等于流量,索引量会有定期数据波动,属于正常现象,索引量上下浮动10%,甚至更多都可能属于正常。
2、流量与关键词
(1)热门关键词:用户在百度搜索查询时,网站获得点击量较多的关键词。
(1)流量与关键词工具:
· 提供站点的热门关键词在百度搜索结果中的展现及点击量数据,同时提供关键词定制功能,方便网站根据需求设置需要重点关注的关键词,通过对关键词表现情况的监控,帮助网站更好进行优化。
· 区分PC搜索和移动搜索的数据。
· 可查看“最近7天”、“最近30天”和自定义日期的数据;设置范围如果超过最近30天,则无法查询详情数据。
△资源统计—流量与关键词—热点趋势数据
△资源统计—流量与关键词—热门关键词数据
3、抓取频次
(1)抓取频次:搜索引擎在单位时间内(天级)对网站服务器抓取的总次数。
(2)注意事项
Baiduspider会根据网站服务器压力自动进行抓取频次调整;
抓取频次过大:很有可能造成服务器不稳定,影响网站正常访问;
抓取频次过小:影响站点收录。
(3)当前抓取频次过大怎么办?
· 如果抓取了过多的无价值页面,可以更新网站robots文件;
· 合理调节抓取频次上限值。
(4)当前抓取频次过小怎么办?
· 取消或调整抓取频次上限值;
· 使用抓取异常工具辅助诊断;
· 通过资源提交工具主动提交资源。
△资源统计—抓取频次—抓取频次上限调整
4、抓取诊断
(1)抓取诊断工具,可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容和预期是否一致。
△资源统计—抓取诊断
(2)注意事项:
· 区分pc端和移动端的数据;
· 每周可使用70次抓取诊断工具;
· 抓取结果只展现百度蜘蛛可见的前200KB内容;
· 可能受到网络影响造成抓取失败,如抓取失败可重新检测,自查网站能否正常访问。
△开发者可以查看抓取异常详情。
5、抓取异常
(1)抓取异常:百度spider无法正常抓取的情况。
(2)抓取异常的原因有哪些
1)网站异常
△网站异常包括DNS异常、连接超时、抓取超时和链接错误四种情况。
· DNS异常
当Baiduspider无法解析网站的IP时,会出现DNS异常。可能是网站IP地址错误,或者域名服务商把Baiduspider封禁。请开发者们先自查网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。
· 连接超时
抓取请求连接超时,可能是因为服务器过载或者网络不稳定。
· 抓取超时
抓取请求连接建立后,下载页面速度过慢,导致超时,还可能是因为服务器过载,带宽不足。
· 连接错误
无法连接或者连接建立后对方服务器拒绝。
2)链接异常
△链接异常包括服务器错误、访问被拒绝、找不到页面和其他错误四种情况。
· 服务器错误:响应代码——5XX
· 访问被拒绝:响应代码——403
· 找不到页面:响应代码——404 (百度会自动进行死链屏蔽)
· 其他错误:响应代码——4XX(不包括403和404)
6、robots
(1)robots.txt可以告诉百度网站的哪些页面可以被抓取,哪些页面不可以被抓取。
(2)robots工具
开发者们可以通过Robots工具来创建、校验、更新您的robots.txt文件,或查看您网站robots.txt文件在百度生效的情况。
(3)注意事项:
· 如希望收录网站上所有内容,请勿建立robots.txt文件;
· Robots工具目前支持48k的文件内容检测,请保证您的robots.txt文件不要过大,目录最长不超过250个字符。
· 放置在网站根目录下,比如http://www.abc.com/robots.txt
△数据统计—robots工具
三、搜索展现
1、站点Logo
(1)站点Logo:在百度搜索网站名称时,出现在网站名称下方的Logo标识。
有利于增强站点曝光,更好地吸引搜索用户。
△站点logo
(2)注意事项:
· PC端与移动端Logo尺寸要求不同,PC端为121*75,移动端为200*133(均为新尺寸要求,如历史提交数据不符合要求,请及时更新,避免展现异常);
· Logo图片大小<200k;
· 格式可选jpg/jpeg/png/gif;
· 准入条件:优质站点;站点与智能小程序关联,并至少正确提交一条适配规则,则可优先获得Logo权限。
· 可在站点属性 - 站点类型中更改站点为PC、移动、自适应站点
△开发者可在站点属性 - 站点类型中更改站点为PC、移动、自适应站点
(5)设置路径:搜索资源平台-搜索服务-搜索展现-站点属性
△搜索展现—站点属性(截图为PC站设置界面)
△搜索展现—站点属性—设置站点logo(截图为PC站设置界面)
(4)站点Logo审核失败原因:
· 广告嫌疑;
· 诱导用户点击嫌疑,如语言诱导/大面积深底色等;
· 与网站内容无关/文字提取不当;
· 非网站Logo/图片包含领域广泛;
· 不够美观,如设计粗糙/清晰度差/有多余边框等。
2、品牌展现
(1)品牌展现:在搜索结果页中,标题及摘要下方展现的,内容来源站点的头像与名称。
(2)作用:相比只展示一串网站地址的方式,品牌展现更直观地体现了内容来源,加强了搜索用户对内容来源的信任度、对站点品牌的记忆度。
△搜索结果页面的品牌展现效果
(3)注意事项:
· 品牌展现中的头像尺寸为200*200,不区分PC/移动站;
· 提交后3个工作日内反馈审核结果;
· 设置成功后可修改/预览/下线,30天内只可修改一次;
· 准入条件:优质站点;站点与智能小程序关联,正确提交适配规则,并将H5资源替换为小程序资源,可优先获得品牌展现权限。(如无权限,或只展现名称,均可通过小程序优先获得该权限)
(4)路径:搜索资源平台-搜索服务-搜索展现-站点属性
(5)品牌展现-名称的注意事项:
品牌展现中的名称与头像应该互相呼应,若站点已关联小程序,需与小程序接近一致。
(6)品牌展现-头像的注意事项:
· 图片应该清晰美观,避免多余框线;
· 图片中不可出现过多文字,导致辨认困难的情况;
· 不可出现电话号码、微信号、口号标语、修饰词句等信息;
· 不可包含百度官网标、信誉标、百度系其他产品(如地图/网盘)标志;
· 避免大面积深底色(以下情况除外:网站为知名企业/品专已通过/有商标证明)。
△搜索展现—站点属性—设置品牌名称和头像
3、站点子链
(1)站点子链:百度为部分优质站点开放站点子链试用权限。
(2)子链选择:
若主链为主站,推荐添加重要子站点;
若主链为子站点,推荐添加重要频道页。
(3)注意事项:
展现样式:只支持2条/4条/6条子链;
准入条件:优质站点;站点可关联智能小程序,获得小程序单卡子链权益。
△2条子链展现形式
△ 6条子链展现形式
(4)设置要求
子链标题不超过10个字;摘要不超过34个字。
△ 搜索展现—站点子链提交审核页面
(5)实际展现
· 百度会将您提交的数据仔细评估并作为重要的参考依据,但不保证一定会采纳;
· 对于已生效的数据,百度会根据搜索用户当前需求进行展现,不保证会全部展现;
· 您可以根据重要程度对子链进行排序,百度会根据您设定的排序综合评估确定最终的展现顺序已提交的子链可修改标题/摘要;
· 已提交的子链可修改标题/摘要。
△站点子链提交审核后可查看提交状态
四、网站优化与维护
1、网站改版
(1)网站改版:当一个站点的域名或者目录发生变化时,如果想让百度快速收录变化之后的新链接、用以替换之前的旧链接,那么您就需要使用百度搜索资源平台的网站改版工具来提交您的改版关系,加速百度对已收录链接的新旧替换。
(2)改版方式:
△网站优化与维护—网站改版—站点改版
△网站优化与维护—网站改版—规则改版
△网站优化与维护—网站改版—新旧URL对
(3)注意事项
· 推荐使用站点改版和规则改版;
· 改版规则中的新旧链接一定要使用301的方式进行跳转;
· 您提交的三类改版形式,不能有交叉或者包含关系,即不能有一条链接同时属于多个改版形式;
· 仅用于网站URL改变,不适用于网站内容改版;
· 改版跳转关系请至少保持三个月,直到新站流量完全稳定;
· 改版生效时间:改版规则校验时间为0.5—2小时;改版生效时间为12—48小时;整体来看,从提交改版规则到线上生效,最短12.5小时,最长50小时;提交改版规则72小时后仍提示“改版中”,可通过反馈中心提交反馈。
(4)改版状态反馈:
提交网站改版之后,开发者们可以在”网站改版“工具页面中查看处理状态;一共会出现5种情况:
· 规则校验中
· 校验失败:原因可能是提交重复规则/未设置301跳转/旧链抓取失败/新链抓取失败/跳转关系与规则不符/url与所提交站点不匹配/正则格式不正确/url对文件格式不正确等。
· 无需改版(未收录的旧链接无法处理)
· 改版进行中
· 改版完成
六、总结:有备无患,有迹可循
开发者们在百度搜索资源平台使用搜索服务时,可以通过以下四个方式了解工具使用方法,解决相关疑问。