百度站长俱乐部4月13号到18号问题集锦
发布:ycdsk | 发布时间: 2010年4月19日1、HTTPS的网页网页被收录?
问题补充:一般来说,网站所有者不是太希望 https 的网页被收录。如果收录了,如果处理?把 https 的网页URL更换成 http 形式的? 还有一种情况,就是 ip 地址形式的URL被收录。
答:如果不希望被收录,常规的做法是设置robots文件。
https主要的出发点是安全,并没有太多考虑搜索引擎。从用户角度,很多采用了 https的站点(尤其是首页),也是需要被搜索到的,比如支付宝,贝宝等。通常情况下,搜索引擎对这类网页并不做内容解析,而只是将url进行索引。
IP 地址的url被收录,除了spider在机制上的不完善之外,通常站点设计上也有一些缺陷。一般情况下,这类问题是可以被规避的。
2、服务器开启gzip压缩,是否会影响蜘蛛抓取和收录量?
答:服务器开启gzip压缩,不会对spider抓取产生影响,我们会以压缩的方式来抓取。并且也能够节省站点的网络流量。
3、链接点击率是否计入排名算法?
问题补充:百度是否有会估算某网页的某个反向链接被点击次数(例如:从工具条、流量统计等工具得到的部分数据)?比如是否把链接的点击率计入算法之中?是否会利用这点来判断哪些是隐藏链接?或者判断外链的相关性等因素。
答:我只能说,一切有利于排序改进的因素,都有可能被搜索引擎尝试应用。
4、百度是否跟踪JavaScript链接?
问题补充:知道百度支持nofollow后又有了这个问题,百度是否跟踪JS链接并传递权重?因为有的时候某些页面得到太多权重没什么意义,比如用户登录、注册页面之类的。是否可以用简单的JS阻挡链接传递权重,比如:
<a href="javascript:void(0)" onClick="window.open('http://www.domain.com/signup.htm')">
或者:
onclick="window.location.href='http://www.domain.com/signup.htm/';"
还是需要更复杂的JS脚本?
答:javascript的解析,是很多搜索引擎正在做的事情;同理,对flash的解析。毕竟有那么多应用javascript或者flash的网站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写robots文件。
5、原创内容不能被识别怎么办?
问题补充:自己的原创内容排名常常比不过转载或抄袭的,站长能做些什么预防或改
进?我的站每天都更新原创内容,而百度每天也都更新,但是其他人的转载被收录了
以后,我的文章就搜索不到了。我坚持了近4个月的原创,但百度仍然把我扔到了500
多位!
答:这个,只能说百度的策略还不是很完善,我们也一直在改进。另外,从用户体验
角度,有些转载未必比原创差。比方一篇科技原创博文,被知名门户网站的科技频道
转载。如果这种转载保留原创者姓名和出处链接,实际上对原创者是有利的,因为起
到了更好的传播效果。只是国内的转载,很多是掐头去尾,使原创者比较受伤。
6、链接会不会过一段时间权重降低?百度针对连接上存在不存在有效期的问题,意思上是说,一个链接的权重会不会过一段时间后就会没有了,或者逐渐降低?
答:如果各位站长要揣摩百度的策略细节,我觉得不如站在用户的角度,用一种合乎常理的逻辑去做推断。比方链接时效性问题,实际是有利有弊。利在于,过去的投票,只反映被投票者在过去的价值,不见得能反映现时情况;弊在于,正常投票不大会重复投,过去投过了,现在就可能不投了,但不代表现在对被投票者的不认可。那么究竟应该怎么做呢?呵呵。我也不清楚。
7、站点启用CDN加速对百度自然排名的影响?
问题补充:站点开了CDN,对百度SEO影响有多大?我发现我们站自从开了CDN,来的流量少了好多。
答:几乎所有的大型网站都在用CDN,看看他们在搜索引擎中的表现就可以知道不会任何的负面影响了。但我们建议站长尽量选择技术成熟的CDN服务商,某些CDN服务商会导致网站在某些地区访问不稳定,可能会影响Baiduspider的抓取。
8、site查询第一条结果非首页是否表示网站被降权?
问题补充:在交流中发现很多人认为:用site语法查询之后,如果排在第一的不是该网站的首页则表示该网站被百度降权。
这种做法是否想当然?
答:site语法查询的检索结果,更多情况下类似随机的排序,除了说明这些网页已经被收录以外,不能说明任何问题。
9、301永久重定向传递的是全部还是部分权值?
问题补充:我们已经了解到,通过301永久重定向百度会把旧url积累的权值转移到新url上,那么这种方式传递是全部还是部分权值?
答:正常的301永久重定向,旧url上积累的各种投票信息会全部转移到新url上。
10、流量被蜘蛛占用,怎么限制它?
问题补充:我有个小站,流量固定,但是百度蜘蛛爬去的很频繁,造成N多流量被蜘蛛占用,怎么限制它?或者用别的什么标签语句限制?
答:正常情况下,Baiduspider对一个网站的抓取频率决定于这个网站产出新内容的速度。
一个小网站的抓取频率远高于新内容产出速度,通常会是下面这两种问题有中的一个:
1)有其他程序冒充Baiduspider抓取。建议在linux下用host ip命令反解ip来判断Baiduspider的抓取是否冒充,Baiduspider的hostname以*.baidu.com的格式命名。
2)网站程序有漏洞,产生了无穷尽的url,被Baiduspider当成了很多新内容而频繁的抓取。建议分析网站的访问日志,看看 Baiduspider所抓取的内容是否是你想让百度收录的,如果不是则建议修改网站程序或者用robots协议禁止Baiduspider抓取这部分内容。
11、百度的快照更新问题?
问题补充:想问一个站长都普遍疑惑的问题,那就是为什么有些站每天不更新反而百度的快照天天新。有些站提供原创内容每天更新反而百度快照不更新。是由于受到技术的局限还是对这个站的惩罚!如果是惩罚那么为什么那些天天不更新反而更占优势呢?
答:前面曾经说过,我们内部也对结果页上的时间戳(在url后面)很纠结,有计划整改。实际上有的搜索引擎早已经把这个时间戳去掉了,而代之以网页更新的实际时间。
这个时间戳既然给内部人员也带来了困扰,那么对站长和用户,显见也是有困扰的。所以,我的建议是不必太过关注这个时间戳。如果期望看到精确的spider行为,最直接的手段是分析网站日志。我个人觉得站长如果想做出点名堂,一些起码的技术手段还是要会的,数据分析对SEM极端重要。而不要动辄用“草根”来给自己开脱。
12、百度收录后很快又删除是怎么回事?
问题补充:最近很多人遇到这种情况,不知是什么机制。麻烦帮问一下:最近有很多站都遇到这个情况,刚发布的文章都会很快被百度收录,可过不了多长时间(8到24小时)又会被百度删除,然后再过同样多的时间百度重新收录!就这样收录-删除-收录!
答:很抱歉的说明一下,这是我们系统的一个缺陷,正在修复中。预计很快就不会有这种让人faint的事情出现了。呵呵。
附一篇:
百度官方谈site语法下的结果数问题:
我知道大多数站长,会使用不带关键词的site语法来进行收录量观察。这是一种方法,但很不准确。
site语法设定的初衷,其实是期望用户可以设定约束搜索范围,实现更加精准的搜索。这同intitle,inurl,本质上是相同的。而在这些高级语法下的结果数,和常规搜索一样,都是“估值”,而非精确值。因此,很有可能site下的“结果数”减少了,实际被索引数却可能增加了。
更加精确的方法是什么呢?
1,对来自搜索引擎的流量进行监控。这是最直接和本质的。如果流量没有大的波动,而site下的数值发生巨大波动,这只能说明site搜索结果数的不精确性。
2,对站内url进行抽样监控。有些url已经被搜索引擎收录了,那么取出一个集合,作为收录状态监控集;每天的新url尚未被收录,也可以对其进行索引状态的监控。脚本是很容易写的,这种基于抽样的评估也是很有效的。
3,由搜索引擎提供的统计工具。我们是否应该提供类似统计工具,目前还在评估中。
看到一则反馈,直接贴一下:
莆田SEO还是有点小疑问的,希望能抛砖引玉,大家探讨一下。
1、如果流量没有大的波动,但实际上新的页面是已经被收录,只是因为排名不好,所以并没有流量过来,这样子的话也不能说site的结果不准?只能说是权重不够高。因为一个新站,前期一定只是一个积累的过程,可能流量并不是那么的重要,但是收录的确还是很重要的。代表的是,你已经进入了百度的索引了。
2、url抽样监控,这样子的一个收录监控方式,我想,对于我们这些小站长或是个人站长来说,在现阶段来说,在高手眼里的小技术的脚本,可能就是一座难以逾越的大山。而互联网上,因为来说草根站长是占了绝大的一部分。
3、如果是百度提供类似统计工具,我相信站长们都是无上欢迎的。
4、其实site来说,对于站长本身,很大一部分就是让自己心里有了一个底,可以用一个脚本来替换得到更准确的值的确是可行的,而且自己是可以通过流量统计后台来实现成效的检验的。但是有一点可能被您给忽略了,site用的最多的场合不是自用,而是交换友情链接的时候用的。估计很小部分的人会交换一个友情从而去动用脚本去检测索引对方网站的具体数据,这一块,要如何更好地解决呢?
对莆田seo的问题回复一下:
1,已经强调过很多次了,百度site语法的结果数不准。而且这种不准的幅度甚至不是稳定的,可能今天比较接近真实值,明天就发生大波动了。其中的原因不便多解释,但是请不必再就这个问题反复提问了。
2,没有想像那么难。连备案这种复杂的事情都能搞定,学点脚本编程,实在不算什么。而且,作为站长,如果想深入的研究sem,我可以坦白的讲,数据分析是必须的。在网络上搜到的东鳞西爪的所谓 seo技巧,大多是别人嚼剩下的、没什么大用的、甚至有害的东西。站长要学会的首要事情之一,是对自己的网站日志做深入解剖,并能针对问题做各种实验和分析。
3,略。
4,有一点可以肯定,索引结果数肯定不会是一个网站在搜索引擎中的站点评级指标。这是很容易理解的。举个例子,site:www.126.com,就几百条而已。从投票权角度,它的权重会低于大部分索引了成千上万网页的站点?所以站长若要搞搞友情链接,更重要的是用自己的经验去做价值分析——他是想捞一票就走的,还是想正经在互联网上立立腕儿的。
百度站长俱乐部地址:http://tieba.baidu.com/club/9374916/
本文源于漂博远方 :http://www.ycdsk.com/, 原文地址:http://www.ycdsk.com/post/25.html- 相关文章:
百度站长俱乐部4月9号到12号问题集锦 (2010-4-13 13:3:18)
推荐一个学习seo 的网站 (2010-3-21 13:20:14)
SEO发展史——(网络黎明前的SEO) (2010-3-6 15:41:49)
杰夫·贾维斯说“人人需要搜索优化” (2010-2-4 21:56:46)
对SEO的七点小看法 (2010-1-4 21:9:50)
seo与普通发布信息的对比 (2009-12-3 18:13:19)
- 2.ta培训
- http://www.qyxxpd.com
- 百度真是强呀。
- 2010-8-5 8:37:47 回复该留言 删除留言
- 1.小可人
- http://www.xiaokeren.com/
- 对百度收录的问题有了进一步的了解,这个问题还挺复杂的。
- 2010-4-26 12:06:53 回复该留言 删除留言
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。





