hwyzw 发表于 前天 22:22

太原SEO研究中心博客:20个热点SEO问答分享

    最近出去做培训时发现,有越来越多的人开始学习和操作 SEO 了。随之而来的是,咨询有关 seo 问题的人也越来越多。每天都会有各式各样的问题被咨询。有时候,对于同一个 seo 优化问题,要重复向网友解答十几遍。鉴于要节省对一些常见 seo 问题解答的时间,我今天特意在太原 SEO 研究中心博客上整理了 20 个热点 seo 问答并与大家分享。

    1、更换服务器是否对排名有影响?

    官方回复:原则上不会出现这种情况。如果新换的服务器质量很差,经常出现访问失败的情况;或者服务器从国内更换到国外,那么就很有可能会被和谐。

    网站改版注意事项:

    短时间内域名频繁更换,二级域与二级目录相互交换,url 规则频繁变动等情况。

    新旧网页之间没有设置 301 跳转关系,或者在极短时间内停止了 301 跳转关系;

    (3)、旧网页短时间内就不能访问;

    网站改版后,没有及时在站长平台提交,或者是过了很长一段时间之后才提交。

    正常情况下,网站改版会给其在搜索引擎中的表现带来一些损失。一旦出现上述这些问题,损失就会扩大。这是我们和站长都不愿看到的情况。所以,希望站长们:

    (1)、网站改版要慎重,确信是非常必要的情况下再进行;

    新旧网页之间必须设置 301 跳转关系,同时要让新旧内容以及跳转关系保持一段时间,一直到新网页的抓取、收录以及排序达到相对稳定且良好的状态。

    当您已做好网站改版的准备工作,就请及时登录站长平台的网站改版工具,并提交相关数据。

    2、js代码弹窗是否会影响自然排名?

    官方回复:任何关于用户体验的增减做法,都会对用户的“投票”行为产生影响。这些投票行为进而会影响搜索引擎对该网站的评价算法。所以,弹不弹窗并非关键所在,关键在于这种弹窗给用户带来的是何种影响。

    3、百度是否跟踪Java链接?

    官方回复:很多搜索引擎正在做 java 的解析这件事。因为有很多应用 java 的网站,它们其实没有意识到自身的做法给搜索引擎的收录和索引带来了麻烦。一方面,java 给搜索引擎造成了障碍;另一方面,搜索引擎正在努力攻克这一难题。所以,如果期望不被搜索引擎收录,最直接的手段还是写文件。大家可以通过太原 SEO 研究中心博客的《java 是什么?java 功能有哪些》来具体了解更多关于 java 的详细介绍。

    4、网站的gzip压缩对网站的收录和权重有没有影响?

    官方回复:gzip 不会对收录和权重产生影响。其对搜索引擎唯一的影响在于抓取速度会更快一些。当前,gzip 是被提倡的,因为速度快的网站更能获得用户和搜索引擎的好感。并且在站长平台的网站优化建议中,也提倡站长使用 gzip 压缩来提升网站速度。

    5、关于使用多域名实现资源并行下载对网站有没有影响?

    很多网站为提升网站访问速度,对静态资源文件使用了独立的无域名。这样提升了网站性能,但在网站页面上产生了大量不属于该网站域名的资源调用链接。比如:网站将域名用作其图片资源调用的域名,那么在页面上调用的图片 HTML 代码该如何判断呢?会将其作为该页面的一个出站链接来进行判断吗?如果页面上这类链接的数量过多,会对网站的 SEO 效果产生影响吗?

    这是一种正当的做法。从网页搜索的角度而言,没有直接的影响,其与调用本站的资源情况相同。

    6、TAG的SPAM页面百度如何看?

    有些网站无法控制用户的行为,这可能会导致出现 SPAM 页面的情况。数据量非常大,其中垃圾标签与分页的量达到了 700w+的水平。如果整体进行提交,会担心权重被 k 掉。

    很多网站热衷于做 TAG 。然而,这并非用户的行为,而是直接抓取网页搜索结果。即便 TAG 写得不错,但内容与之不相关,这也属于一种作弊行为。

    5. 让搜索用户可以更加快捷方便地找到和浏览自己需要的信息。百度曾对这种页面颇为青睐,因为此类页面能够在一定程度上提升百度搜索结果的质量。若想详细了解,可查看太原 SEO 研究中心博客的《巧用和 tags 让收录暴涨》一文。

    但是精明的 SEO 介入后,发现这种页面更容易获得搜索排名和流量。这使得这种页面大部分变成了恶意抢夺搜索流量的垃圾页面。他们不顾关键词的质量,也不管自己的网站是否有相关内容,随意导入关键词并生成页面。因为词自身的质量以及与网站定位的相关性存在问题,并且还有网站本身内容多少的问题,所以导致了如今很多网站都在运用这种方法来制造垃圾页面。这就是百度会对这些不相关静态页面进行打击的原因。因此,在增加网站 TAG 页时,务必要注意关键词、内容、TAG 的相关性,要真实有效地生成标签。

    7、百度对如何看待?

    官方回复:若您不希望搜索引擎追踪此网页上的链接,同时也不传递链接的权重,那么需将此页标记放置于网页的 HEAD 部分:=””=””;倘若您不想让百度追踪某一条特定链接,而百度又支持更精确的控制,那就把此标记直接写在某条链接上:href=“xx”rel=””。

    为什么我的网站中存在一些没有设置链接的网页呢?甚至还有一些需要访问权限的网页,这些网页为何也会被百度收录呢?

    百度抓取网页是借助网页间的链接来达成的。网页间的链接类型,一方面有站点内部页面的链接,另一方面还有不同网站间的互相链接。所以,有些网页即便无法通过你的网站内部链接访问到,但若在其他网站上存在指向这些页面的链接,这些页面依然会被搜索引擎收录。

    百度的访问权限与普通用户相同。所以,普通用户无权访问的内容,百度也无权访问。看起来某些访问权限限制内容被百度收录,原因主要有以下两点:

    该内容在访问时不存在权限限制,然而在进行抓取之后,其权限出现了变化。

    https://img2.baidu.com/it/u=2633985067,2393439731&fm=253&fmt=JPEG&app=138&f=JPEG?w=842&h=500

    该内容存在权限限制。然而,由于网站存在安全漏洞,使得用户能够通过某些特殊路径直接进行访问。一旦这些路径被公布到互联网上,就会有人循着这些路径抓取受限内容。若你不希望这些私密性内容被百度收录,一方面可以通过协议来进行限制。

    9、百度蜘蛛如何爬取不存在的路径?

    只抓取能够在互联网上被找到的 url 。如果大量抓取你网站上不存在的 url ,可能存在以下两个原因:其一,抓取行为可能存在误判,误将其他类似网站的 url 当作目标网站的 url 进行抓取;其二,抓取的目的可能不明确,导致抓取了大量与目标网站无关的 url 。

    (1)、你网站内有部分网页指向其他网页的url格式不正确。

    (2)、互联网上有其他网站指向了你网站内不存在的网页。

    另外,抓取到不存在的网页,服务器应该返回404错误。

    太原 SEO 研究中心博客补充:很多时候,站长在统计后台能够发现一些自己压根就未曾见过的链接。一般来说,主要原因在于程序生成出现错误,另外在进行内链或外链操作时也会出现输入错误的情况。在此提醒大家,你网站的错误页面返回的状态码是否为真正的 404 页面呢?关于这一点,我已在太原 SEO 研究中心博客的《你真的懂 404 页面设置吗》中做了详细介绍。

    10、如何判断是否冒充的抓取?

    描述:220.181.51.* 这个ip段是百度蜘蛛吗?

    在 linux 平台下,您能够运用命令进行反解 ip 操作,以此来判断是否是来自抓取。如果是以*. 或者*.baidu.jp 的格式来命名,那么非*. 或者非*.baidu.jp 的情况就属于冒充。

    host 123.125.66.66.125.123.in-addr.arpa 这个名字对应着 host 119.63.195.195.63.119.in-addr.arpa 这个名字,同时也对应着 -119-63-195-254.crawl.baidu.jp. 这个名字。

    在平台或 IBM OS/2 平台下,您能够利用命令进行反解 ip 的操作,以此来判断是否是来自抓取。打开命令处理器后,输入.xxx.xxx.xxx(IP 地址),就可以对 ip 进行解析,进而判断是否来自抓取。如果是以*.或*.baidu.jp 的格式进行命名,那么非*.或*.baidu.jp 的情况即为冒充。

    在 mac os 平台下,您能够利用 dig 命令进行反解 ip 操作。通过打开命令处理器并输入具体的 IP 地址(如.xxx.xxx.xxx),就可以对该 ip 进行解析,以此来判断是否存在抓取行为。如果是以*. 或 *.baidu.jp 的格式进行命名,那么非*. 或非*.baidu.jp 的情况就属于冒充。大家可以查看太原 SEO 研究中心博客的相关介绍,该介绍是关于解读 IIS 日志中搜索引擎蜘蛛名称代码及爬寻返回代码的,详细内容在此我就不细说了。

    11、没做竞价网站会被K吗?

    -sfkr 来过之后,当天网站的收录就变为 0 了。接着,百度蜘蛛依然正常地进行爬取,然而却不再收录。想请教一下这究竟是怎么回事呢?没有进行竞价的站点,竟然有竞价蜘蛛出现,发现没有做竞价就将站点 K 掉了?

    官方回复:百度存在商业推广与自然搜索这两种情况。它们是由两个完全独立的部门分别运营两套独立的系统。-sfkr 的抓取行为,与网页的自然搜索没有关联,并且不会给网页的自然搜索带来任何影响。

    12、百度的真正外链是什么命令,是否无法查询?

    百度目前不存在查询外链的查询命令。不过,在站长平台中是可以进行外链查询的。

    太原 SEO 研究中心博客补充:因为百度目前不存在查询外链的查询命令,所以可以用流行的命令来进行查询。虽然这样查询并不准确,但是我们只需要知晓一个对比值就可以了。对于外链的数量本身,我们并不需要非常精准地知道。我们只需依据这个数据的波动来判断网站的情况就足够了。

    搜索结果页存在很多带有图文标识的缩略图。那么,是不是在页面中增加了图片就能够被展现出来呢?

    图片的直观性比文字更明显。用户读图能在最短时间内判断出页面主旨,接着能快速进入内容详情页面。希望站长不要为了出图文而特意去做图配图,必须要依据自己的内容以及用户的阅读和使用场景,在合适的情况下进行优化。

    目前站长只需把图片放置在页面的主体内容里,接着百度会开展相应的图片识别以及场景识别工作,之后会给出协议规范。

    (2)、图片大小尽量接近121:75;

    图片需要与页面内容紧密相连。若出现作弊或恶劣低质的图片,便会有相应的处理机制。具体如下:A 是屏蔽出图;B 是降低站内 url 的排序;C 是严重的话整站将会受到影响。

    14、百度建议URL静态化吗?

    官方回复:关于 URL 的动静态,不存在歧视政策。之前之所以有提倡静态的说法,是因为许多动态 URL 带有很多参数,然而其本质内容是相同的。这给站长以及相关方面都带来了不必要的麻烦,我们在这方面也花费了不少精力。所以,总的原则是,URL 的动静态无关紧要,只需尽可能避免重复即可。但是动态的 url 不要过于变态地动态。不要设置几十个参数,那样会把蜘蛛吓到。

    若另一个参数传递为 Color=White。谷歌完全知晓这是一个关于白色鞋子的页面。对于那些想要把网站的 tag 标签改成静态的博友,可以去查看太原 SEO 研究中心博客的《如何实现(织梦 CMS)管理系统 TAG 标签静态化》这篇文章,以了解介绍的方法来进行修改。

    15、百度对原创内容是如何处理的?

    搜索引擎排序的出发点为用户的搜索体验。很多时候,尊重原创与用户体验是一致的,但也存在一些案例,即转载的体验比原创更好,此时原创的排序未必会高于转载者。另外,早在半年前,我们内部就已经专门成立了质量 topic 团队,专门从内容角度去考虑是否对用户有帮助以及体验是否良好。站长若能提供优质内容,那么取得比文库、知道等更好的成绩并非难事,前提是其内容比它们更优质且用户体验更好。

    百度目前对原创的识别尚不完善。即便百度能很好地识别原创内容,也不能说原创就一定应排在第一位。如淏荃君曾言,原创的排序未必会高于转载者,具体可查看太原 SEO 研究中心博客的《我们的网站文章真的需要原创内容吗》文章。因为如果对方在网站权威度、级别、加载速度等方面都比自己好,且在原创的基础上增加了更多附加价值,体验比自己好上百倍,那么就应考虑是否应排在自己前面。

    16、搜索引擎收录重复的内容吗?

    某人发表了一篇关于某新闻事件的原创博客,接着新浪将其转载到了新闻频道。从内容方面来看,这属于一种重复现象。然而,这种重复只是主体内容上的重复。一方面,转载带来了访问速度提升以及稳定性增强等好处;另一方面,后续的检索用户有可能通过“新闻事件新浪”来检索此新闻。这种情况可以被称作站点增益。[]

    同样,如果转载的网站很不知名,那么它就无法给站点带来名、稳定性、速度等方面的增益。甚至,转载后在页面上添加大量广告影响阅读,或者只转载内容不完整的一部分,像这样的转载,也就是所谓的采集,是纯粹重复的,与采集源相比,是没有检索价值的。

    搜索引擎会收录重复内容。随着收录重复内容量的不断增加,合格的附加价值也在随之增加。若想继续被收录,就会变得更加困难,除非能有更好的附加价值。所以,搜索引擎对于重复内容的收录是有上限的。价值越高的内容,其上限肯定越高。当重复收录量越接近这个上限,想被收录就越难。这就是之后再选择伪原创的原因,因为内容的改变加大了被收录的可能。

    https://img1.baidu.com/it/u=1295525935,807764482&fm=253&fmt=JPEG&app=138&f=JPEG?w=500&h=643

    17、标题长短对于网站权重的影响有多大?

    官方回复:就像一个页面上导出链接越多,每个链接的权重就越小。同样地,title 上关键词越多,单个关键词的权重也会越低,这是很容易理解的逻辑。然而,如果为了追求某个关键词的权重而极力压缩标题长度,那么真正符合该页面搜索需求的内容就很难被命中。所以一般的建议是,按照实际情况将页面的主旨反映在标题中就可以了。如果想要成为长青树,就不要在意某一个特定时刻的 seo 效果。只要把网站的忠实用户的人气做起来就可以了。

    百度搜索结果标题最多能显示 30 个中文字符,谷歌可显示 32 个中文字符。为避免网站标题头尾被切断,网站标题标签最好别超过 30 个中文字。不过,为提升用户体验和突出目标关键词,建议其长度在 20 到 25 个左右。因为标题过长,无关字就会增多,不利于突出目标关键词,也会降低标题与网站内容的相关性。

    18、网站排名总是容易变化,怎么样才能获得稳定的排名?

    官方回复:网站如果稳定可信,并且能够长期供应真实有效的内容,就可以获得长期稳定的排名。

    太原 SEO 研究中心博客进行了补充,提到了网站保持长期稳定排名的两大要素。

    (1)、内容质量高

    内容是网站的根本所在。网站的内容质量必须要高,不能糊弄搜索引擎,也不能糊弄用户。在网站前期获得排名时,外链占了很大一部分因素。而在有了排名之后,用户的选择与投票则占主要因素。不要以为有了网站排名就会轻松,接着就降低更新内容的质量,还用上复制采集。别太早高兴,用户考核的时间才刚刚开始。这个时候降低内容质量,无疑是在告诉用户,以后可以不用再来了。

    (2)、不断满足新的用户需求

    百度的目的在于满足用户需求以及保证市场份额。因此,若你的网站能够满足用户需求,也就能够满足搜索引擎的需求。有人提出,之前所说的高质量文章不就是满足了用户需求吗?确实,用户有对高质量文章的需求,然而,需求是会发生改变的。比如有一个 seo 网站,用户的主要需求自然是 seo 技术方面的文章。然而,倘若在某段时间内出现大量网站进行泛解析的情况,那么用户就会有关于泛解析的需求,倘若你的网站没有这类文章,用户就会前往另一个网站,甚至有可能成为那个网站的长期用户。所以,我们得持续去发现用户的需求,因为用户有需求也就意味着搜索引擎有需求,而我们就需要去满足这个需求。

    19、网站内链怎么做?是不是每篇文章都加上内链?

    官方回复:网站内链需具有相关性。在文章内容中,可以出现指向不同页面的链接,且这些链接要有意义,是用于引导用户、推荐给用户的,不能硬性加入。例如,百度百科的链接就做得非常好。

    太原 SEO 研究中心博客补充:很多网站的内链是随意地添加链接和锚文本。有的是直接自动生成内链。其目的很单纯,就是给搜索引擎指引路径。那么内链为何会存在呢?在之前,内链的作用可能更多是让搜索引擎能更好地抓取网站,提升锚文本的排名。而现在,个人认为内链的作用更多应该是引导用户,给用户提供真实有效的推荐。

    文章页面中不应出现指向首页的链接。若内页内容确实有必要,可添加首页链接,其他情况则没必要。因为用户在内容页想返回首页时,点击导航按钮即可,页面上已有引导。在内容页再加入此链接非常没有必要,这只能说明导航系统不佳。大家可以通过太原 SEO 研究中心博客的《网站内链之网站内部链接策略规划》来具体了解更多的详细方法介绍。

    或许有人会说首页需做其他关键词锚文本,因此要在内容页添加此锚文本以指向首页,从而促进首页该关键词的排名。你只是想当然地给用户推荐。例如,你在内容页加入“seo”并指向首页,用户原本是想进一步了解 seo 才点击进去的,然而却又回到了首页。这样一来,用户就得在首页重新寻找需求的东西,这无疑是在浪费时间。用户不是搜索引擎,他们不会轻易上当两次,每上当一次,你的网站体验就会差一分。当用户经常遭遇这种被骗的情况,他们就会离你而去。在一篇文章中最好不要同时出现两个指向相同页面的链接,因为这样会引发优化过度的情况。

    20、文章质量高体现在那些方面?

    官方回复:百度搜索研发部的说法,从四个方面说:

    (1)、受众

    受众群体的大小,意味着用户检索需求的大小。评价受众的大小主要有两个依据,一是信息发布源的受众,二是信息内容本身的受众。

    (2)、稀缺

    稀缺主要用于描述页面在互联网中的独特性。当提到稀缺时,人们往往会联想到重复。那么,稀缺是否等同于无重复呢?我们又该如何解读这一概念呢?可以来看一个例子:

    某人针对某新闻事件发表了一篇原创博客,接着新浪将其转载到了新闻频道。从内容方面来看,这属于一种重复现象。然而,这种重复仅仅体现在主体内容上。一方面,其转载使得访问速度和稳定性等方面得到了提升。另一方面,后续的检索用户有可能通过“新闻事件+新浪”来检索此新闻。这些都可以被称作站点增益。因此,即便主题内容没有发生任何改变,新浪的这次转载依然是有价值的,并且其稀缺度也是比较高的。

    对于主体内容重复的页面,我们需要评价其是否有站点增益和内容增益。只有当存在大量完全无增益的重复页面时,我们才会认为其稀缺度较低。这就是你的原创在别人那排名比你好的原因。

    (3)、质量

    页面的质量体现了它对需求的满足程度。判断页面质量的高低,要从最基础的需求开始,依次递进。

    首先,网站不能是死链。其次,网站要有一定的稳定性。最后,网站的访问速度要令人满意。

    其次,主体内容是否完整呢?版式和字体是否易读呢?各类广告会不会太多呢?

    最后,信息是否丰富、延伸出的次级需求是否满足。

    (4)、时效性

    页面价值具有“时效性”这一属性,通常体现在两个方面。其一,页面所描述的事物本身具有较强的公众话题性,容易被传播,这实际上反映了受众的情况。其二,页面所描述的事物仅在第一时间热度较高,随着时间的推移,热度会显著下降,这属于一种“新闻”性。如果一个页面具有上述两种属性,当搜索引擎发现这个页面的时间处于该事物的“爆发期”或者在“爆发期”之前,我们就认为这个页面具有时效性。

    太原SEO研究中心博客点评:

    Seo 优化既是一门技术,也是总结的经验。技术体现在站内代码的优化以及机构层次方面。经验体现在对搜索引擎的了解、用户体验的友好性、对数据的把控和预期等方面。Seo 优化是一门围绕用户需求价值,将网站优化技术与优化经验相结合的学科。

    做 SEO 优化时需挖掘求知问题,要注意方式。获取答案时不能只接受,知道答案后要先判断其正确性,然后进行实践。答案只是答案,通过答案总结出自己的经验和一套技术才是最终目的。
页: [1]
查看完整版本: 太原SEO研究中心博客:20个热点SEO问答分享