<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>星箭SEO博客 &#187; spider</title>
	<atom:link href="http://www.starow.net/tag/spider/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.starow.net</link>
	<description>致力于SEO、SEM、在线营销、产品的研究，关注运营和电子商务</description>
	<lastBuildDate>Tue, 19 Apr 2011 17:36:04 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.1</generator>
		<item>
		<title>Spider陷阱</title>
		<link>http://www.starow.net/seo-tech/spider-traps/</link>
		<comments>http://www.starow.net/seo-tech/spider-traps/#comments</comments>
		<pubDate>Wed, 24 Jun 2009 09:47:54 +0000</pubDate>
		<dc:creator>星箭</dc:creator>
				<category><![CDATA[SEO技术]]></category>
		<category><![CDATA[spider]]></category>

		<guid isPermaLink="false">http://www.starow.net/?p=322</guid>
		<description><![CDATA[在http://www.webdesignerdepot.com/上找到一篇关于数据的文章，有几张图觉得挺有意思，特贴出来分享： 这张图很形象的说明了搜索引擎的Spider在抓取网页时，一些不友好的元素会对其形成较坏的影响（说明：本人离开英文环境已半年，如有解释错误，勿怪）： Orphan Pages；Spider是根据链接抓取网页，没有链接的网页，自然使spider抓取困难。 Unfriendly SEO-CMS System；CMS对SEO不友好的话，会对spider形成一定的干扰，比如js、ajax、链接分布、frame结构等等。 Bad server Configuration；如阻止搜索引擎spider访问、302重定向、访问权限等等，以及服务器的稳定性，都有可能对spider造成致命的打击。 Cloaking；比如隐藏文字、没有任何内外链的网页，都会使spider出现问题。 Session Based Coding；URL根据访问者的cookie随机变换、html代码中大量的字符，这些session闯下的祸，对于一个不依赖SEO的网站来说可能没什么，但是对于一个基于SEO的网页来说可是致命的。 没有处理错误页面；如404跳转等]]></description>
			<content:encoded><![CDATA[<p>在http://www.webdesignerdepot.com/上找到一篇关于数据的文章，有几张图觉得挺有意思，特贴出来分享：<br />
<a href="http://www.starow.net/wp-content/uploads/2009/06/Spider-Traps.gif"><img src="http://www.starow.net/wp-content/uploads/2009/06/Spider-Traps.gif" alt="Spider-Traps" title="Spider-Traps" width="500" height="727" class="alignleft size-full wp-image-323" /></a></p>
<p>这张图很形象的说明了搜索引擎的Spider在抓取网页时，一些不友好的元素会对其形成较坏的影响（说明：本人离开英文环境已半年，如有解释错误，勿怪）：</p>
<ol>
<li>Orphan Pages；Spider是根据链接抓取网页，没有链接的网页，自然使spider抓取困难。</li>
<li>Unfriendly SEO-CMS System；CMS对SEO不友好的话，会对spider形成一定的干扰，比如js、ajax、链接分布、frame结构等等。</li>
<li>Bad server Configuration；如阻止搜索引擎spider访问、302重定向、访问权限等等，以及服务器的稳定性，都有可能对spider造成致命的打击。</li>
<li>Cloaking；比如隐藏文字、没有任何内外链的网页，都会使spider出现问题。</li>
<li>Session Based Coding；URL根据访问者的cookie随机变换、html代码中大量的字符，这些session闯下的祸，对于一个不依赖SEO的网站来说可能没什么，但是对于一个基于SEO的网页来说可是致命的。</li>
<li>没有处理错误页面；如404跳转等</li>
</ol>
]]></content:encoded>
			<wfw:commentRss>http://www.starow.net/seo-tech/spider-traps/feed/</wfw:commentRss>
		<slash:comments>116</slash:comments>
		</item>
	</channel>
</rss>

