<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>星箭SEO博客 &#187; 网站地图</title>
	<atom:link href="http://www.starow.net/tag/%e7%bd%91%e7%ab%99%e5%9c%b0%e5%9b%be/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.starow.net</link>
	<description>致力于SEO、SEM、在线营销、产品的研究，关注运营和电子商务</description>
	<lastBuildDate>Tue, 19 Apr 2011 17:36:04 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.1</generator>
		<item>
		<title>百度sitemap，是福是祸？</title>
		<link>http://www.starow.net/seo-by-talk/baidu-sitemap/</link>
		<comments>http://www.starow.net/seo-by-talk/baidu-sitemap/#comments</comments>
		<pubDate>Wed, 21 Nov 2007 15:13:04 +0000</pubDate>
		<dc:creator>星箭</dc:creator>
				<category><![CDATA[SEO杂谈]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[百度sitemap]]></category>
		<category><![CDATA[网站地图]]></category>
		<category><![CDATA[sitemap]]></category>

		<guid isPermaLink="false">http://www.starow.net/seo-by-talk/baidu-sitemap.html</guid>
		<description><![CDATA[准确的说，叫它baidu sitemap不太准确，而且会有朋友问，百度有类似于google的xml格式sitemap吗？答案是有，但是它又不完全等同于sitemap。根据百度官方的描述，我们应该管它叫做《<a href="http://news.baidu.com/newsop.html">互联网新闻开放协议</a>》。但是我还是喜欢叫它baidu sitemap，我觉得这个名称对站长来说更亲切一些：）]]></description>
			<content:encoded><![CDATA[<p>准确的说，叫它baidu sitemap不太准确，而且会有朋友问，百度有类似于google的xml格式sitemap吗？答案是有，但是它又不完全等同于sitemap。根据百度官方的描述，我们应该管它叫做《<a href="http://news.baidu.com/newsop.html">互联网新闻开放协议</a>》。但是我还是喜欢叫它baidu sitemap，我觉得这个名称对站长来说更亲切一些：）</p>
<p>其实这个开放协议在06年4月初（或者更早几天）的时候，百度就已经公布了，我们看一下百度官方对这个开放协议所作的描述：</p>
<p><code>《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准，网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页（独立于原有的新闻发布形式）供搜索引擎索引，将网站发布的新闻信息主动、及时地告知百度搜索引擎。</code></p>
<p>从官方的描述来看，这个开放协议针对的是新闻，似乎对我们没有什么价值，那么我们再假设一下，假如我们的网站通过互联网开放协议的审查，这样百度就会来抓取这个xml文档里的信息，那么即使我们的网站除了新闻之外还有很多别的内容，百度也会连这些内容一并抓取了。这样对百度及时更新索引网站最新内容是有很大的帮助的。</p>
<p>但是我发现众多的<a href="http://www.starow.net/">SEO</a>们对百度的这个xml开放协议关注的人不多，甚至可以说几乎没有。可能还有不少SEO并不知道这个东西的存在，我就经常看见有朋友谈<a href="http://www.google.com/support/webmasters/bin/topic.py?topic=8476">google sitemap</a>，或者咨询相关问题。就是没有人讨论或者问这个“<a href="http://news.baidu.com/newsop.html">baidu sitemap</a>”，可能的原因我猜是知者甚少。</p>
<p>当然，这个“baidu sitemap”对网站的要求更严格一些，如果你的网站是垃圾站，那么我建议不要去试了。因为这个xml的提交是需要百度进行审核的，所以还会有可能被K掉。这样对垃圾站来说似乎就得不偿失了。当然，如果你的网站足够好，并非垃圾站，那么可以去试一试。</p>
<p>不过，我在研究baidu sitemap的时候，发现一个比较严重的问题。其实这样的问题如果在国外是可以忽略的，但是在国内绝对有问题。众所周知，在中国，网站相互采集抄袭的情况空前严重，很多网站的内容都是抄来抄去。为什么baidu sitemap的使用会产生严重问题呢？我们来看一下baidu sitemap的xml格式代码。</p>
<p><span class="hl-surround">XML标签说明： 其中带星号标记的为必选项，未带星号标记为可选项。 </li>
<li>*&lt; document&gt;——标记整个XML文件内容的开始和结束。</li>
<li>*&lt; website&gt;——站点地址。</li>
<li>*&lt; webmaster&gt;——负责人员的Email。当有必要时，我们通过这个地址与您联系。</li>
<li>*&lt; updateperi&gt;——更新周期，以分钟为单位。搜索引擎将遵照此周期访问该页面，使页面上的新闻更及时地出现在百度新闻中。</li>
<li>*&lt; item&gt;——标记每篇新闻信息的开始和结束。标记内为单篇新闻信息，不包括新闻专题。</li>
<li>*&lt; title&gt;——新闻标题。</li>
<li>*&lt; link&gt;——新闻url地址，与单篇新闻一一对应；若分页的新闻存在多个URL，相当于多篇新闻。</li>
<li>&lt; description&gt;——新闻内容简介。</li>
<li>*&lt; text&gt;——完整的新闻正文（仅包含正文文字，不包含HTML语言等其它字符）。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。</li>
<li>*&lt; image&gt;——新闻正文内相关图片，采用绝对地址。若该篇新闻无相关图片，可以为空；若含有多张图片，请重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。</li>
<li>&lt; headlineimg&gt;——为有可能成为头条的新闻制作的头条图，采用绝对地址。</li>
<li>&lt; keywords&gt;——反映新闻主题内容的一个或多个关键词，关键词之间以空格隔开。此项仅作为参考，检索结果不完全依赖于此标签中的内容。</li>
<li>&lt; category&gt;——新闻分类， 可以遵循网站自身的分类体系，最好采用一级分类。</li>
<li>&lt; author&gt;——新闻作者，可以为机构或个人 。</li>
<li>&lt; source&gt;——新闻来源，即原创媒体或其它机构 。</li>
<li>*&lt; pubdate&gt;——新闻发布时间，与该篇新闻HTML页面上的发布时间保持一致。请精确到分钟；若您网站的发布时间未记录小时分钟，提供年月日即可。</span><br />
再放一张百度官方的截图：<br />
<img src="http://news.baidu.com/img/example.gif" alt="baidu sitemap" /></p>
<p>发现没有？这个xml文件里最大的一个问题就是我们需要把文章的全文放置在“<span class="hl-surround">&lt;text&gt;</span>”中。有人会问，放全文有什么问题？结合这个xml格式，难道你没发现网页的全部关键内容都按照标准的格式展现出来了。产生的后果当然是：我要采集你的网站就跟玩似的，简直太容易了。</p>
<p>所以这篇文章我之所以取这么一个恐怖的名字是有原因的。是福是祸？福：当然是你的网站会得到百度的眷顾，不仅可能被列为新闻源，还会及时索引网站的最新网页。祸：当然就是一旦这个xml文件被发现，就面临被人轻松采集的危险。当然，垃圾站还有可能被百度K掉哦～～</p>
<p>是否应该使用baidu sitemap，相信大家心里应该有数，每个网站都有自己的算盘。</p>
<p>几个支持baidu sitemap功能的CMS，仅供参考：<br />
<a href="http://www.powereasy.net/">动易CMS2006 SP4及以上</a><br />
<a href="http://www.supesite.com">Supesite</a></p>
<p>作者: <a href="http://www.starow.net/">星箭</a><br />
原载: <a href="http://www.starow.net/">星箭SEO博客</a><br />
版权所有，转载时必须以链接形式注明作者和原始出处并保留本声明。</p>
<p></text></p>
]]></content:encoded>
			<wfw:commentRss>http://www.starow.net/seo-by-talk/baidu-sitemap/feed/</wfw:commentRss>
		<slash:comments>17</slash:comments>
		</item>
		<item>
		<title>大型网站的网站地图</title>
		<link>http://www.starow.net/seo-tech/seo-sitemap/</link>
		<comments>http://www.starow.net/seo-tech/seo-sitemap/#comments</comments>
		<pubDate>Mon, 18 Jun 2007 05:51:42 +0000</pubDate>
		<dc:creator>星箭</dc:creator>
				<category><![CDATA[SEO技术]]></category>
		<category><![CDATA[网站地图]]></category>
		<category><![CDATA[大型网站优化]]></category>

		<guid isPermaLink="false">http://www.starow.net/seo-tech/seo-sitemap.html</guid>
		<description><![CDATA[在<a href="http://www.starow.net">SEO</a>中，建立一个网站地图是比较重要的，网站地图的建立同时又是与UE（用户体验）联系在一起的。建立网站地图的几个原则，或者说是几个目的：]]></description>
			<content:encoded><![CDATA[<p>在<a href="http://www.starow.net">SEO</a>中，建立一个网站地图是比较重要的，网站地图的建立同时又是与UE（用户体验）联系在一起的。建立网站地图的几个原则，或者说是几个目的：</p>
<p>第一：提高用户体验，用户通过网站地图的索引，能够对整个网站有个很直观的了解，明白网站的定位，并且方便快速找到感兴趣的话题或者产品类。</p>
<p>第二：为搜索引擎建立一个良好的导航结构，使搜索引擎顺着网站地图的链接，抓取更多的页面，因为大型网站的目录导航太复杂，蜘蛛容易迷路。</p>
<p>第三：关键词效应，<a href="http://www.starow.net">SEO</a>的目的提高流量和排名并带来实际效应，而收录是前提，没有收录何来排名。建立网站地图首先考虑的是收录，但是网站地图也是一个关键词优化的重要手段。</p>
<p>所以，大型网站的网站地图应该包含横向和纵向的链接，横向地图的链接主要链接各个频道、栏目、分类，这是为收录。纵向地图主要链接有用的关键词，可以刻意做优化处理，例如产品分类（比如监视器、加湿器、法律图书、电焊机）、专题分类（vista、快乐男声）。</p>
<p>因为大型网站不可能将一些不冷不热的设置专门的栏目或者分类，而是使用专题来取代，但是这些专题又成为不可忽视的流量来源，反而比栏目能够从搜索引擎带来更多的流量，所以绝对不能放弃这类的关键字，要充分的考虑进去。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.starow.net/seo-tech/seo-sitemap/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

