网站地图的两种形式有什么作用?

网站无论大小,单独的网站地图页都是必需的。通过网站地图,用户不仅可以对网站结构和所有内容一目了然,搜索引擎也可以通过网站地图快速地爬行网站的各个页面。


1. 网站地图的概念

网站地图,又称站点地图,它就是一个页面,上面放置了网站上所有页面的链接。当访客在网站上找不到自己所需要的信息时,可能会将网站地图作为一种补救措施。搜索引擎蜘蛛非常喜欢网站地图,网站地图对于蜘蛛而言就相当于蜘蛛网,它可以同过网站地图爬行到网站的各个页面。网站也可以通过添加网站地图提高网站的收录量。


2. 网站地图的两种形式

提交给搜索引擎的网站地图有两种形式,分别为HTML和XML,具体介绍如下。


(1)HTML网站地图

HTML版本的网站地图(sitemap),其中s需小写,表示特制HTML版网站地图。HTML版本网站地图就是用户可以在网站上看到的、列出网站上所有主要页面链接的页面。

该网站地图具有可读性,可以通过分类的形式展示大部分内容,其优势是便于用户浏览,劣势是分类过多,容易造成遗漏文件不被抓取。

(2)XML网站地图


XML版本的网站地图,是使用XML标签组成的网站地图,可以设置几乎所有的地址。这种形式的网站地图还可区分网站文件是否更新与内容的重要性,但是只适合搜索引擎蜘蛛抓取,不利于用户体验。XML格式的网站地图如下所示。

<urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9">  <url>   <loc>http://liuxianan.com/</loc>   <lastmod>2016-09-06T00:00:16+08:00</lastmod>   <changefreq>daily</changefreq>   <priority>1.0</priority>  </url>  <url>   <loc>http://liuxianan.com/link.html</loc>   <lastmod>2016-09-06T00:00:16+08:00</lastmod>   <changefreq>daily</changefreq>   <priority>0.8</priority>  </url> </urlset>

上述代码中,除了loc是必填项之外,其他3个都不是必需的,但最好都写上。

· loc表示完整网址,属于必填内容,长度不得超过256字节。

· lastmod表示本网页最后修改时间,必须是IsO 8601时间格式,应写成:yyyy-MMddTHH:mm:ss+08:00。

· changefreq表示更新频率,可选值:always、hourly、daily、weekly、monthly、yearly、never。

· priority用来指定此链接相对于其他链接的优先权比值,可选值0.0~1.0。一般来说,网站首页为1.0,然后二级三级页面依次降低。


一个 sitemap 文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果sitemap 超过了这些限值,需要将其拆分为几个小的 sitemap。这些限制条件有助于确保网络服务器不会因提供大文件而超载。


英文Sitemap中的s大写时通常特指XML版本的网站地图。XML网站地图由Google于2015年首先提出,2006年微软、雅虎都宣布支持。2007年各主要搜索引擎都开始支持robots文件指定网站地图位置。百度现在也支持XML版本网站地图。

营销型网站