什么是sitemap网站地图?网站中为什么要添加网站地图呢?

  • 内容
  • 评论
  • 相关

什么是sitemap网站地图?网站中为什么要添加网站地图呢?

相信许多网站站长朋友对网站地图都很熟悉,往往是存在于站点根目录下名称为sitemap.xml的一个文件,通过输入网址+sitemap.xml就能访问,里面存有大量的网站链接。那么什么是sitemap呢?为什么网站中要添加这个文件呢?下面IT技术资料分享网小编就给大家简单地介绍一下。

什么是sitemap?

网站地图也就是sitemap,是一个网站所有链接的容器。很多网站的连接层次比较深,蜘蛛很难抓取到,网站地图可以方便搜索引擎蜘蛛抓取网站页面,通过抓取网站页面,清晰了解网站的架构,网站地图一般存放在根目录下并命名为sitemap,为搜索引擎蜘蛛指路,增加网站重要内容页面的收录。网站地图就是根据网站的结构、框架、内容,生成的导航网页文件。大多数人都知道网站地图对于提高用户体验有好处:它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。

网站地图有三种格式存在:HTML、TXT、XML。不同的格式,都有着不同的用途。通常情况下,普通用户在找不到自己需要的目标时,可以打开网站地图页面,这个就是HTML格式的网站地图。在对于爬虫等搜索引擎的时候,TXT、XML格式的网站地图文件就可以方便解析,以便获取里面的链接。

html格式sitemap

xml格式sitemap

 

网站地图sitemap有什么作用呢?

网络抓取工具通常会通过网站内部和其他网站上的链接查找网页。sitemap 会提供此数据以便允许支持 Sitemap 的抓取工具抓取 Sitemap 提供的所有网址,并了解使用相关元数据的网址。使用 sitemap协议并不能保证网页会包含在搜索引擎中,但可向网络抓取工具提供一些提示以便它们更有效地抓取网站。

网站地图sitemap一般有以下的作用:

1.为搜索引擎蜘蛛提供可以浏览整个网站的链接简单的体现出网站的整体框架出来给搜索引擎看;

2.为搜索引擎蜘蛛提供一些链接,指向动态页面或者采用其他方法比较难以到达的页面;

3.作为一种潜在的着陆页面,可以为搜索流量进行优化;

4.如果访问者试图访问网站所在域内并不存在的URL,那么这个访问者就会被转到“无法找到文件”的错误页面,而网站地图可以作为该页面的“准”内容。

sitemap网站地图如何使用?

sitemap网站地图有三种格式,html,xml和txt,其中html、xml格式的sitemap网站导航使用的比较多。现在网上有许多的工具可以在线生成sitemap文件,比如本站采用的是wordpress建站程序,在网站后台可以通过Baidu-Sitemap 插件实现html和xml类型的sitemap网站地图的生成。

在制作好后就可以部署到自己的网站中了。

首先通过ftp工具上传至网站的根目录中。由于html格式的sitemap主要提供给用户导航用,往往在网站的页面适当位置添加一个指向链接就可以了,而xml格式的sitemap主要提供给搜索引擎看的,除了可以在网站的页面中添加指向性链接外(一般不这么做)最重要的是在网站的robots.txt文件中增加一个sitemap标识路径,以通知搜索引擎网站地图文件的位置,方便蜘蛛的爬行抓取,加快网站页面的收录。

robots.txt中sitemap路径

 

sitemap网站地图使用过程要注意哪些?

全部链接真实有效

地图的主要目的是方便搜索引擎蜘蛛抓取的,如果地图存在死链或坏链,会影响网站在搜索引擎中网站权重的,所以要仔细检查有无错误的链接地址,提交前通过站长工具,检查网站的链接是否有效。

简化网站地图

网站地图不要出现重复的链接,要采用标准W3格式的地图文件,布局要简洁,清晰,如果地图是内容式地图,每页不要超过100内容个链接,采用分页的行式,逐一开来,这样方便搜索引擎蜘蛛逐页爬行。

更新网站地图

建议经常更新网站地图,经常的更新地图,便于培养搜索引擎蜘蛛爬行的粘度。经常有新的地图内容生成,长期以来,蜘蛛就会更关注,培养蜘蛛的爬行规则,这样网站内容能更快的被搜索引擎抓取收录。

xml格式的sitemap相关标签的含义。

针对于xml格式的sitemap,文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括链接地址、更新时间、更新频率和索引优先权。

changefreq:页面内容更新频率。

lastmod:页面最后修改时间

loc:页面永久链接地址

priority:相对于其他页面的优先权

url:相对于前4个标签的父标签

urlset:相对于前5个标签的父标签

xml文件必须是UTF-8的编码格式。

网站地图sitemap.xml文件过大怎么办?

显然,如果网站有几百万页面,包含到同一个sitemap文件是不适合的,单一的sitemap文件一般控制在5万个url以下,文件大小不超过10MB,因此,为解决这个问题,搜索引擎允许你创建多个sitemap文件。例如sitemap-01.xml,sitemap-02.xml,sitemap-03.xml,......,然后创建一个 “sitemap索引文件”,将这个文件作为网站的主要sitemap(即sitemap.xml),这样蜘蛛就会根据这个索引文件抓取你所有的sitemap文件,其中主要的sitemap(sitemap.xml)要放在网站的根目录下,分割的多个sitemap文件可以放在一个单独的文件夹,为避免链接url路径过深,建议在站点根目录下创建一个单独的文件夹用于存放分割的sitemap文件,这样就可以方便以后的管理。

sitemap索引文件的格式参考如下:

<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<sitemap>
<loc>https://www.lmdouble.com/sitemap-01.xml</loc>
<lastmod>2019-04-21T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>https://www.lmdouble.com/sitemap-02.xml</loc>
<lastmod>2018-12-22</lastmod>
</sitemap>

……

<sitemap>
<loc>https://www.lmdouble.com/sitemap-36562.xml</loc>
<lastmod>2018-12-22</lastmod>
</sitemap>
</sitemapindex>

(以上为示例,本站并没有存在这么多的url,如果还是不清楚的话,你也可以参考 http://www.dnzhai.com/sitemap.xml)

IT技术资料分享-个人整理自互联网

 

上一篇: 下一篇:
关注本站微信公众号


仍未解决?点击远程协助
win10纯净版系统安装教程
关闭
关注本站

扫一扫,关注本站微信公众号