网站地图(sitemap)它是搜索引擎蜘蛛用来更快速高效爬取页面的网络导航图。
唯一的区别在于这张地图由你亲手绘制,而网络上的小蜘蛛们则通过它爬遍你网站的每个角落。
本节内容将带你全面了解如何创建和优化SEO网站地图,让搜索引擎抓取更多、收录更多、排名更高。
什么是网站地图?
网站地图是一个列出你网站所有URL的文件,它向搜索引擎提供关于网页、媒体文件及其他网站内容的详细信息。顾名思义,它就是网站的导航地图。
网站地图相当于网络爬虫的备用发现方式,虽然搜索引擎蜘蛛不一定需要网站地图,但有了它就能确保搜索引擎蜘蛛不会遗漏任何内容。
网站地图长什么样?
这是YoastSEO网站地图的示例:

YoastSEO的XML网站地图
这是一个经过CSS美化的网站地图,所以看起来整洁有序。
如果我们查看其底层的HTML代码,网站地图的实际语法是这样的:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.myppc.net/</loc>
<lastmod>2023-10-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>https://www.myppc.net/ppc-agency</loc>
<lastmod>2023-10-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>https://www.myppc.net/seo-agency</loc>
<lastmod>2023-10-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
以此类推,每个URL都会重复一个新的部分。
网站地图有哪些类型?
谷歌支持三种网站地图格式:
- XML网站地图:XML是可扩展标记语言的缩写。它类似于HTML,但HTML用于显示数据,而XML用于存储和传输数据。你只需要知道XML格式的网站地图是行业标准,几乎在所有情况下都会使用它(像Wix、Squarespace这样的内容管理系统或Yoast这样的WordPress插件都采用这种格式)。为什么?因为它能提供最全面的信息。
- 文本网站地图:如果你的网站地图只包含URL(没有额外信息、图片或视频),可以使用这种逐行列出URL的基础文本格式。虽然受支持,但功能有限。
- RSS网站地图:RSS是博客的订阅源,用户可以通过邮件获取自动更新。你也可以将RSS订阅链接提交给谷歌,谷歌会将其视为网站地图。和文本网站地图一样,RSS网站地图只包含URL。
这三种格式还支持以下扩展类型:
大多数情况下,你不需要单独创建图片、新闻或视频网站地图,因为图片和视频通常会出现在普通网站地图包含的页面中,而且大多数网站也不是新闻机构。
不过,如果你的网站有大量视频和图片,或者你是新闻出版商,可以为每种类型创建专门的网站地图扩展。
XML网站地图与HTML网站地图的区别
XML网站地图是提交给谷歌或Bing的文件,而HTML网站地图则是网站上用于帮助访客更好导航的扩展链接列表。
例如,我们的HTML网站地图位于网站页脚,并显示在每个页面上(不过有些网站会将HTML网站地图单独放在一个页面上)。

PPC学院页网站页脚中的HTML网站地图
谷歌是否支持HTML网站地图?
你无法通过谷歌搜索控制台提交HTML网站地图。从这个角度来看答案是否定的。然而谷歌的算法会抓取链接,而HTML网站地图中充满了链接。因此在页脚中包含一个HTML网站地图可以帮助确保谷歌找到你网站上最重要的页面。
为什么网站地图对SEO很重要?
网站地图通过向谷歌提供明确的指令(包括需要抓取的页面优先级),以及关于视频、图片和新闻条目的附加信息,帮助搜索引擎更高效的抓取和索引你的网站。
效果如何?搜索引擎能更频繁的对更多页面进行排名,并在排名结果中更优质的展示相关信息。
除了URL之外,还能指定哪些附加信息?
- 页面标题
- 发布日期
- 最后修改时间
- 页面更新频率
- 页面优先级(不过谷歌会忽略此项)
- 移动端备用URL
- 多语言备用URL
- 视频标题、描述、时长、过期时间、评分、价格、家庭友好性、区域限制、是否需要订阅
- 图片标题、类型、授权信息、拍摄地点、图注
- 新闻发布机构名称及语言、文章标题
注意!搜索引擎只将网站地图视为建议。即使你标明了页面优先级或声明了某些页面存在也未必会采纳。
什么时候需要网站地图?
谷歌建议在以下四种情况下提交网站地图:
- 大型网站:如果你的网站有成千上万个页面,最好提交网站地图,帮助搜索引擎爬虫发现并索引每个页面。
- 孤立页面:理想情况下,网站的大部分页面都能被访客和搜索引擎轻松找到。但有些页面你可能不希望被普通访客轻易发现,只针对搜索特定信息的用户。这种情况下最好提交网站地图让谷歌知道这些页面的存在。
- 新网站:新站点通常更难被抓取和索引,因为几乎没有其他网站链接到它们。如果你刚发布网站,一定要提交网站地图,确保每个页面能被快速索引。
- 富媒体或新闻网站:网站地图可以向谷歌传递额外信息,帮助优化媒体内容的排名和在搜索结果页中的展示。如果你是新闻媒体网站,或拥有大量图片、视频等富媒体内容,亦或是每个商品都配有产品图的电商网站最好提交网站地图。
什么时候不需要网站地图?
既然创建和提交网站地图如此简单,因此我们不建议你跳过这一步。
但事实是,对于只有几十个页面、标准媒体内容和友好结构的普通网站,谷歌通常无需帮助就能抓取并索引所有页面。
如何创建XML网站地图?
你可以自动生成动态XML网站地图(推荐方式),这样每当网站添加新页面时,地图也会同步更新。或者也可以使用免费的网站地图生成工具手动创建静态地图。
通过CMS自动生成
如果您使用Squarespace、Wix、Shopify或BigCommerce等内容管理系统(CMS)建站,这些平台会自动为您生成XML网站地图。别忘了提交给谷歌搜索引擎即可。

这是Wix平台自动生成的网站地图样例 ——图片来源
WordPress SEO插件
如果你的网站是用WordPress搭建的,可以使用Yoast SEO这类XML网站地图生成插件。它们会自动帮你创建XML网站地图。Yoast还支持图片、视频和新闻网站地图的扩展功能。

Yoast插件的XML网站地图示例——图片来源
XML网站地图生成器
你也可以使用免费的XML网站地图生成工具。只需输入你的网址就会自动生成XML格式的网站地图。手动创建网站地图的唯一缺点是,每次更新网站后都需要手动重新生成更新的网站地图。

XML网站地图生成器——图片来源
SEO网站地图最佳实践
创建网站地图其实很简单,特别是现在有这么多免费工具可以用。但谷歌还是建议你遵循一些最佳实践。
1. 保持URL格式统一
虽然这是老生常谈,但务必使用统一的URL格式。
举个例子:
- 使用绝对路径 https://myppc.net/category/seo/
- 不要用相对路径 /category/seo
- 保持所有URL语法一致。比如不要有时用带www的(https://www.myppc.net),有时又不带www(https://myppc.net)
- 网站如果已经升级到https://协议,就不要再出现http://的链接

确保所有链接格式统一规范
2. 拆分大型网站地图
谷歌允许的站点地图最大为50MB或包含50万个URL。如果超过这个规模就应该拆分成多个网站地图。
50万已经超级大了,大多数网站根本达不到这个规模。
但这里有个专业建议,无论如何都建议把你的网站地图拆分成多个部分。
根据谷歌的John Mueller的说法:"网站地图没有理想大小(只要不超过上限就行)。我通常建议按网站逻辑分区拆分,这样你可以单独监控每个部分(比如分类页、详情页等)。"
如果把站点地图按逻辑拆分,当你在谷歌搜索控制台查看报告时就能轻松定位网站哪个板块的表现不符合预期。
在谷歌搜索控制台中的网站地图报告。通过多个网站地图,可以轻松检查网站各板块状态。
如何创建多个网站地图?
创建一个网站地图索引文件(相当于网站地图的目录)。这个索引文件会链接到所有子网站地图。
例如访问myppc.net/sitemap.xml时会看到我们的站点地图索引文件。
如果查看源代码的话,这就是我们的站点地图索引文件HTML在没有CSS的情况下的样子。
<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="sitemap.xsl"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://myppc.net/sitemap-posts.xml</loc>
<lastmod>2023-10-26T16:58:34.000Z</lastmod>
</sitemap>
<sitemap>
<loc>https://myppc.net/sitemap-pages.xml</loc>
<lastmod>2023-10-26T20:02:55.782Z</lastmod>
</sitemap>
<sitemap>
<loc>https://myppc.net/sitemap-categories.xml</loc>
<lastmod>2023-10-26T20:02:55.770Z</lastmod>
</sitemap>
<sitemap>
<loc>https://myppc.net/sitemap-case-studies.xml</loc>
<lastmod>2023-10-25T17:31:30.000Z</lastmod>
</sitemap>
</sitemapindex>
一个网站地图URL。包含多个子站点地图。

URL顺序无关紧要
排列靠前的URL不代表优先级,顺序没有任何影响。
3. 忽略URL的排序(它们并不重要)
你可以告诉谷歌你优先考虑哪些URL,但它们不一定会采纳。
而且无论你把URL放在哪里(第一位还是最后一位),都不会改变搜索引擎读取它们的方式。
4. 包含多语言URL
谷歌允许通过hreflang属性在同一文件中提交网页的多个语言或地区版本。具体操作方法可以查阅谷歌关于指定替代语言的说明文档。

hreflang元素通过网站地图指定替代语言页面
5. 如果存在移动端和桌面端独立网址,请选择其一提交
谷歌官方建议,如果网站存在独立的移动版和桌面版网址(例如m.example.com和example.com),只需提交其中一个版本即可。
当然你也可以在站点地图中同时标注两个版本,这完全取决于你的需求。
6. 仅包含规范链接,避免重复内容
规范标签是一种HTML标签,用于告诉搜索引擎,当同一页面出现在不同网址时,哪个才是原始版本。
比如电商网站上,同一个商品经常会因访客使用的筛选条件不同而出现在多个网址。是按颜色筛选的?还是按尺寸?按日期?按价格区间?
根据CMS系统的设定,这四个筛选条件可能都会展示同一商品,只是网址不同。
来看个例子:在电商网站搜索"恐龙战队"玩具时,绿色战士可能出现在以下不同网址:
- /action-figures/green-ranger/
- /power-rangers/green-ranger/
- /90s/green-ranger/
- /product/green-ranger/ (规范网址)
为避免谷歌认为存在重复内容(或同一页面的多个版本),你需要在每个页面的rel=canonical标签中指定原始页面(/product/green-ranger/)。
最后在站点地图中只需包含规范(原始)网址,其他版本都应排除。
7. 将站点地图放在根目录
你可以把站点地图放在网站的任何位置,但它只能引用下级URL。
例如,如果我们把站点地图放在www.myppc.net/projects/sitemap.xml,它就只能引用/projects子文件夹内的URL。因此我们建议将站点地图放在根目录下(例如myppc.net/sitemap.xml)。
不知道如何找到你的站点地图?最简单的方法是先检查你的robots.txt文件。
在浏览器地址栏输入你的网址,后面加上/robots.txt。例如:myppc.net/robots.txt。

你的robots.txt文件会告诉你站点地图的URL。
8. 向搜索引擎提交网站地图
让搜索引擎费力去找你的网站地图可没啥意义,毕竟创建网站地图的初衷就是为了让网站更容易被发现。
不如直接把网站地图提交给搜索引擎。
最简单的方法是通过谷歌搜索控制台提交。
登录谷歌搜索控制台,找到网站地图报告页面,提交网站地图的URL即可。

用搜索控制台轻松把网站地图提交给谷歌
Bing站长工具也提供同样便捷的提交入口。
谷歌只会在你提交时检查网站地图,而不会在每次抓取网站时都检查。因此只有当网站有实质更新时才需要更新网站地图并通知谷歌,重复提交未更改的网站地图没有啥意义。
总结
就像徒步旅行者出发前不能没有地图一样,网站上线也绝不能少了站点地图。
你总不想让网络爬虫迷路吧?
大型网站、小型博客,或是不大不小的站点都无所谓。稳妥起见,请务必创建SEO网站地图,最后别忘了提交给谷歌哦 ![[托腮]](https://www.myppc.net/wp-content/themes/dragon/assets/images/smilies/qq/tuosai.gif)