搜索引擎优化魔法书-第32章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
weekly
example/catalog?item=73&;desc=vacation_new_zealand
2004…12…23
weekly
example/catalog?item=74&;desc=vacation_newfoundland
2004…12…23T18:00:15+00:00
0。3
example/catalog?item=83&;desc=vacation_usa
2004…11…23
你可以使用 gzip 压缩 Sitemaps 文件。压缩 Sitemaps 文件会降低对带宽的要求。请注意,
未压缩的 Sitemaps 文件不得大于 10MB 。
5、使用 Sitemaps 索引文件(对多个 Sitemaps 文件进行分组)
你可以提供多个 Sitemaps 文件,但提供的每个 Sitemaps 文件包括的网址不得超过
50,000 个,并且未压缩时不能大于 10MB (10,485,760)。这些限制条件有助于确保 Web
服务器不会因传输非常大的文件而遇到麻烦。
如果要列出超过 50,000 个网址,你需要创建多个 Sitemaps 文件。如果预计你的
Sitemaps 网址数量会超过 50,000 个或大小超过 10MB,应考虑创建多个Sitemaps 文件。
如果你的确提供了多个 Sitemaps,你可以将其列在Sitemaps 索引文件中。Sitemaps 索引文件
只能列出不超过 1,000 个 Sitemaps。
Sitemaps 索引文件的 XML 格式与 Sitemaps 文件的 XML 格式非常相似。Sitemaps
索引文件使用以下 XML 标记:
第92 页
… Page 101…
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
loc
lastmod
sitemap
sitemapindex
注:Sitemaps 索引文件只能指定与其位于同一网站的 Sitemaps 。例如,
yoursite/sitemap_index。xml 可包含位于yoursite 的
Sitemaps,但不能包含位于example 或yourhost。yoursite 的Sitemaps。
与 Sitemaps 一样,你的 Sitemaps 索引文件应为UTF…8 编码。
6、XML Sitemaps 索引示例
下例展示了一个 XML 格式的 Sitemaps 索引。该 Sitemaps 索引列出了两个 Sitemaps:
example/sitemap1。xml。gz
2004…10…01T18:23:17+00:00
example/sitemap2。xml。gz
2005…01…01
备注:与 XML 文件中的所有值一样,Sitemaps 网址需要实体换码。
Sitemaps 索引 XML 标记定义
需要有 标记并用其来识别 Sitemaps 的位置。
标记是可选标记,用于指示相应 Sitemap 文件的修改时间。它并不
对应于该 Sitemap 中列出的任一网页的更改时间。lastmod 标记的值应采用
W3C Datetime 格式。通过提供最近修改的时间戳启用搜索引擎抓取工具,抓
取工具将只检索索引中的 Sitemaps 的一个子集,也就是说,抓取工具只检索
某特定日期之后修改的 Sitemaps。通过这一递增的Sitemaps 提取机制,可以
快速发现超大型网站上的新网址。
标记封装单个 Sitemaps 的相关信息。
标记会压缩有关文件中的所有 Sitemaps 的信息。
7、Sitemaps 文件的位置
Sitemaps 文件的位置决定该 Sitemaps 中所能包含的一组网址。位于
example/catalog/sitemap。gz 的Sitemaps 文件可包含以example/catalog/开
始的任何网址,但不能包含以example/images/开始的网址。
如果有更改example。org/path/sitemap。gz 的许可,你应该也可以提供以
example。org/path/作为前缀的网址的信息。
第93 页
… Page 102…
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
example/catalog/sitemap。gz 中,被认为有效的示例网址包括:
example/catalog/show?item=23
example/catalog/show?item=233&user=3453
example/catalog/sitemap。gz 中被认为无效的网址包括:
example/image/show?item=23
example/image/show?item=233&user=3453
https://example/catalog/page1。html
被认定为无效的网址将不再考虑。强烈建议将 Sitemaps 放置在Web 服务器的根目录处。
例如,如果Web 服务器位于example,则Sitemaps 索引文件应位于
example/sitemap。gz 。在某些情况下,你需要针对不同的路径创建对应的Sitemaps,
例如,如果在你的组织中,安全许可对应不同目录划分上传权限。
8、验证你的Sitemaps
Google 使用 XML 架构定义可以出现在 Sitemaps 文件中的元素和属性。你可从
以下链接下载此架构:
对于 Sitemaps: google/schemas/sitemap/0。84/sitemap。xsd
对于 Sitemaps 索引文件:google/schemas/sitemap/0。84/siteindex。xsd
有多种工具可帮助你根据此架构来验证你的 Sitemaps 结构。在下面的每一个位置
你都可以找到 XML 相关的工具列表:
w3。org/XML/Schema#Tools
xml/pub/a/2000/12/13/schematools。html
为了根据某个架构验证你的Sitemaps 或 Sitemaps 索引文件,XML 文件需要有附
加的标头。如果你使用的是 Sitemaps 生成器,这些标头已经包含其中。如果你使用不
同的工具创建 Sitemaps,XML 文件中的标头应如下例所示。
Sitemaps:
。。。
Sitemaps 索引文件:
。。。
9、Google sitemaps Builder V1。5 使用教程
这是一款由国外编程人员开发的Google Sitemap 制作软件,通过该软件那些不懂XML
语法的人也很容易制作出xml 版本的Google Sitemap 和纯文本链接地址。
该软件可运行于Windows 2000 / XP / 2003 平台,必须在 Framework 1。1 环境下安
装,如果你的电脑没有安装 Framework 1。1,你可以到微软官方网站上下载
(microsoft/downloads/details。aspx?FamilyID=262D25E3…F589…4842…8157…034
D1E7CF3A3&displaylang=zh…cn; )。
Google sitemaps Builder V1。5 软件可以到下面的网站地址下载:
timev/download/google…sitemaps…builder。html
Google sitemaps Builder 软件的安装相当容易,这里就不做介绍了。接下来,主要来讲
解一下 Google sitemaps Builder 的使用方法。
安装完Google sitemaps Builder 软件后,点击任务栏里的“开始”,从“所有程序”里找
到“Sitemaps Builder ”,运行该程序。当然,安装完Google sitemaps Builder 软件后,电
脑的桌面会有其快捷方式,直接点击它可快速运行该软件。
下图是Google sitemaps Builder 软件的操作界面:
图6…8…9 Google sitemaps Builder 软件操作界面
我们可以在URL 输入框里输入目标网站首页地址,如下图所示:
第95 页
… Page 104…
搜索引擎优化魔法书 SEO Magic Book 浩维互动免费电子书 timev
图6…8…10 输入示例
然后点击“Extract Links”按钮,软件就会派出其机器人去目标网站上进行爬行,从而
捕获目标网站的链接信息。如果你要停止该软件的机器人爬行,可以点击“Cancel”按钮。
图6…8…11 Google sitemaps Builder 软件的运行过程中的截图
等Google sitemaps Builder 的机器人爬行完整个站点后,我们就可以轻松获取Google
sitemap 文件了。
在软件界面中点击“Map File”,然后会出现下面的界面:
图6…8…12 Map File 界面