Appearance
4.1.1 基本概念
权重:页面重要程度
收录:量被百度收录的页面数
蜘蛛:爬取工具
索引量:参与排名的页面
指数:关键词搜索情况 快照:搜索引擎上保存的被收录的网页的纯文本备份
4.1.1 TDK优化
T = title标题关键字描述
D = description描述
K = keywords关键字
- 百度分词原理:
- 基于空格
- 百度词典
- 用户行为(大数据)
- 大于四个字符才分
- title编写规则:
- 标题不要过长最多30/32字符。
- 标题不重复(内部竞争)
- 第一个分词权重最高
- keywords编写规则:
- 关键词不宜太多推荐2-3个最近,且与内容相符
- 关键词不重复(内部竞争)
- 第一个关键词权重最高
- description编写规则:
- 提供更多相近的关键词
- 长度200字符内
- 不参与权重计算
4.1.2 网站结构优化
- 页面结构类型:
- 扁平结构:权重趋向于首页
- 树状结构:权重趋向于栏目
- 域名权重:
- 主域名qq.com权重最高
- 二级域名weixin.qq.com
- 二级目录www.qq.com/bbs/ 其次
URL: 使用静态(伪静态)URL:不带有
?、%、=、&、php、asp的URL,也就是URL不能带有任何参数网页标签:
- 使用语义化标签
- 使用H1...H6标签,依次使用,不要跳用。
a标签填写alt属性img标签填写title属性- 少用
iframe
robots.txt
txt
# 网页抓取工具的名称。*表示允许全部
User-agent: *
# 不应抓取的目录或网页
Disallow: /nogooglebot/
# 允许抓取的目录或网页 / 允许爬墙全部页面
Allow: /
# 生成并填写网站地图
Sitemap: http://www.wangxiaokai.vip/sitemap.xml4.1.3 百度检索技巧
- 收录条数:
site:网址 - 外链:
Domain:网址 - 网址中包含X:
Inurl:X - 标题中包含X:
Intitle:X - 相关的网页类型PDF:
Filetype:pdf