Skip to content

4.1.1 基本概念

权重:页面重要程度
收录:量被百度收录的页面数
蜘蛛:爬取工具
索引量:参与排名的页面
指数:关键词搜索情况 快照:搜索引擎上保存的被收录的网页的纯文本备份

4.1.1 TDK优化

T = title标题关键字描述
D = description描述
K = keywords关键字

  • 百度分词原理:
  1. 基于空格
  2. 百度词典
  3. 用户行为(大数据)
  4. 大于四个字符才分
  • title编写规则:
  1. 标题不要过长最多30/32字符。
  2. 标题不重复(内部竞争)
  3. 第一个分词权重最高
  • keywords编写规则:
  1. 关键词不宜太多推荐2-3个最近,且与内容相符
  2. 关键词不重复(内部竞争)
  3. 第一个关键词权重最高
  • description编写规则:
  1. 提供更多相近的关键词
  2. 长度200字符内
  3. 不参与权重计算

4.1.2 网站结构优化

  • 页面结构类型:
  1. 扁平结构:权重趋向于首页
  2. 树状结构:权重趋向于栏目
  • 域名权重:
  1. 主域名qq.com权重最高
  2. 二级域名weixin.qq.com
  3. 二级目录www.qq.com/bbs/ 其次
  • URL: 使用静态(伪静态)URL:不带有%=&phpasp的URL,也就是URL不能带有任何参数

  • 网页标签:

  1. 使用语义化标签
  2. 使用H1...H6标签,依次使用,不要跳用。
  3. a标签填写alt属性
  4. img标签填写title属性
  5. 少用iframe
  • robots.txt
txt
# 网页抓取工具的名称。*表示允许全部
User-agent: *     
# 不应抓取的目录或网页
Disallow: /nogooglebot/   
# 允许抓取的目录或网页  / 允许爬墙全部页面
Allow: /                 
# 生成并填写网站地图
Sitemap: http://www.wangxiaokai.vip/sitemap.xml

4.1.3 百度检索技巧

  1. 收录条数:site:网址
  2. 外链:Domain:网址
  3. 网址中包含X:Inurl:X
  4. 标题中包含X:Intitle:X
  5. 相关的网页类型PDF:Filetype:pdf