为什么要做 SEO?
SEO(Search Engine Optimization),搜索引擎优化,是指在了解搜索引擎自然排的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引擎中的关键词自然排名,获取得更多流量,从而达成网站销售及品牌建设的目标。
- SEO 是用户主动搜索,因而精准度及转化率更高
- 性价比高,非免费但成本相对较低
- 可扩展,同一方法可用于创建多个不同网站
- 长期有效,广告停止投放即不再贡献浏览,SEO 的排名上升则具备持久性
- SEO 需要对网站进行修改,可持续改善用户体验
第一个搜索引擎1990年 Archie;1996年 BackRub->97年改名 Google
Panda 减少搜索结果中低质量页面
Penguin 打击作弊链接和低质量链接
蜂鸟算法 重写整个排名算法
整合搜索、个人化搜索、实时搜索;使SEO 更加自然、更强调用户体验;
百度
绿萝算法 打击参与链接买卖、垃圾链接的网站
石榴算法 打击低质量内容页面(“起源”算法、”蝶变”计划)
百科、知道、贴吧
了解搜索引擎
基本权重是页面能够参与相关性计算的最基本条件;大型网站最关键的问题是解决收录;
搜索引擎几个方面的挑战
- 页面抓取需要快而全面
- 海量数据存储(百度30-40W+台服务器,Google 几十个数据中心、上百万台服务器)
- 索引处理快速有效,具有可扩展性
- 查询处理快速准确
- 判断用户意图及人工智能(”苹果”->水果?电脑?电影?小苹果?…)
SERP 页
- 广告、自然搜索结果、垂直搜索(图片、视频、地图等)
- 搜索结果数可作为竞争程度的依据之一。
- 整合搜索:10条自然结果中包含一些带视频、图片、地图等的结果
- 全站链接(sitelinks):权重高的网站
- One-box(Google)、框计算(百度)
- Rich Snippet 富摘要(如产品价格、评分、评论数等)
- 图文展现
- 知心搜索(百度)、知识图谱(Google)
- 面包屑导航
搜索引擎工作原理
- 爬行和抓取
- 蜘蛛 – robots.txt, 爬虫User Agent汇总
- 跟踪链接 – 深度优先、广度优先
- 吸引蜘蛛 – 权重、页面更新度、导入链接、首页点击距离、URL 结构
- 地址库 – 人工录入种子网站、链接URL、站长提交、网站地图
- 文件存储
- 复制内容检测
- 预处理/索引
- 提取文字
- 中文分词 – 词典匹配、统计
- 去停止词- 的、地、得、the、a、to…
- 消除噪声 – 页头、页脚、广告区
- 去重 – MD5
- 正向索引 – 文件1:关键词1(频率、次数、格式等)、关键词2…
- 倒排索引 – 关键词1:文件1、文件2…
- 链接关系计算 – 如 PR 值
- 特殊文件处理 – PDF、WORD 等
- 质量判断
- 排名
- 搜索词处理 – 中文分词、去停止词、指令处理(+,-…)、拼写错误矫正、整合搜索触发、搜索框提示
- 文件匹配
- 初始子集的选择 – Google 最多返回100页、百度返回76页、360返回64页
- 相关性计算 – 影响因素:关键词常用程度、词频及密度、关键词位置及形式、关键词距离、链接分析及页面权重
- 排名过滤及调整 – 如惩罚
- 排名显示
- 搜索缓存
- 查询及点击日志
- 链接原理
- 李彦宏超链分析专利
- HITS 算法(Hyperlink-Induced Topic Search)
- TrustRank 算法
- Google PR
$$PR(A) = (1-d) + d(PR(t_1)/C(t_1)) + PR(t_n)/C(t_n)$$
A 为页面 A,d 为阻尼指数,通常认为是0.85,t1…tn 表示指向页面 A 的页面,C 表示页面上的导出数目 - Hilltop 算法
相关性:
- 关键词常用程度
- 词频及密度
- 关键词位置及形式
- 关键词距离
- 链接分析及页面权重
高级搜索指令
双引号 “飞机微博图片”; 减号 新加 -坡; 星号 郭*纲; inurl: ; inanchor: ; intitle: ; allintitle: ; allinurl: ;
filetype: (pdf,doc,xls,ppt,rtf,all); site: ; link: ; linkdomain: (雅虎,已废弃); related: ;
综合使用:
- inurl:gov 减肥
- inurl:edu.cn intitle:交换链接
- inurl:edu.cn/forum/*register
- 减肥 inurl:links
- allinurl:gov.cn+links
- linkdomain:dunsh.org -linkdomain:seozac.com
竞争研究
研究关键词的原因
- 确保目标关键词有人搜索
- 降低优化难度
- 寻找有效流量(律师->北京律师->北京刑事律师)
- 搜索多样性(3个单词以下关键词比例逐年下滑,4个词以上逐年上升)
- 发现新机会
关键词选择原则
- 内容相关(有效流量)
- 搜索次数多,竞争小(关键词效能)
- 主关键词不可太宽泛
- 主关键词不可太特殊
- 商业价值(液晶电视原理->液晶电视图片->液晶电视价格->液晶电视促销->液晶电视购买)
关键词竞争程度
- 搜索结果数(参考:10万以下竞争小,几十万有一定难度,一两百万以上较难,百度搜索结果数上限1亿)
- intitle结果数
- 竞价结果数(建议白天工作时间查看)
- 竞价价格
- 竞争对手情况
- 内页排名数量(一般排名前10、前20内页多的竞争较小)
关键词竞争程度指数示例
关键词 | 搜索结果数 | intitle 数 | 竞价数 | 平均点击价格 | 竞争对手实力 | 前10内页数 | 竞争指数 |
---|---|---|---|---|---|---|---|
核心关键词
首页确定两三个核心关键词,按难易程度逐步扩展至栏目/分类页、详情页。如何获取?
- 头脑风暴
- 同事朋友
- 竞争对手
变体:同义词、相关词、简写、错字
补充说明文字:地名、品牌、限定和形容词(免费、促销、价格、便宜、怎样、是什么、好吗、评测、图片…)
网站排行榜:
https://www.alexa.com/topsites
关键词工具
Google Keywords Planner、 Google Trends、百度指数、百度竞价后台、百度风云榜、站长之家、爱站(aizhan.com)、站长帮手(links.cn)、追词网(zhuici.com)
三类关键词:10% 导航类(品牌词等)、10% 交易类(小米手机价格等)、80%信息类(手机图片等)
有关不同排名CTR的研究:http://www.advancedwebranking.com/ctrstudy/
301, canonical
Sitemap xml最多可以列出5万个url,文件不能超过10MB,一个网站最多可以有1000个XML网站地图文件
百度Title 30个中文字符,Google 65个英文字符,百度描述显示77个左右的中文字符,Google显示156个英文字符,百度后台处理标题时会保留65个字节左右
产品名称/文章标题 – 子分类名称 – 分类名称 – 网站名称
目录提交、交换链接
链接诱饵(新闻诱饵、资源型链接、争议性话题、线上工具[博客估值、计算贷款利息、人是否超重、预产期等等]、插件、利益吸引、幽默搞笑[http://www.worldsgreatestbusinessmind.com/])
外链建设:自己网站、博客、文章发表、论坛博客留言、合作伙伴、网摘书签、百科及问答类网站、客座及团队博客、检查竞争对手网站、网络广告、购买链接、社会化媒体网站、联署计划、CMS系统模板、新闻稿发布[prexpress.cn]、媒体公关、请求链接、购买网站、站群、赞助活动、电子书发布、信息发布网站。
日志分析:http://www.123cha.com/查询IP归属
流量分析工具
Google分析
Omniture
百度统计:http://tongji.baidu.com
量子恒道:http://www.linezing.com/
51yes:http://count.51yes.com
我要啦:http://www.51.la/
CNZZ:http://zhanzhang.cnzz.com/
服务器端
Webalizer:http://www.webalizer.org/
AWStats:http://www.awstats.org/
黑帽SEO作弊手法
- 隐藏文字(背景色、背景图片、position:absolute、display:none)
- 隐藏链接
- 垃圾链接(Link Spam):留言、评论
- 买卖链接(Paid Links)
- 链接农场
- 链接向坏邻居(Bad Neighborhood)
- 隐藏页面(Cloaking, Cloaked Page):判断为搜索引擎返回不同内容
- PR劫持(PR Hijacking):301或302转向到高PR的网站
- 桥页(Doorway Pages, Bridge Pages):又称门页,堆砌关键词(长尾)
- 跳转:Meta刷新、JS脚本跳转、Flash实现跳转
- 诱饵替换(Bait and Switch):获得排名后替换内容(成人、赌博等)
- 关键词堆积(Keyword Stuffing)
- 大规模站群
- 利用高权重网站
搜索引擎惩罚
作弊的积分制
Google负6惩罚、负30、负950,百度11位现象
新闻源提交(百度:http://news.baidu.com/newsop.html)
百度地图本地商户中心:http://nlbc.baidu.com/
多语种:可添加<link rel=”alternate” hreflang=”en” href=”http://en.example.com” />来指定各语种对应的网址
地理位置:<meta name=”location” content=”province=北京;city=北京;coord=116.306522891,40.0555055968″>(coord为经纬度坐标)
Sitelinks
伪原创: 指纹算法
2015搜索引擎排名因素(https://moz.com/search-ranking-factors)
工具:
百度指数(专业版:http://vip.index.baidu.com/)
百度搜索风云榜
Google AdWords工具
Google Alerts
SEOQuake
SEO for Firefox
SEO Toolbar
Search Status
站长帮手(http://www.links.cn/)
ChinaZ站长工具(http://tool.chinaz.com/)
关键词排名批量查询工具(http://www.flashplayer.cn/keywords/)
ahrefs.com外链工具
Backlink Watch(http://www.backlinkwatch.com/)
TouchGraph(http://www.touchgraph.com/seo)
Google移动友好性测试(http://www.google.com/webmasters/tools/mobile-friendly)
百度站长平台(http://zhanzhang.baidu.com/)
Xenu
Alexa
Google Trends
Open Site Explorer(SEOMoz:https://moz.com/researchtools/ose/)
Majestic SEO
IP反查域名:http://www.cnwzml.com
http://www.yougetsignal.com/tools/web-sites-on-web-server/
Bing中搜索ip:xxx.xxx.xxx.xxx
服务器头信息检测:http://www.webrankinfo.com/english/tools/server-header.php
网站:
http://www.im286.net/forum.php(落伍者论坛)
http://www.williamlong.info/(月光博客)
人物:
宋星(http://www.chinawebanalytics.cn/)
Avinash Kaushik(http://www.kaushik.net/avinash/)
幻灭(原G速客)
卢松松
唐磊(A5)
Aaron Wall(http://www.seobook.com/)
Jason Calacanis
Matt Cutts
Amit Singal
Rand Fishkin(Moz)
Danny Sullivan(http://searchengineland.com/)
Brett Tabke(https://www.webmasterworld.com/)
其它补充
IndexNow支持向搜索引擎推送新增、修改的页面,目前 Bing 和 Yandex 均提供支持
Facebook 边际排名算法(Edge Rank Algorithm)
E = u * w *d
- u:用户与内容发布者之间的亲密度分数,互动越多则关系分数越高
- w:不同的互动动作具有不同的权重,如评论、点赞等。比如评论动作的权重就会高于点赞。
- d:发布时间,发布越近的新消息重要性越高。