与百度Lee、Google朱健飞技术交流实录
关于百度Lee、Google朱健飞及Matt Cutts
在中国站长圈子,百度Lee知名度颇高。这位百度搜索部门的成员,近两年在SEO社区相当活跃,持续热情地解答各类问题。活动范围从*初的百度站长俱乐部,扩展到了百度站长平台社区。实际上,“百度Lee”代表着一个团队,核心人物是百度的王淘。Lee、王淘及站长平台的同仁们,显著推动了百度与SEO及站长群体的沟通交流。
朱健飞任职于Google美国总部,是反垃圾部门中日韩语组的负责人。上次与他碰面,还是在四年多前的南京SMX会议上。那之后,因众所周知的原因,Google退出了中国市场,健飞再未踏足国内。事实上,Google始终乐于与SEO从业者交流。健飞随和又健谈,据Robin透露还酷爱卡拉OK。期待未来朱健飞及其他Google员工能更多地参与到SEO圈的活动中。
Matt Cutts作为Google反垃圾部门的主管,其名号在全球SEO界可谓如雷贯耳。长期以来我们虽知其是Google前百名元老员工之一,但具体序号不明。这次健飞给出了答案:Matt Cutts的工号是71。
百度点击器影响已被严格限制
我观察到2012年末起,不少曾有效果的百度点击器纷纷失效。Lee证实,目前这类工具的影响已被压缩至极其微小的范围。他的一句观点引人思考:百度更关注的是点击行为本身及其影响,而非拘泥于某个具体工具。
绿萝、熊猫、企鹅算法命名的背后
2013年2月推出的百度绿萝算法,旨在打击链接买卖行为。方案的设计者是一位女工程师,故此命名权自然归属她。“绿萝”暗含净化、清洁之义,恰好契合反作弊的宗旨。
2011年上线的Google熊猫算法(Panda),其命名与中国无关。关键在于,负责该算法编写的工程师姓氏为Panda,他是一位印度裔人士。
后续的企鹅算法(Penguin),主要目标是清理垃圾链接。其名称选择延续了Panda的风格——采用黑白动物主题。未来Google若推出类似算法,恐怕需要寻找更多符合条件的黑白动物名称了。
百度识别买卖链接的核心逻辑
识别机制的核心在于比较:将疑似买卖的链接与正常链接的行为表现进行系统对比,从而精准找出其中的异常模式。我的理解是,不同网站和不同来源的链接,必然存在差异化的模式特征。无论站长如何小心掩饰,人类视角通常聚焦局部,难以在脑中构建全局图景;然而通过算法对海量数据进行提炼,那些平常难以察觉的模式与规律便会清晰显现。
朱健飞补充道,发布软文、操控杂乱博客、制造论坛垃圾链接等行为,都是强有力的作弊信号。一个网站频繁涉足这类操作,搜索引擎便能基本认定其在实施链接作弊。
哪种链接具备本质安全属性?
当前,无论是Google还是百度,对链接的接纳标准都在系统性收紧。部分早期尚且有效的外链建设方法(例如免费模板嵌入链接),

健飞同时透露,即将上线的企鹅算法新版本影响范围将非常大。
搜索引擎工程师亲上阵做SEO?
朱健飞坦言,SEO本身并非易事。即便如他本人知晓算法规则且不涉足作弊,想要迅速实现良好的排名依旧非常不易。这需要精心打造内容,更离不开创意加持。本质上,公平的世界本应如此:没有付出心思和努力,哪能坐享优秀成果?
利用垃圾链接,短期内排名飙升固然可能;可一旦被系统检测并施以惩罚,后续清理这些垃圾链接则异常繁琐。即便完全清理干净,网站*终仍需回归本质:凭借高质量内容与创新思维,吸引优质自然链接,以此重建排名——这一关是绕不过去的。
Lee提到如美丽说、蘑菇街等平台,其SEO策略就相当出色,它们既不买卖也不交换链接。他建议同行应深入研究它们的成功之道,而非只把目光锁定某些灰色行业。
针对共同引用或共同出现对排名的影响,朱健飞和Lee都明确予以否定:它们不能取代链接及锚文本的作用,更非排名的直接因素。这是搜索引擎首次对上述猜想给出清晰否认。
王淘对此现象有过精辟解释:一个网站被广泛引用,确能彰显其权威性,而权威性又通常与链接多少成正比,进而带来优质排名。然而真正驱动排名的核心是链接本身,而非单纯提及;只不过在常态下,链接数量与被提及频次往往呈现正相关关系。
我补充说明,这本质上涉及关联现象与因果关系的区分。如同公鸡清晨打鸣与日出东方总是相伴发生(关联现象),但不能据此断言打鸣就是日出之因。
搜索引擎工程师能否运营个人网站?
百度: 内部设有限制政策。员工需严格向内部审计部门报备。一旦发现未报备而私下运营网站,将面临开除。但其实,系统内部人员往往并不擅长网站运营。
Google: 完全开放。工程师建立的个人站点常能反哺算法优化。Google鼓励此类实践,但打造一个好网站本身绝非易事。
竞争对手买外链会“陷害”我吗?
既然买链接、群发外链会招致惩罚,那竞争对手若为我的站点恶意采购垃圾链接意图陷害,能奏效吗?Google过去的官方回应是:此种可能性极低,站长无需过分忧虑。我追问健飞:“可能性小”究竟有多小?理论上是否仍存成功案例?健飞明确回复:至今为止,未发现任何一起“负面SEO”成功陷害竞争对手的真实案例。这是首次听到Google就此问题给出如此清晰的表态。当然,完全排除这种可能性是困难的,只是目前尚无实证。
若SEO人员担忧某些可疑链接可能带来惩罚,可通过Google Search Console(前Webmaster Tool)和百度站长工具中的“拒绝链接”(Disavow Links)功能予以剔除,明确声明非本站所为,从而使其失效。
百度301处理速度为何明显滞后?
这与百度内部技术体系结构密不可分。该系统被划分为众多独立模块,由不同团队负责管理。301重定向策略的改进需要协调多个模块进行变更,自然带来难度。*近,百度在测试一个协同项目,它能显著提升301处理效率,且对其他功能干扰微小。很可能,该项目将随站长平台的某工具近期一并上线。我推测,这个工具或许与“首选域设置”相关。
百度原创识别何时能有实质性改进?
Lee介绍道,百度正全力推进原创识别项目。当前一期版本虽已上线,仅解决了其中一小部分(几个百分点)的问题。原创识别确属长期工程,期望一两年内能获得根本性突破。
与之相关的“原创星火计划”(见于百度2013网站趋势报告),是指百度利用算法辅以人工方式,筛选出优质原创内容网站。此举既用于验证排名算法,也为算法迭代提供素材。我曾误以为此计划类似于SEO可主动加入的联盟项目,实属误解。
泛IP+端口站群作弊的现状回应
关于大量泛IP+端口构成的站群页面常被秒收、排名靠前的现象,百度是否知情?将如何处理?Lee回应表示:发现问题百度一贯力求尽快解决。此次处理周期延长缘于系统内部出现临时性问题。目前该问题已基本解决。
百度自有内容占比高,其他站长如何生存?
包含近期上线的百度微购,以及原有的百科、知道、文库、贴吧、词典等产品,百度自家内容在搜索结果中常占据显著篇幅,令其他站长生存空间倍感压力。
Lee解释道,百度打造这些内容的初衷在于满足用户需求。彼时许多搜索请求缺乏优质结果承接,而外部内容网站并未及时补位。值得关注的是,百度这些内容不仅在其自身平台表现优异,在Google等搜索引擎同样排名靠前,正说明其确实满足了用户需求。推出项目时,百度会依据用户需求,在商业利益与用户体验间寻求平衡点。
这已是百度现阶段能给出的核心解释,显然不足以令众多站长满意。
Site:域名首页不排首位是否代表惩罚?
Lee回应明确:`site:域名`指令下首页未居首位,与网站受惩处关联度不大。原因在于 `site:` 指令本身随机性偏强,它并非专门设计的排序语法。