全部标签

百度搜索研发部

分类描述：

百度搜索研发部官方原介绍：百度搜索研发部官方博客（http://www.baidu-tech.com）由百度搜索研发部创建并维护。我们希望通过网络社区与关注搜索引擎及相关产品的技术人员交流互动，分享百度工程师研究的方向和取得的成果。

注：后貌似在2013年底关停。故而我在互联网中收集整理出部分和搜索引擎相关的内容转发出来，供大家查看。

这些内容对我们了解搜索引擎应该是极具价值的，尤其是当年(那时候我还没接触SEO呢)，不过毕竟是时间很长的文章了，现在部分内容在百度资源平台的一些文档中也有提及。

最新随机最多浏览最多喜欢最多评论

分类：
SEO教程 SEO基础 SEO技巧 SEO服务 SEO话题 SEO资讯 SEO课程 SEO赚钱 SEO问答 HTML和SEO Python与SEO WordPress与SEO 百度官方内容百度搜索研发部百度搜索资源平台

百度搜索研发部百度官方内容

如何根据http请求信息区分访问用户的国家、语言信息

是不是见到google，facebook等大型专业网站的拥有不同的语言站群，可以不同语言间切换很给力？而我们只能羡慕嫉妒恨呢？今天要介绍的就是如何识别不同国家，只需要简单几步，就能识别出来自不同国家的请求，使你的web应用更有国际范。国家识别主要用到的是http header中的host，Accept-Language，cookie以及请求的url，ip等。下面先温习下http header…...
- 塵風
- 22年6月19日
- 0
- 0
- 1k
百度搜索研发部百度官方内容

基于hash计算的多层实验流量切分的实现

1. 背景介绍站点新功能或者是站内新策略开发完毕之后，在全流量上线之前要评估新功能或者新策略的优劣，常用的评估方法是A-B测试，做法是在全量中抽样出两份小流量，分别走新策略分支和旧策略分支，通过对比这两份流量下的各指标的差异，我们可以评估出…...
- 塵風
- 22年6月3日
- 0
- 0
- 958
百度搜索研发部百度官方内容

若无云，岂有风——词语语义相似度计算简介

诸多事物都要受到其周边事物的影响，进而改变自身的形态，甚至确立自己的存在——云动，方知风的存在。反映在人的眼中，则是云赋予了风的含义：若无云，岂有风？ 0. 动机武林高手经常从山川之间顿悟，并由山川之形变化出上乘武艺。风云之间的飘渺互动，实则也为实打实的科学、工程实践提供了指引。风是客观存在的，而只有籍由云，我们才能观察到它。在技术领域的日常工作中，诸如此类的例子数不胜数。而在自然语言语义的研究…...
- 塵風
- 22年6月25日
- 0
- 0
- 991
百度搜索研发部百度官方内容

浅谈互联网页面价值

搜索引擎每天处理着数以亿计的查询请求，每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候，通过查询返回的网页结果，这些需求被满足了，我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言，页面的价值是指什么，我们为什么要研究页面价值，技术上怎样判断页面的价值呢？本文将逐一回答这些问题。一、什么是页面价值前面我们说了，某个页面满足了某一用户的特定需求，就体…...
- 塵風
- 22年5月25日
- 0
- 0
- 662
百度搜索研发部百度官方内容

“分布式哈希”和“一致性哈希”的概念与算法实现

分布式哈希和一致性哈希是分布式存储和p2p网络中说的比较多的两个概念了。介绍的论文很多，这里做一个入门性质的介绍。　　分布式哈希(DHT)　　两个key point：每个节点只维护一部分路由；每个节点只存储一部分数据。从而实现整个网络中的寻址和存储。DHT只是一个概念，提出了这样一种网络模型。并且说明它是对分布式存储很有好处的。但具体怎么实现，并不是DHT的范畴。　　一致性哈希：　　DHT的一…...
- 塵風
- 22年6月3日
- 0
- 0
- 741
百度搜索研发部百度官方内容

索引页链接补全机制的一种方法

背景 Spider位于搜索引擎数据流的最上游，负责将互联网上的资源采集到本地，提供给后续检索使用，是搜索引擎的最主要数据来源之一。spider系统的目标就是发现并抓取互联网中一切有价值的网页，为达到这个目标，首先就是发现有价值网页的链接，当前spider有多种链接发现机制来尽量快而全的发现资源链接，本文主要描述其中一种针对特定索引页的链接补全机制，并给出对这种特定类型的索引页面的建议处理规范用于优…...
- 塵風
- 22年6月26日
- 0
- 0
- 889
百度搜索研发部百度官方内容

以求医为例谈搜索引擎排序算法的基础原理

我们向搜索引擎提交一个查询，搜索引擎会从先到后列出大量的结果，这些结果排序的标准是什么呢？这个看似简单的问题，却是信息检索专家们研究的核心难题之一。为了说明这个问题，我们来研究一个比搜索引擎更加古老的话题：求医。比如，如果我牙疼，应该去看怎样的医生呢？假设我只有三种选择： A医生，既治眼病，又治胃病；B医生，既治牙病，又治胃病，还治眼病；C医生，专治牙病。 A医生肯定不在考虑之列。B医生和C医生…...
- 塵風
- 22年5月25日
- 0
- 0
- 699

TOP1

谷歌浏览器(Google Chrome)各版本以及历史版本下载
23年8月22日
TOP2

Python爬虫报错：(Caused by SSLError(SSLEOFError(8, ‘EOF occurred in violation of protocol (_ssl.c:1129)’)))解决
22年6月26日
TOP3

命令（CMD）终端的清屏/清空命令/快捷键
22年8月21日
下/卸载鲁大师后浏览器主页被篡改为360导航的解决方法
22年12月11日
Windows10系统电脑日历添加节假日信息
22年7月30日
彻底禁止Windows10系统自动更新方法
22年10月4日