Google Search 引入知识图谱:事物,而非字符串
本文介绍了 Google 的知识图谱(Knowledge Graph),它是一个理解现实世界实体及其关系的智能模型,旨在帮助用户更快速、便捷地发现新信息。知识图谱通过理解实体之间的关系,而不是仅仅匹配关键词,为搜索结果提供更准确、更相关的答案。 知识图谱包含超过 5 亿个对象和超过 35 亿个关于这些对象之间的关系的事实。 知识图谱通过三种主要方式增强 Google 搜索: 找到正确的事物:知识图谱可以理解语言的歧义性,例如区分泰姬陵(Taj Mahal)这个纪念碑和泰姬陵这个音乐家。 获取最佳摘要:知识图谱可以更好地理解用户的查询,从而提供相关内容的摘要,包括用户可能需要的关键事实。 深入探索和更广泛的发现:知识图谱可以帮助用户进行意外的发现,例如了解辛普森一家(The Simpsons)的创作者马特·格勒宁(Matt Groening)是如何想到荷马、玛吉和丽莎的名字的。 Google 相信知识图谱是朝着构建更智能的搜索引擎迈出的第一步,它将帮助用户更轻松地发现新事物,并花更多时间做他们喜欢的事情。 引入知识图谱:事物,而非字符串 搜索主要是为了发现——满足人类学习和拓展视野的基本需求。但用户在搜索时仍然需要付出大量的努力。因此,今天我非常兴奋地推出知识图谱,它将帮助你快速且轻松地发现新信息。 举个例子,比如查询 [taj mahal]。四十多年来,搜索基本上就是将关键词匹配到查询上。对搜索引擎来说,[taj mahal] 这两个词仅仅是两个词。 但我们都知道 [taj mahal] 有着更丰富的含义。你可能会想到世界上最美丽的纪念碑之一,或是一位格莱美奖得主音乐家,甚至是新泽西州大西洋城的一家赌场。或者,取决于你上次吃饭的时间,可能是最近的印度餐馆。这就是为什么我们一直在研究一个智能模型——用专业术语来说,就是一个“图谱”——它理解现实世界的实体及其相互关系:事物,而非字符串。 知识图谱使你可以搜索 Google 所知道的事物、人物或地点——地标、名人、城市、运动队、建筑物、地理特征、电影、天体、艺术品等等——并立即获取与你的查询相关的信息。这是构建下一代搜索的关键第一步,它利用了网络的集体智慧,并以更接近人类的方式理解世界。 Google 的知识图谱不仅根植于 Freebase、Wikipedia 和 CIA World Factbook 等公共资源。它还在更大规模上得到增强——因为我们专注于全面的广度和深度。目前它包含超过 5 亿个实体,以及超过 35 亿个关于这些不同实体的事实和关系。并且它基于人们搜索的内容以及我们在网上发现的内容进行调优。 知识图谱在以下三个主要方面增强了 Google 搜索: 1. 找到正确的内容 语言可能会引起歧义——你指的是泰姬陵纪念碑,还是音乐家泰姬陵?现在 Google 能理解这种差异,可以将搜索结果缩小到你想要的那个——只需点击其中一个链接即可查看特定的结果: 这是知识图谱使 Google 搜索更智能的方式之一——你的结果更加相关,因为我们理解这些实体及其含义的细微差别,就像你一样。 2. 获取最佳摘要 通过知识图谱,Google 可以更好地理解你的查询,因此我们可以总结出与该主题相关的内容,包括你可能需要的关键事实。例如,如果你在寻找玛丽·居里,你会看到她的出生和死亡日期,但你也会得到有关她的教育和科学发现的详细信息: 我们如何知道每个项目最可能需要哪些事实?为此,我们回到用户,整体研究他们向 Google 询问的每个项目。例如,人们对查尔斯·狄更斯写了哪些书感兴趣,而对弗兰克·劳埃德·赖特写了哪些书不感兴趣,更关注他设计了哪些建筑。 知识图谱还帮助我们理解事物之间的关系。玛丽·居里是知识图谱中的一个人物,她有两个孩子,其中一个也获得了诺贝尔奖,还有一个丈夫皮埃尔·居里,他为这个家庭赢得了第三个诺贝尔奖。所有这些都在我们的图谱中链接在一起。它不仅是一个对象目录,还建模了所有这些相互关系。不同实体之间的智能是关键。 3. 更深入和更广泛 最后,也是最有趣的部分——知识图谱可以帮助你进行一些意外的发现。你可能会学到一个新的事实或新的联系,从而引发一整条新的查询路线。你知道《辛普森一家》的创作者 Matt Groening 是从哪里得到霍默、玛吉和丽莎的名字灵感的吗?这是一个有点令人惊讶的地方:...