任何认识我的人都知道,我非常喜欢阅读 Google 专利——或者,当我感到懒惰时,阅读 Bill Slawski 在他的博客 SEO By The Sea 上对它们的分析。我也对那些涉及实体的东西特别感兴趣,因为它们(至少对我而言)定义了谷歌试图解决的问题。随着机器学习的发展,实体越来越多地代表搜索引擎如何看待世界。在深入研究这项于 2016 年 12 月 22 日授予的最新 Google 专利之前,让我们首先定义一个实体以确保我们都在同一个页面上。根据专利,定义如下:[A]n 实体是一个单一的、唯一的、明确定义和可区分的事物或概念。例如,实体可以是人、地点、对象、想法、抽象概念、具体项目、其他相关事物或其任意组合。

为简单起见,您可以将实体视为名词

为简单起见,您可以将实体视为名词。 另一个需要理解的重要定义是非结构化数据的定义,它在维基百科中的定义非常精确:非结构化数据……是指没有预定义数据模型或未以预定义方式组织的信息。有了这些,我们将直接进入专利。这篇文章的结构方式,我将用斜体字包括专利重要部分的确切措辞,然后解释每个部分的含义。抽象的 提供了用于组协调的方法、乌干达电话号码  系统和计算机可读介质。在一些实现中,接收请求,该请求至少部分地与实体类型相关联。至少部分地基于查询生成一个或多个搜索结果。检索与至少一个搜索结果的至少一个搜索结果相关联的先前生成的数据,该数据包括至少一个搜索结果中对应于实体类型的一个或多个实体引用。

对一个或多个实体引用进行排名

 

乌干达电话号码列表

对一个或多个实体引用进行排名,并且至少部分地基于排名从一个或多个实体引用中选择实体结果。至少部分地基于实体的结果提供对查询的响应。这是几乎没有描述专利所包含内容的全部范围的摘要之一。至于摘要,我们将要阅读的只是对实体进行排名,而排名决定了查询的答案。这足以引诱我进入专利,而且它确实是准确的 – 但正如您很快就会看到的那样,里面的描述比简单的“我们正在申请名称”要多得多。概括 以下摘录包含在专利的摘要部分中。 分区 2 [A] 系统基于与搜索结果相关联的非结构化数据识别的实体引用为自然语言搜索查询提供答案。 …[T]系统从至少一些搜索结果中检索与每个相应网页相关的附加预处理信息…附加信息包括,例如,出现在网页中的人的姓名。在一个示例中,为了回答“谁”问题,系统编译出现在前十名搜索结果中的姓名,如附加信息中所标识的。系统将最常见的名称识别为答案… 在上面的片段中,我们开始看到系统背后的方法。什么G

Leave a Reply

Your email address will not be published. Required fields are marked *