|
Post by account_disabled on Dec 24, 2023 9:05:09 GMT 1
-质量相关标签,以提高搜索查询和内容的一致性。 Google 和 Bing 都在相关性标签方面投入了大量资金,以塑造搜索结果的感知质量。多年来,在这样做的过程中,他们面临着一个困境——确保获取标签的可扩展性,同时保证这些标签的准确性。对于任何开发现代搜索引擎的人来说,相关性标签都是一个复杂的挑战,而这项工作的一部分可以使用合成数据(人工创建的信息)完全自动化,这一想法简直是变革性的。让我介绍一个新的免费工具,该工具可以利用 Bing 团队的见解来评估查询与网页内容之间的匹配度。 我对论文中提出的设置进行了逆向工程,正如 Victor Pan 在 Twitter 帖子中指出的那样。 如何使用搜索意图优化工具 添加您要分析的网页的 URL。 提供页面旨在排名的查询。 输入搜索意图,这是用户所需信息背后的叙述。 我们提供了一个简单的红绿灯系统来显示您的内容与搜索意图的匹配程度。 衡量内容与查询意图的匹配程度。 ( T ) 表示网页的可信度。 ( O ) 考虑到上述各方面以 手机号码数据 及每个方面的相对重要性,给出的分数如下: 2 = 高度相关,对此查询非常有帮助 1 = 相关,可能有部分帮助,但可能包含其他不相关的内容 0 = 不相关,不应为此查询显示 让我们运行一个快速验证测试 虽然我们仍在努力进行更广泛的验证测试,但实验的设置方式如下: 我们正在寻找我们网站上博客文章背后排名最高和排名最低的查询(及其搜索意图); 我们正在评估该工具如何考虑这两类查询; 我们手动标记内容和查询(基本事实)之间的匹配,并且我们正在分析人工标签和合成数据之间的差距。 确切的页面(关于如何获取知识面板的博客文章)虽然值得信赖,但显然与查询“如何获取知识面板”很好匹配,并且与查询“制作carbonara”完全不匹配(好吧,这个很简单)。 在AI 抄袭的博客文章中,该工具找到了查询“ai 抄袭检查器”的相关性,但仅找到了与查询“图灵测试”相关的部分内容。 目前的限制 虽然此工具是免费的,但不能保证其持续可用性。它使用WordLift Inspector API进行操作,该 API 目前不支持 JavaScript 渲染。因此,如果您正在分析使用 JavaScript 客户端呈现的网页,则该工具将无法运行。我精心复制了论文中描述的相同配置(Azure OpenAI 上的 GPT-4),但系统当前在单个实例上运行,您必须耐心等待最终结果。 我们从微软的研究中学到了什么 相关性标签对于评估搜索系统至关重要,传统上来自第三方标签商。然而,如果贴标商需要掌握用户需求,这可能会导致质量低于标准。该论文建议,采用富含直接用户反馈的大型语言模型(LLM)可以生成卓越的相关性标签。对 TREC-Robust 数据的试验表明,LLM 衍生的标签可以媲美或超越人类的准确性。
|
|