数据和技术本身并不足以构成企业可持续竞争优势的来源,搜集、管理、分析信息,使数据转化为可感知机会/威胁、捕获和塑造机遇、调整和配置资源的动态能力,帮助企业不断重构企业能力,从而维持与外部环境的动态匹配。
从某种意义上讲,信息即权力。而信息往往具有大数据特征、时效特征、非线性方式流动性特征,快速获取、分析、选择、过滤、流动信息,并尽可能多地智能化与自动化完成这个过程,成为企业、个人在领域内获得权力并扩张影响力的重要手段。搜索问答系统,就是这样一种帮助用户快速掌握信息的工具。
从技术与反馈机制的角度来审视,信息获取可以划分为三大类别:搜索引擎、问答系统、交互式问答系统。
搜索引擎系统(Search Engines system ,SES)通过返回与搜索词相关的文档或网页的排序列表来响应用户的查询。问答系统(question-answering system ,QAS)旨在为用户查询提供直接、具体的答案作为回答,而不仅仅是提供链接或参考。二者主要区别就在于输出的性质:SES提供用户可以探索的信息来源(一个按相关性排序的文档列表),而QAS为用户搜索提供一个明确的答案。
随着人工智能的进化,特别是生成人工智能(GenAI)和大型语言模型(LLM)技术的出现,QAS与SES系统之间的界限变得越来越模糊,无论目标是数值型还是文本型、图片型,“搜索即答案”似乎正在到来,以自然语言为接口实现人机交互,这一数据领域的终极理想比以往任何适合都更接近现实。
交互式问答(Interactive Question Answering,IQA) 系统,超越传统的一次性问答模式,让用户参与到动态的、更具互动性的对话。与传统QAS和SES提供单一、孤立的响应不同,IQA系统可以根据正在进行的用户交互跟踪、澄清并提供更细微的响应;基于IQA的互动性,其既可以给出明确的答案,也可以给出相关性文档列表,QAS与SES系统之间的界限在IQA系统中变得模糊,是一种最为理想、友好的搜索问答系统。
本质上,IQA系统是基于知识的即时反馈系统,需要管理对话的“状态”,从而有效地处理引用、对话连续性,确保连贯和人机对话的相关性,例如,最典型的对话中的省略、简称现象。IQA系统,跟踪交互状态的能力增强了系统的实用性,标志着机器如何理解和响应人类语言的重大演变:用户期待搜索系统具备更强的自然语言处理能力、知识融合能力、更高级的信息提取能力、强生成能力、即时处理能力、上下文理解能力。