访谈嘉宾:郑跃平  中山大学政治与公共事务管理学院副教授、博导

访 谈 人:唐 鹏  数旗智酷创始人、首席研究员

(本文内容根据访谈录音整理)

Q:过去三十年,互联网对政府运作形态的影响主要在于“透明政府”、“整体政府”、“服务型政府”的建设,您认为大模型(是否)将进一步对数字政府的未来发展产生哪些根本性的变化?

A:就大政务范畴的发展脉络来看,从80年代至今的办公自动化、政府上网工程、十二金工程,政务服务一体化平台建设、政务移动端、数据治理……等等,几乎每次新技术的出现都会在学界和实务界引发围绕这一话题的广泛讨论。

如果要问大模型是否会给数字政府带来根本性变化,我们可以先回顾过去二十年数字政府领域出现的诸多机遇是否都成功转化成为现实并带来预期效果。答案是否定的,技术的创新不一定会给社会与管理带来进步,它甚至可能会阻碍发展。大模型对数字政府的影响是往左还是往右,是增强服务还是解构能力,这背后的影响因素与机理很复杂,领导力、治理、文化、法治等的差异性都可能带来不同的结果。

过去二十年涌现的新技术,看起来好像都是“颠覆性”的,但最后并没有带来治理的深度创新与变革。因此,需要更多地考虑人与技术协同共演的趋势。技术发展太快,而人的变化与进步是有限度的。人与人之间的规则、秩序、习俗、文化等发展有其自身的规律。一些时候,新技术应用到治理当中,就像铁块砸到了棉花上,用不上力,很难起到明显效果。

目前的大模型应用特征与优势多集中在数据信息的整合分析与交互上。这些多体现为大模型作为技术本身的能力特点,但承载在大模型之上以及集成了大模型相关能力的政务服务是否智慧、是否便捷,这是存疑的,也充满了不确定性。

从目前来看,大模型有可能是弱 AI 到强 AI 的转折点,从一个被动、辅助性的技术“他者”地位,逐渐转变为能力较强并与治理形成相对平等的互动关系。但是否会对政务服务以及政府治理带来根本性的改变,这取决于技术与人以及治理的关系。在英文中,“技术采纳”翻译为 technology adoption,“adopt”本身就有“选择”的意味,选择本身将决定其发挥怎样的作用。

Q:从“搜索即服务”到“对话即服务”,大模型对未来的政务公开、政务服务的模式与体验将产生怎样的影响?

A:从用户侧来看,最大的影响在于数字化的使用门槛大幅降低。过去几年国内兴起的“秒批”、“最多跑一次”等创新模式,看似降低了用户门槛,其实应该注意到,“秒批”和“最多跑一次”实现之前,需要用大量时间和精力去准备材料,这里存在许多隐性要求与成本。而大模型显然可以解决或部分解决这些隐性门槛。

之前我们团队曾开展过针对国内代表性城市政府网站的实验研究,测试各个政府网站的信息服务获取体验。我们发现,一些政府部门网站看起来很漂亮,导航清晰、颜色设计、滚动条、搜索等都不错,信息也很丰富,但这多是供给侧认为的“好网站”。而从需求侧视角来看,政府网站提供了几百上千项服务,但用户却难以找到自己想要的内容。政府网站建设缺乏明确统一的标准,未来要做好数据编目,通过将信息和数据标准化,形成用户可以快速获取服务的索引。

我们团队曾经给大湾区一个城市做过“政务服务一体机”的研究,主要调研为什么政务服务自助办理机使用率低效果不好。调研中发现,不少用户反映服务流程“太复杂”,信息内容多,滚动条太长,一些表述看不懂,信息检索体验差效率低。诸如此类的问题,如果通过大模型具有层次感的对话交互,以及对用户问题的反复判定、递进式甄别和定位需求,这样就可以实现信息获取和供给之间的有效对接。在传统政务服务的信息互动模式下,从A点到B点只有一条路径,门槛高难度大。而大模型可以根据用户自身特点、需求、语言习惯等,逐步引导用户行进在目标路径上。

Q:政府拥有大量的数据资源,哪些类型的数据更适合大模型,公文类应用大模型是否合理?

A:大模型的主要优势在于智能交互以及文本和信息数据的大规模分析。但对于政府机构,落地还是很有难度。公共部门与企业有着天然区别,考虑成本和收益的方式存在明显差异。

比如淘宝、京东这样的电商平台利用大数据推荐可以让每个用户界面不一样,没人去质疑这一做法。但政务服务平台界面如采用类似做法显然不合适。过去这些年,电子政务多参考借鉴了电子商务领域的创新。为什么企业会有很大的创新动力?因为激烈的市场竞争需要它们通过技术采纳获得结构性优势。但这种逻辑在政府侧的影响较弱,公共部门没有盈利目标,竞争环境也大不相同。公共部门不太会去冒险,甚至会尽量规避风险,稳定是治理的基础。对于企业而言,只要带来优势就可以去冒险。对于政府而言,如果不是万无一失,大家都会相对谨慎。

比如前几年流行的政府网站“智能问答”,很大的问题是在知识库的构建和运营。面向用户的交互都是程序化设计,事先准备好的标准化回复。有了大模型的能力辅助后,知识库和知识点的建设要求明显下降,生成式的内容可以通过多种形式来回复和解答。但是,这种创新能力不见得可以在治理场景中很好应用。对于政务大模型而言,如果1000个人问同一个问题,表述方式不一样,他们获得的回复是否会出现差异。如果999个回复是一样的,有1个不一样怎么办?比如我跟B企业同时申请政府的政策补贴优惠,结果他收到了,我没收到,最后相关部门给出的解释是“机器计算”和“智能分析”的结果,这很难有说服力。同时,没有从中获益的用户可能会问:政府用纳税人的钱来提供服务,自己不提供而是交给机器去提供或决定?这是“善政”还是“懒政”?

对于政府部门而言,效率只是一方面的考量,过程的合理性更重要,要考虑合理性、公平性、透明性等多重因素。

所以,如果是利用政务大模型来设计一个惠企、人才或医疗的政策,公众能够接受么?虽然我们以往的政策是人来设计的,依然存在诸多争议,最终我们会诉诸于政府的决策失误,假如未来哪天我们知道了具有缺陷的政策是由机器来设计的,那会怎样?

另外,我们需要关注成本问题。在政务热线领域做一个智能应用,需要几十万甚至上百万的预算。这种规模的预算对于政府机构而言压力是很大的。去海底捞用餐时打电话订座位可以是机器人来回复,互动体验也不错。但将这种互动体验转移到政府侧可能就不行,包括动力、目标、价值导向和成本方面的考量因素都不太一样。

最后一个是责任。在政府运行当中,明确责任是首要的,当决策出现失误或问题的时候,我们难以把责任推卸给机器。

稳定对于治理而言十分重要,但AI 的应用带来许多不确定性,未来两者之间的融合需要重新找到力量平衡。

Q:如何看待大模型在未来政务服务中的创新潜力与应用推进?

A:大模型作为政务服务的一个创新亮点是没问题。但最近的研究发现,政务服务创新的大规模扩散并不顺畅,存在许多阻碍因素。核心问题是:为什么一些地方政府的政务服务创新不希望被人学习?部分原因是公共部门创新没有知识产权保护的制度和机制,而这种创新却又直接与他们的考核、升迁、绩效等密切相关。有些地方的创新不愿意被别人了解和学习,甚至连宣传都不愿意。他们往往需要等打磨得很成熟并得到领导认可创新成效后,再通过媒体报道形成传播效应。要与其他地方拉开“安全距离”,也就是在抄也已经追不上的前提下,才告诉别人“我创新了”,才开始创新的扩散和传播。企业创新有产权商标专利等进行保障,但政府创新有可能出现其他地方来调研学习后回去比你做的还好,创新产权难以保护,由此产生了政府创新不愿意扩散的现实障碍。因此,假如我们认为政务大模型是一种具有潜力的政务服务创新,那么在未来的推广中仍存在很多不确定性。

Q:在城市治理与应急中,大模型可以如何帮助政府机构更好地应对突发事件和紧急情况?

A:很难。数字技术应用于城市治理一般需要划分为2-3个阶段。

首先是识别风险。比如一些舆情或公共事件,在出现之前可能在12345热线已经投诉过,但因为没有及时识别和发现,才导致线下极端事件的出现。所以需要提升对风险隐患的识别能力。

发现问题只是开始,解决问题的流程十分复杂。以应急管理为例,城市应急管理是一个复杂的协同网络,需要几十个部门的联动和快速响应,需要设置相应的权力流程和责任划分机制,而这些是大模型解决不了的。比如公众诉求工单的有效高效流转是困扰了大部分城市的挑战,一个涉及电线杆的问题可能存在十几个类别或情形,每一类问题对应的都是一个部门权力和责任流转与衔接的过程。

最后是权责明晰之后的规范化和标准化。只有权力和责任明确了,规则和秩序理顺了,信息流才能让几十个部门高效联动起来。

而从目前来看,在城市治理场景当中,大模型的主要价值在前半段的“发现问题”,后半程的“解决问题”还发挥不了作用。

Q:大模型将对政务服务、政府决策将产生哪些挑战?如何打破数据歧视、“AI 幻觉”以及对偏见的固化等?

A:回到技术本身来看,当技术可以实现信息的整合、加工、处理和分析并对个人实现赋能之后,人与人、人与组织、组织与组织、政府和企业之间的关系会发生变化。

比如今天的大学生与父母的关系就跟我们上大学时不一样,核心在于获取信息的来源与决策方式的变化。十几年前,我们读大学的时候是听师兄师姐的,因为他们掌握了比我们更多的信息。今天的大学生遇到问题首先会找知乎、小红书,师长和亲戚已经不再是他们的关键信息源。技术赋能让年青一代跟长辈相处的方式也发生变化,他们不再依赖固定信息源和长辈经验。那么,这能说明他们的信息源一定正确吗?决策模式一定更优吗?答案显然是否定的。

也就是说,当大模型具备信息整合、认知判断能力的时候,它给出的决策建议是否一定合理呢?特别是当每个个体都具备了更强的信息整合和认知判断能力,他们拥有不同的价值观与学习背景,他们还能通过大模型参与信息的反馈与重构,这就对政府决策提出了更高的要求。既定的服务和决策方式可能一直在被服务和治理的对象影响与干扰。

我对大模型在政府领域的应用是偏保守的,商业领域应用比政府领域会更快更好。不是“技术行不行”的问题,而是应用过程中的风险。现在的数字技术应用与20年前相比有很大的区别,每往前走一步,成本都在大幅上升,风险呈指数级上升,而社会收益在降低。

此外,我们过度强调和偏好数字化服务方式,是不是线下的服务不行呢?肯定不是。很多事例证明线下服务具有无可取代的优势。先进的技术不代表先进的治理,如何让技术与治理更好地融合是接下来数字政府建设与数字治理的关键议题。