
访谈嘉宾:郑 磊 复旦大学国际关系与公共事务学院教授、博导
访 谈 人:唐 鹏 数旗智酷创始人、首席研究员
(本文内容根据访谈录音整理)
Q:您认为大模型介入数字政府领域后将会对政府运作形态发展产生哪些重要影响?
A:目前来看,大模型将有可能改变政府和公众间的互动和服务方式:过去更多是通过线下窗口、电话热线、网站访问等方式来进行政民互动。政府网站或政务服务平台通过各个频道栏目把信息整理好归类到一个界面下来进行互动,相对而言,内容有限且答案都是标准化的。
未来大语言模型发展到一定程度,公众跟政府都通过大语言模型驱动的聊天窗口来进行互动,那么我们可能需要考虑“政府门户网站”是否必要或其存在形态将会变成什么样?我们在调研时发现,过去政务公开模式存在的一个矛盾是,政府发布的文件都要非常严谨、规范,都是“法言法语”和“官言官语”,不能让人找到一点问题,因为一旦出现问题是需要有人负责的。但是这样就会让公众觉得政府不说“人话”了,大部分人看不懂政策文件内容,需要自己再解读或通过专家、媒体来解读。如果大语言模型能够将法言法语“翻译”成既能符合规范要求又能让人听懂的“人话”,那么,公众就可以通过提问的方式去与政府互动了。因此,我个人认为,大语言模型应用的逐步成熟将能用来支撑政策发布、政策解读、互动问答、市长信箱、12345热线等工作的创新发展。
我们也反对直接将一个所谓的“政务服务机器人”直接推到公众面前,其原因是,首先,这两年我们能看到,一些政务咨询问答机器人的回答哪怕是对的,但是语气是冰冷的,是没有温度的,这对公众的互动体验是有影响的;其次是机器回答还是机械的,是不会关心回答对象的状态、语气或情绪的,缺乏个性化服务模式。如今,大语言模型的迅速发展极大提升了机器模拟人的水平,包括对话的连贯流畅、语言风格的自然通俗等方面都取得了进步,但距离实现与公众在情感上的同理与共鸣仍有差距。如何让政府与公众之间的互动实现情绪共振,这是一个难点。
所以,我们在《从技术“玩具”到治理工具:将 ChatGPT 引入公共治理领域的风险与策略》一文中建议政府如果使用大语言模型,最好先做一道防护栏作为一个缓冲带,不要让机器直接面对公众,需要“人”去为机器的行为进行把关。比如12345热线,公众是的确碰到问题了才会拨打热线寻求帮助,那么当他遇到一个冰冷的机器做出对解决问题没有实际帮助的回答,这只会加剧而不是缓解人的情绪爆发。比如日本最近做了一个机器人照顾老人的研究发现,一旦老人知道对方是机器人就达不到安慰效果,相比机器人,一个真实的宠物狗的抚慰作用更大。
如果由人来作为大模型应用的缓冲,第一是能带来情感价值,第二是可以做相应的审核检查,确保不发生有违底线的风险问题。大模型在政务领域的应用需要“人”来做一个守门员和一个情感的赋能者。
比如12345热线,未来我们可以通过大语言模型去替代过去的知识库,让大语言模型去赋能于接线员,然后再通过接线员来与市民进行互动交流。但如果因此就让加入了大语言模型的能力的12345热线直接去面对公众可能并不会带来更好的服务,大语言模型没有情商,现阶段解决真实社会生活中复杂问题的能力也很有限。
要让大语言模型“从玩具变为工具”还有很多工作要做。将大语言模型应用到政务服务、政民互动、政府决策上有很大的潜力,它能在一定程度上提醒人和激发人的观点,让人注意到没有想到或没有想全的地方。比如我们要写一份报告或一本书,我们首先可以用 ChatGPT 来回答一遍,然后结合我们自己的理解与研究进行修订和完善,这能带来效率的提升,用完之后你或许会发现人类的知识其实70-80%都在重复。另外,我们一定不能照搬 ChatGPT 生成的内容,它是看似“正确”但缺乏感染力与体系性。只有“人”才能打动人,人的因素的加入才能创造或生成另一个具有情感因子的事物去感染人。我有一位做瓷器修复的老师朋友就说“用机器画一条直线是最直的,机器画一个圆也是最圆的,但是人努力画一个圆和直线是更能打动人的”。人所能达到的极致虽然不能也永远达不到机器达到的极致,但是人更能打动人心,这就是手工画和机器画的感染力就是不一样。今天我们来理解大语言模型的价值也是同样的道理。
Q:我们经常提出构建“有温度的政府”,核心其实就是针对数字化体验而言的。大模型的技术特征与能力似乎在推动智能互动逐渐远离“智障化”,但有时又因为内容泛化造成“过度人性化”(AI 幻觉),您如何看待其对政务服务领域的影响?
A:这么多年以来,政府无论在新闻发布会、政府网站还是社交媒体,它来回应公众的问题都是“非人格化”模式,因为任何政府的公共形象或服务载体都代表的是一个组织、一个权威主体,而不是个人,人们期望你的一切回答都是规范的、权威的、准确的。
大语言模型的人格化肯定是人工智能发展进程中重要进步,但是对政府和公众的互动来说这可能恰恰是一个缺点。比如我们看到的新闻发布会,每个发言人在发布会之前都要准备很多资料和进行很多演练,因为作为政府的发言人,他是代表政府甚至整个国家来出现的,不是代表他自己这个人,他是“非人格化”的,人们期待他的发言和行为是不能有差错的,在不说错话的前提下再追求出彩,如果出错的话,那出彩就是出丑了。这里就存在一个矛盾,我们在用大语言模型的时候怎么把握好这两个平衡点,代表政府的大语言模型,我们既希望它不要像机器一样冰冷的表达,又能在人格化的同时保持机构的“非人格化”的权威性,这是一个难点。
Q:目前很多人已经将大模型应用到论文、公文等文本的写作,但一部分人认为其“写作能力”超越人的能力,另一部分观点认为基于已有数据的训练无法写出有创见的内容。您怎么看待这种现象?
A:从我的个人感受来讲,我们起草一个公文或相对标准化的文本,我们往往要花费很大的精力去写一些不得不写的“废话”,这些“废话”看似无用但又显得不可或缺,这些套路化的内容就可以先通过机器去生成,而真正需要人的创造力来完善和提升的内容可以留给我们自己来写或改。比如我们要写一个部门年终工作总结,可以用机器帮我们把一些格式化的内容写出来,然后自己再补充必要的数据、观点和“金句”,这样对提升工作效率是有帮助的,因为在日常工作中,我们会发现一些工作文稿中的50%套话或格式化内容也是需要花费很长时间来完成的。但如果我们因此就将整个文本完全交给机器去写肯定是没有灵魂的。就像前面所讲的,用圆规去画一个圆,这个圆一定是最标准的,但用人手去画一个圆,虽然有所残缺,但这个圆是有灵魂有个性的。我认为,当我们将大模型的能力加入到思想文化产品的生产过程中时,面临的也是同样的问题。
Q:您认为目前大模型在政务领域的成熟场景有哪些?
A:对于政务领域而言,我觉得这里主要有两个场景可以关注,一是政务互动方面,比如12345热线,接线员在接到问题咨询的时候,可以让大语言模型去识别其中重要的信息,比如有的12345热线接线员接到问题可能会派错单,那么经过预训练的大语言模型则可以基于对各个部门的职责及流程的理解,支撑接线员更高效地完成工作。二是舆情感知方面,我们之前主要都是借助一些算法针对关键词、敏感词的权重来判断某个社情民意是否出现了,但问题是目前网络语言、关键词、梗等更新非常迅速,这导致关键词的更新速度赶不上网络舆情形势变化的速度,通过调整关键词权重或更新数据标签也达不到预想的效果。因此,如果借助大语言模型去分析更多的句类和近似的词,可以更准确、敏感地获取舆情信息,第一时间了解到老百姓的关注点和真实想法。大语言模型利用神经网络的理解和推理能力,显然要胜过关键词词库的机械的筛选能力。
Q:如何评价大模型应用于城市治理领域的价值与影响?比如能不能改善当前城市应急的现状?
A:城市运行的情况总是瞬息万变的,应急预案做得再好,能完全对应并且真正产生实效的情况也是少数。“一网统管”比“一网通办”难的一个点就难在“多变性”,城市治理是没有标准答案的。如果我们提前就能穷尽城市治理中可能遇到的所有问题,以及与这种可能性相关的条件都放进语料库里去训练大语言模型,这当然最好,但这是不可能的。大语言模型不只是对已有数据的训练,同时还要不断吸纳人在交互中新反馈出来的数据,因此作为”驯兽师“的人如何与机器进行的交互能力也十分重要,需要训练人跟机器的交互能力,不仅要善于向机器提问,机器给出结果后,人还要有鉴别的能力。我们会看到各地都会制定一些城市应急预案,明确遇到什么情况将采取怎样的应急流程,但计划永远赶不上变化。但有了大语言模型,就没必要提前为每一种未知的情况写好预案了,而是在底层将历史的和未来可能的应急情况与处理方式输入进去,并且不断地去训练模型,一旦发生应急事件时需要有善于提问的人去跟模型交互,这样给出的应急方案才可能比之前那些“预设假定”的应急预案更有用。因为大模型是交互式的,而原来所有的应急预案都是菜单式的。在城市治理领域,要让大模型发挥价值,可能需要我们在平时就不断训练人与机器的交互,人机都需要训练,将这种人机互动的演练与城市实景应急演练并行开展,这样就有可能在城市真实的应急场景中发挥更大价值。
Q:大模型的发展是否会对当前政务数据信息资源的管理与应用模式产生改变?
A:我觉得大语言模型的崛起将有可能从根本上改变人们对信息的获取与理解方式。未来人们对知识的获取和学习方式将不再是“栏目化”模式。比如以前我们编的教材、教案、字典等都是按分类方式,就像开百宝箱一样,打开一层还有一层,网站也是按栏目方式去查找内容。而大语言模型是交互形式,你可以不根据别人定好的分类直接从词海中捞出你想要的内容。而从目前来看,不管是政府门户网站还是其它应用,它们的价值都是通过事先的信息分类存储的方式来展现。大模型会推动这种信息分类存储方式如何转型或演变,未来可能在信息管理领域有新的理论来解释。
过去我们是通过“打标签”来找到想要的类目,而不是直接获取内容。未来的知识储存在底层,可能就像一个”黑箱“,只要我们通过各种智能工具有本事把它捞出来就行了,而不需要事先去考虑信息获取的路径、类目等问题。我记得一个来自加拿大的从事计算机研究的老师讲到,“你们在说的‘信息共享’就是‘我要你的信息”,而要达到这个目的,背后就要为“可用不可见”、“数据汇聚”等设计一套规则。他假设是你一旦拿到这个信息一定存在两种可能:为善和作恶。未来如果用大语言模型进行信息共享,大家的信息和数据都可以不用拿走了,都汇聚到这个“黑箱”中,黑箱中是什么,谁都看不到,但只要你输入想要的内容,它能输出答案为你的工作提供支撑就行了。数据使用者不用接触原始数据,“什么不能输出”这个底线也提前设置好,这样就不需要像原来那样去建立很多系统、平台去推动“数据本身的共享”了。所以,我们可以再畅想一下,未来的政府应用如果继续存在,那界面可能是“干干净净”的,所有的信息都在底层和后台,用户通过大语言模型聊天窗口直接对话获取内容,也可能通过类似 Siri 这种语音形式直接进行对话。
Q:有专家认为大模型取代政府门户网站比较难实现,但是和人形机器人结合之后所产生的影响可能会超出我们的预料,比如颠覆现有的政务服务体验。你怎么看待这个说法?
A:之前人们总觉得“机器人一定要像人”,但是我觉得不一定要这样。机器人不一定要长得像人,但是思维要像人,要能服务于人。人形机器人如果做得不好可能就会有“恐怖谷效应”。如果一定要说机器人要像人,那也应该是在某个特定场景下,比如服务行业。我们看到有些政务服务中心的对话机器人,有时候我在想,干嘛非要做个有手有脚的人形机器人呢?只是作为一个导航、咨询助手就一定需要仿照人的体貌特征么?我们如果不需要这个机器人给人递送物品,那么两只手存在的价值在哪里?当然,人跟机器交互的心理也需要心理学家去研究,我认为某些情况或场景下其实只需要一个屏幕或语音对话装置就行了。“像不像人”并不决定机器人最终的服务质量与效果。
Q:假若大模型成为一种主流的政务服务入口与应用,您认为(是否)将对现有的政府信息化系统产生什么影响?
A:我觉得会有影响,可能还是颠覆式的影响。如果大语言模型这一套交互体验得到广泛应用,那么很多现行的信息管理模式都不一定适用了,比如围绕促进信息共享的数据中心等这套机制就可能面临变革了,可能更需要的是模型中心了。未来数据共享在逻辑上形成一个可供调用的共同语料库就行了,不一定非要汇聚了。那么有些大数据中心原来强调“聚、通、用”这样的模式和流程就没必要了,“通、用”还需要,但是通过编目分类来“聚”就不需要了。用户获取数据和信息的界面与方式不同了,底层的数据资源组织方式就会相应发生变化。如果大语言模型成为一种主流的政务服务应用,那么,数字政务平台的应用层、数据层就可能都不再需要按照分类分栏目分页面的方式进行,这些变化是值得观察和期待的。以上都是个人的一些不成熟的“胡思乱想”,还需要继续观察和探讨。