访谈嘉宾:金震宇  大汉软件董事长

访 谈 人:唐   鹏  数旗智酷创始人、首席研究员

Q:您认为AI大模型的出现对未来数字政府的发展将产⽣哪些价值与影响?

A:我们认为,基于神经网络架构和大规模预训练技术的 AI 大模型具备高效计算和智能推理能力,特别是对语义的理解能力有一个质的飞跃。从对数字政府的未来发展来看将会产生非常重要的影响,主要包括以下几个方面:

政府办公方面:大模型将在内部文件的处理、数据收集和报告生成等方面提升政府内部工作效率,使政府能够更好地应对日益增长的工作压力,不仅可以减少内部的人力成本,同时可以创新工作方式和提升决策效率。

政府决策方面:过去的数据辅助政府决策主要通过一些数据算法和决策模型去实现,大模型的出现会使得政府在辅助决策方面更加智能化,比如帮助政府进行预测、评估政策效果、提供决策建议、理解公众需求等。例如12345热线有大量的投诉数据收集上来之后,就可以通过大模型可以进行非结构化数据的分析,生成式大模型可以挖掘和梳理更有价值的数据和建议,为政府辅助决策提供帮助。

数据驱动方面:政府有大量的内部数据和互联网反馈的数据,这些数据维度多且比较分散,大模型可以帮助政府更好地利用这些数据,帮助政府做出更准确科学的决策。因为大模型有一定的逻辑能力和判断能力,可以对数据中潜在的动向和趋势进行分析,洞察数据中潜在的问题或是机会。

隐私和数据管理方面:我们不仅要看到大模型应用会带来隐私和数据管理的问题,同时也应该看到,当前大模型的发展或将帮助政府在安全和隐私保护方面做更多工作。因为大模型有比较强的理解能力,可以在个人隐私和数据不滥用方面发挥作用。只要在推进过程中,政府加强监管,有相应的法律法规措施的保证,可以更好地保护公民的信息安全和隐私权益。当然大模型现在也面临了很多的挑战,比如数据治理、算法偏见、大模型本身透明度问题等。

Q:目前通用大模型给人的感觉是“全知全能”(虽然会出现“AI 幻觉”),而政务大模型更强调“权威可靠”,您认为一个优秀的政务大模型应该具备哪些底线要求或筛选规则?

A:如果以大汉软件的“星汉”大模型而言,我们定位在专业的政务大模型,也就是更贴近政务领域的使用需求。如,面向政策法规不能够有偏差或产生歧义,“星汉”大模型将通过应用模式优化、模型训练、数据治理等方面使得对政务的理解力和专业度更高。

“星汉”大模型引入了传统 NLP 自然语言向量机制,在具体引用法规的时候,并不是让大模型来归纳总结或是组织语言回答,而是会指向我们建立的专业法规库,以确保面向用户的回复内容的权威性。

另外,我们在做大模型训练的时候会针对政府领域多样化的数据集进行训练。比如不同政府部门、不同领域等各种数据集。通过引入更多的数据资源渠道和对领域知识的专业性,以减少“AI 幻觉”。同时,在样本训练的时候,我们会引入负面样本,对明显错误和有问题的数据进行纠正。并且,在做模型训练的时候我们还会引入对抗性样本或对抗性训练的方法,让模型在训练过程中面对具有挑战性的样本,以提高模型的鲁棒性和泛化能力,当然也要把模型的过度拟合和幻觉控制住。再有我们在训练的过程中,还要加强模型的评估,及时发现一些潜在的问题,进行不断修正和完善,这是一个动态过程。

当然,从机制方面而言,更重要的是要加强大模型数据的管理,对含有隐私或者涉及用户安全的数据不能被滥用。所以,政府部门数据应用要建立比较完善的数据管理机制。应当倡导和鼓励政府自建算力和专有的模型,在私域中进行训练和学习。政府还应当加强对模型开发利用和训练过程当中的审查监督报备过程中建立机制,现在国家层面已经开始做这方面工作了。此外,对于模型本身还要具备可追溯和可解释性,特别对于政府的社会治理和公共服务而言,“不可解释”将有可能造成一些行政伦理困境。

Q:从场景角度而言,以政府信息公开、12345热线与帮办导办三个场景为例,从信息获取、互动咨询与业务办理来看,您认为政务大模型的赋能价值分别体现在哪些方面?

A:在政府信息公开方面,我们认为引入大模型之后会产生很多的变化,比如公文撰写、内容合规、内容勘误、公文格式校正、信息公开规范的审核等。另外在依申请公开方面,我们现在很多的依申请公开是靠人工进行处理,引入大模型后,大模型会对申请内容可以进行识别,可以自动审核处理,为申请人提供其需要的内容,降低大量的人工工作。过去公开信息会涉及到不同政府部门,其中一个难点是公众的申请应该分发到哪个部门处理。有了大模型的理解能力后,这个也会变得比较轻松,它可以更快速和准确地进行内容识别并高效地分发到相关部门进行处理。

在12345热线咨询方面,大模型能力的加持后可以判断出之前是否有人已经问过同样的问题。另外我们之前的“智能问答”只能简短地进行格式化回答,通过大模型可以轻松理解用户意图,通过多轮对话的交互来逼近用户的核心诉求,大大减少工作人员工作量。另外,因为人类的语言习惯,口语、俗语、俚语等比较多,传统的智能问答很难做出准确的理解,但大模型可以比较轻松准确地进行回答。另外,12345热线需要建立一个非常全面的知识体系,需要通过人工为知识库“打标签”,有时候不同的人对同一个事物的打的标签还不一样,这样的知识库建立后对后续的服务准确性和效率都会产生影响。但是现在通过大模型的推理逻辑,它可以对这些非结构化的文本非常轻松地进行知识库体系梳理,大大提高对12345热线后台处理咨询问题的支撑能力。

大汉软件开发的江西赣服通中的“小赣事”是通过数字人来帮助用户获取服务,现在加持了生成式 AI 后,数字人在与用户交流的过程中就可以自动判断需要补充哪些内容,比如需要填写表格的时候,“小赣事”就会提醒你需要补充什么信息、数据以及注意事项。如果政务服务平台后台已经存有你的某些数据,那就不需要重复填写了。另外如果需要你补充哪些内容,数字人可以跟你进行交互的问答式帮办,我们称之为“边问边办”。

Q:您认为,对于政府机构而言,政务大模型的应用瓶颈和障碍在哪里?以及如何突破?

A:政府数据分为涉密和非涉密数据,有些数据是对公众可以直接公开的,有些虽然能公开,但是要一定范围内的权限才能查阅。还有就是不能够向公众开放的涉密数据。因此,我们在做大模型的时候主要要解决“数据不出域”的问题,即所有的数据训练在政府内部进行,当然这里面会涉及到算力构建的问题。目前大汉的政务大模型的算力是建立在私域上,我们通过算法优化最大幅度地降低对算力的依赖,使得政府内部“数据不出域”就能够更好地完成。当然,关于涉密数据和重要行业专业数据的安全保障,我认为在大模型训练的方式方法上,也需要有相应的一些管理策略来保证。

现在很多政府机构正在将大模型能力引进到政务服务体系当中来,但是大多数是通过互联网提供大模型服务,这里还不仅仅是数据隐私泄露风险的问题,还有算力能否支撑的问题。在互联网上进行咨询问答的开放式服务,往往会消耗非常高的算力,这个将会造成政府在购买 GPU 算力上的开支不堪重负,所以我们现在也在研究如何尽可能降低对 GPU 的依赖,这在未来大模型领域是必须要攻克的一个难关,因为算力是有限的。

Q:目前全球已有多个国家和城市发布了公共部门的生成式 AI 临时指南或道德框架。从顶层设计而言,您认为我国政务大模型的发展可以做怎样的发展规范与行业指引?

A:我认为首先需要考虑的是政务大模型的数据共享机制。政务领域是一个非常专业的领域,单靠某一个公司或者某一个政府部门来建立是比较困难的,在这个过程当中,我们觉得政府部门应该推动建立政务大模型的数据共享开放机制,制定一个政务大模型的数据利用与训练的标准规范,同时还要提出关于数据隐私保护和数据安全的要求,并对数据共享和管理也要进行监管。

其次,在政务大模型研发和应用方面也要做一些相关的规范。比如对政务大模型的研发应推出备案机制、监管机制与评估机制。同时,在研发的过程中还要鼓励和高校、研究机构、企业的通力合作,把全社会的资源动员起来,才能够建立和完善真正有价值的政务大模型。

还有,对政务大模型还要建立评估机制,并对大模型的数据、算法和应用要进行监督和审查。我觉得目前政务大模型最大的难点还不是算法本身,而是怎么获得有价值、权威的数据资源,因此数据资源本身的管理和共享就变得比较重要。

Q:生成式 AI 应用会不会取代政府门户网站或政务服务平台成为主流应用?对政府信息化系统建设会产生哪些冲击和影响?

A:生成式 AI 或者政务大模型的出现,肯定会对数字政府的建设,包括政府网站、政务服务建设等产生优化和提升。但是对于政务领域而言,大模型的核心价值是延伸和拓展新的应用体验与能力,搜索优化、推荐服务等,它可以帮助传统的政府网站的原有功能全面升级,我觉得不是替代关系。大模型有很好的推理能力、理解能力,能帮助传统的政务服务平台在搜索功能、智能问答、移动政务服务等提升用户交互感受,增强触达效率。生成式 AI 的语言理解、对话能力和多模态能力,有潜力成为未来智慧政务服务的一个非常重要的入口,但不至于取代或成为唯一的入口。

当然在人工智能发展的新形势下政府门户网站也正在发生新的变化,如传统按照栏目逻辑设计的层层嵌套的网站结构正在被抛弃,而智能推荐、个性化触达模式正在成为主流,使得信息的层级更加扁平化。但是,政府门户网站的体系化数据整合能力,以及知识沉淀、资源沉淀能力,我认为都有它存在的必要性和不可替代性。生成式 AI 引入后,它最大的影响可能是激活政府门户网站的数据资源与应用效能,提升资源的触达率、使用率和交互式体验,以更高效、便捷的方式呈现给用户。

此外,在政务服务方面,由于不同年龄、教育水平和使用习惯的不同,很多人还是喜欢通过对话交流来进行政务的咨询或获取服务,因此政务服务平台也需要具备多样性服务的供给能力。生成式 AI 可以进行自然连续的对话,理解复杂问题和多轮对话模式显然会对服务的交互能力会有比较大的提升,服务的价值传递除了功能提升,服务效率的提升,还包括提升服务的体验与温度。