余茂玉等 法律基座大模型的建构路径与应用展望

余茂玉等 || 法律基座大模型的建构路径与应用展望

原创 余茂玉等 数字法治杂志

《数字法治》

descript

《数字法治》由最高人民法院主管,人民法院出版社主办,最高人民法院民事审判第三庭、研究室、审判管理办公室协办,作为全国性数字法治领域唯一的学术期刊,已与“中国知网”和“北大法宝”就数字出版开展合作,是人大复印报刊资料重要转载期刊。

为方便阅读,省却注释。全文请参见《数字法治》2025年第1期,转载或引用请注明出处。点击上图即可购买本刊。

descript


法律基座大模型的建构路径与应用展望


余茂玉【人民法院出版社总编辑】

林志农【人民法院出版社副总编辑、人民法院电子音像出版社社长】

张承兵【人民法院出版社总编辑助理、人民法院电子音像出版社副总编辑】

石   鹏【人民法院电子音像出版社副社长】

目次

一、大模型技术与法律行业高度适配

(一)国家战略大力推进

(二)行业特性供需迫切

二、法律行业需要基座大模型

(一)法律大数据语料来源的规模性和合规性要求

(二)法律行业国家安全和内容安全的要求

(三)法律行业的专业性、规范性要求

(四)司法伦理和责任的要求

(五)法律行业获得科技能力供给和人民群众获得法律服务的要求

三、法律基座大模型的架构设计和建设路径

(一)统筹规划顶层设计

(二)安全合规汇聚模型语料

(三)建立全环节内容安全机制体系

(四)配套规范、科学化的评测体系

(五)搭建专业、规范化的知识工程体系

(六)有效落实国家公共数据战略

四、法律基座大模型的应用展望


内容提要:在科技创新的浪潮中,人工智能受到国家战略层面的高度重视,法律行业也积极探索与大语言模型的融合,相关政策陆续出台。然而,法律行业应用大语言模型面临诸多挑战,包括数据合规性存疑、内容安全受到威胁、专业性难以保障以及司法责任界定不明等问题。本文聚焦于法律基座大模型在法律行业的构建路径与发展。首先,从国家战略大力推进以及行业特性导致供需迫切这两个维度,深入阐述了大语言模型技术与法律行业的高度适配性。其次,结合法律行业的特殊性,论证了构建法律基座大模型的必要性,并详细分析了其在数据语料、内容安全、专业性和司法伦理、行业的稳定安全供给和便捷普惠满足公众的需求等方面的具体要求。在此基础上,从顶层设计、分类汇聚语料、建立安全机制、配套评测体系以及搭建知识工程、落实国家公共数据战略等多个维度,提出了法律基座大模型的架构路径,并揭示了法律基座大模型能够为法律行业提供强有力的支撑,在技术和应用层面展现出广阔的前景。法律基座大模型不仅能够提供多样化的法律服务,还有助于促进公正司法和法治建设,推动社会主义司法文明迈向更高水平。

关键词:法律大模型 基座大模型 法律大数据 知识工程 司法伦理


一、大模型技术与法律行业高度适配

(一)

国家战略大力推进

当前,科技创新、技术迭代正加速推进,大语言模型已成为推动人工智能技术进步的关键动力之一,并广泛影响包括法律行业的社会各个方面。党的十八大以来,以习近平同志为核心的党中央高度重视人工智能的发展,多次从国家战略高度强调人工智能对于引领科技革命、推动产业变革的价值和意义。习近平主席指出,人工智能是引领新一轮科技革命和产业变革的重要驱动力,正深刻改变着人们的生产、生活、学习方式,推动人类社会迎来人机协同、跨界融合、共创分享的智能时代。2023年2月,中共中央、国务院印发《数字中国建设整体布局规划》,明确要求“强化数字技术创新体系和数字安全屏障‘两大能力’”。党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》明确作出“完善生成式人工智能发展和管理机制”“建立人工智能安全监管制度”等重要部署。2023年7月,国家网信办等七部门发布《生成式人工智能服务管理暂行办法》。2023年10月,工业和信息化部等六部门印发《算力基础设施高质量发展行动计划》。2024年12月,国家发展改革委等四部门发布《关于促进数据标注产业高质量发展的实施意见》。国家政策的密集出台,显示了从国家战略发展层面,我国在推动人工智能更好地服务经济社会发展、为实现中国式现代化注入强大动力的积极探索与坚定决心。

具体到司法工作,习近平总书记在2019年1月召开的中央政法工作会议上指出“推动大数据、人工智能等科技创新成果同司法工作深度融合”。2022年12月,《最高人民法院关于规范和加强人工智能司法应用的意见》提出,“加快推进人工智能技术与审判执行、诉讼服务、司法管理和服务社会治理等工作的深度融合,规范司法人工智能技术应用,提升人工智能司法应用实效”。2024年12月,最高人民法院发布《人民法院第六个五年改革纲要(2024—2028年)》明确要求,深入拓展数字技术司法应用场景,加强审判领域技术自主创新,强化智能算法、大语言模型、数字模型等技术应用,充分发挥人工智能技术辅助办案、集约事务、防控风险、方便诉讼等作用。未来法治建设将更加紧密地与人工智能等先进技术结合,行业也将迎来智能化变革。

(二)

 行业特性供需迫切

1.法律行业特性内生性需求大模型技术

法律行业是一个高质量文本密集型行业,在深入贯彻落实习近平法治思想,贯彻落实党的二十大和二十届二中、三中全会战略部署,不断深化和规范司法公开的过程中,法律法规、司法案例、合同样本等得以持续、有序公开,标准化、逻辑性强的高质量法律文本也得以大量汇聚。同时,法律行业又是专业知识密集型行业,其专业信息密度高、专业认知形成过程长、专业知识的应用高度依赖专业人员,是知识含量高和极其复杂型的专业领域。专业知识和行业数据为擅长处理和理解大量文本的大模型技术提供了丰富的预训练语料,与法律行业的信息密集性质高度匹配,通过训练,大模型技术更易在这一领域“触类旁通、智慧涌现”。“大模型落地千行百业,最成功的会是创造型和知识密集型产业。” 

2.法律行业供需大模型应用匹配

从行业需求看,法律行业存在信息更新快和不对称,文书起草、法案检索等重复性任务比重大,专业性门槛和法律服务成本高,整体知识运用效率不足等问题,这些都给大模型技术在法律行业的应用提供了丰富的场景需求。2023年以来,我国法律行业发布的各类法律大模型及衍生产品就有十余个(见表1),说明法律行业与大模型能力供需匹配十分旺盛。

descript

二、法律行业需要基座大模型

法治是国家治理体系和治理能力的重要依托,是中国式现代化的重要保障。法律行业作为法治建设的核心实践领域,是推进法治中国建设的重要力量,在维护社会稳定、保障公平正义等方面肩负重要使命,是增强“四个意识”、坚定“四个自信”、做到“两个维护”的重要阵地。数字化时代,法律大模型作为人工智能与法律应用深度融合的产物,将逐渐成为推动法治中国建设的重要技术力量。法律行业的特殊性、法律实践的严肃性以及司法裁判的权威性决定了其对模型的数据规模与质量需求大、安全可靠及合规性要求高、应用场景的公开严肃性强,因此,法律行业需要“基座”大模型确保内容应用的安全可靠。法律基座大模型是以依法合规的法律行业大数据和知识资源为预训练语料基础,通过标准化、规范化的知识标注工程和体系性安全评测,为法律行业提供智能化能力和体系化配套服务的法律大模型“基座”。

(一)

 法律大数据语料来源

的规模性和合规性要求

法律大数据语料的规模基础对法律大模型有着至关重要的影响。一是能够丰富模型的知识。二是提高模型泛化能力。通过预训练更多样的法律场景、文本表达方式和问题类型,模型可以增强在不同情况下的适应能力和泛化能力。三是提升模型的性能。规模足够大的法律语料有助于模型更好地学习法律语言的统计规律,提高分类、语言理解和生成的准确性。四是增强模型的推理和分析能力。丰富的法律语料可以为模型提供更多的推理和分析依据,帮助模型学习法律推理的模式和逻辑关系,提高推理的准确性和可靠性。

由此可见,法律大模型高性能的实现必然源源不断地产生高质量预训练语料需求。从目前国内发布的各类法律大模型来看,绝大多数训练语料的来源是通过网络获取的公共资源,如各类立法、司法机构的官网信息,或者未经正常授权渠道获得的法律数据和内容资源,如裁判文书资源和法律版权文献资源。2021年我国就颁布了《互联网信息服务算法推荐管理规定》,对信息服务中的算法推荐进行规范。2023年以来,我国对大模型的法律规制逐步加强。《生成式人工智能服务管理暂行办法》第7条明确规定,应当使用具有合法来源的数据依法开展预训练、优化训练。2024年3月,全国网络安全标准化技术委员会发布《生成式人工智能服务安全基本要求》(TC260-003),明确使用开源语料时,应具有开源许可协议或相关授权文件;使用自采语料时,不应采集他人已明确不可采集的语料;使用商业语料时应有具备法律效力的交易合同、合作协议等;按照我国网络安全相关法律法规及政策文件要求阻断的信息,不应作为语料。目前,我国法律数据聚集量最大的还是政法机关,特别是法院系统。在使用海量法律数据语料进行预训练时,要依据《个人信息保护法》《数据安全法》做好对司法数据来源的合规审查,做好对司法数据的脱敏以实现对个人信息和隐私的保护。简言之,从数据语料资源集约的角度,法律大模型语料来源的安全、合法、合规性决定了其所能获取法律语料的规模性。

(二)

法律行业国家安全和内容安全的要求

法律是维护国家主权、安全和发展利益的重要工具。法律大模型若被恶意利用、给出错误解读或引导,可能输出歪曲国家法律制度、破坏法律秩序的内容,进而威胁国家安全、影响社会稳定。在数据采集和预训练阶段,若引入错误或有害数据,将影响模型的准确性和安全性。所以,法律行业的特殊性要求在法律大模型的开发中,始终贯彻“总体国家安全观”,要建立算法全生命周期的审查评估机制,加强算法安全审查,筑牢内容安全防线。“法律行业应用大模型,要在中国特色社会主义法治体系之下,既要同中国法治建设实际相结合,也要同中华优秀传统法律文化相结合,要坚持正确的政治方向,弘扬社会主义核心价值观和社会主义法治精神,要确保内容安全。”在法律大模型的研发训练中要遵循法律基本原则,维护国家法律秩序的稳定,符合科技伦理的基本要求,使模型在符合法律规范的同时,输出客观、准确的内容,维护社会稳定,弘扬社会正能量,促进社会和谐发展。

(三)

法律行业的专业性、规范性要求

法律行业大量法律文书代表了国家司法权。“裁判文书通过司法的权力展现维护法律的权威性和有效性。裁判文书的形成是审判权适用的结果,是国家权力运行的结晶。” “裁判文书承载着社会公平正义,影响着人民群众切身利益,是履行司法责任的重要载体,是深化司法公开的重要形式。”法律文本及文书的规范性、程序性、公开性、严肃性对大模型辅助生成内容的专业规范、安全可信提出了更高的要求。对国家法律进行规范与准确的表述和解释,需要以高度标准且及时更新的各种专业法律数据为训练语料,以提升大模型对法律理解的准确度。法律行业思维逻辑本身特有的严谨性,也要求大模型具备更为强大的逻辑推理能力和论证能力。

在法律术语的精确性方面,每一个法律概念的内涵与外延都经过严谨界定,不容混淆或模糊,法律文本要求使用精准、统一且具有明确法定含义的专业术语。在法律论证的逻辑性方面,无论是立法论证还是司法论证,法律论证中所包含的法律逻辑、法律推理以及其他法律思维工具,都依托严密的大小前提、结论等逻辑三段论,要求文本表述具备高度的逻辑严谨性。在法律适用、裁判说理等法律推理论证环节,涉及法律条文的引用务必精准无误,不仅要指明具体法条编号、名称,还要阐释该法条在当前案件中的适用依据与逻辑。这要求法官对法律体系有着深厚的理解与精准的把握,确保裁判结果有法可依。所以,高质量的法律数据语料对保障大模型的能力至关重要:一是保证模型的准确性,使用经过专业标注和审核的法律文本数据,可以提高模型对法律概念和条文理解的准确性;二是提高模型的可信度,来源可靠、标注规范的法律语料能够增强模型的可信度和可解释性;三是促进模型的可扩展性。

(四)

司法伦理和责任的要求

法律大模型在政法领域的应用,特别是辅助代表国家司法权的如法、检机关提升工作质效时,要始终界定好其辅助性、工具性的基本定位。大模型所代表的人工智能技术虽然功能强大、应用前景广阔,但是,司法机关对法律的适用不仅严格遵循裁判规则和法律逻辑,还涉及人性和伦理、社会价值和经验认知、人文关怀和情感因素、道德判断和同理心同情心,其中司法案件的复杂性、个案的独特性、法律的原则性都决定了大模型技术是难以处理的。“人工智能对知识的运用和调动停留在表征性表达的层面,其无法对概念进行认知性理解,更无法像人类一样将感觉经验与意识先验相结合。”《最高人民法院关于规范和加强人工智能司法应用的意见》明确指出,“坚持对审判工作的辅助性定位和用户自主决策权,无论技术发展到何种水平,人工智能都不得代替法官裁判,人工智能辅助结果仅可作为审判工作或审判监督管理的参考”。因此,法律大模型在司法行业的应用中,要始终定位为辅助工具,通过基座模型设定严格的技术规范,将应用范围、应用环节和应用权限明确嵌入在技术框架中,确保司法裁判始终由审判人员作出、裁判职权始终由审判组织行使、司法责任最终由裁判者承担。

(五)法律行业获得科技能力供给

和人民群众获得法律服务的要求

大模型领域的技术创新日新月异,DeepSeek等前沿科技成果的发布不断给法律大模型的应用带来新的机遇,也提出新的挑战。

对法律行业来讲,亟须建设发展法律基座大模型,通过其统一的技术架构与安全标准,为行业构建国家级自主可控、稳定可信的高水平科技能力供给平台。法律基座大模型应兼容新兴大模型的增量创新,通过动态化更新机制和专业权威的语料治理,确保法律语义理解、行业数据高质量更新等核心功能始终处于领先水平,从而系统性解决技术碎片化、应用不兼容、适配壁垒、幻觉生成、伪思维链路等风险,并通过集中化、持续化的供给模式,为法律智能化场景提供高安全性、高稳定性的底层能力支撑;同时,推动行业形成集约化创新生态,避免重复研发造成的资源浪费,降低法律大模型技术迭代成本。

对社会公众来讲,亦亟须建设发展法律基座大模型,通过其集成权威法律知识库与普惠化服务平台,低门槛获取兼具权威性与安全性的公共法律服务。

通过“技术供给—服务输出”的双向赋能,法律基座大模型不仅可以满足法律行业对安全可控技术生态的刚性需求,也能响应人民群众对高质量公共法律服务的核心诉求,为法律大模型应用的发展提供可持续的支撑性基础设施。

descript

三、法律基座大模型

的架构设计和建设路径

法律基座大模型要成为为法律行业应用人工智能提供基础能力和服务支撑的“基座”,在法律行业取得更广泛的应用效果,需要加强顶层设计和体系化建构。

(一)

统筹规划顶层设计

从定位和站位上,法律基座大模型的顶层设计要放在《数字中国建设整体布局规划》的“2522”整体框架下,既是国家在政法领域构筑自立自强的数字技术创新体系的重要举措,也是筑牢可信可控的数字安全屏障的重要保障。法律基座大模型的顶层设计要与国家《新一代人工智能发展规划》的目标相匹配。建设法律基座大模型是人工智能在法律行业的深入应用,旨在推动法律行业的智能化变革,为法治建设提供科技支撑,这与我国人工智能发展的战略目标相契合。

从体系架构上,法律基座大模型既是一个为法律行业提供生成式人工智能底层能力的基座模型,也是一套为保障法律人工智能安全发展提供合规数据资源、配套安全治理服务和评测资源的服务体系。法律基座大模型要统筹技术发展方向、数据语料资源、模型基础能力、专业知识工程、数据标注工程、测评工具系统、算力资源配套等多层架构,提供系统化服务。

在运作机制上,要在国家对生成式人工智能服务的各类法律法规规范之下,设计服务体系中不同参与主体的诉求、定位、职责,包括数据服务商授权运营机制、不同参数模型的耦合机制、模型基础能力与应用场景之间的对接机制。

(二)

安全合规汇聚模型语料

《数据安全法》第21条第3款规定:“各地区、各部门应当按照数据分类分级保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。”法律基座大模型的预训练语料汇聚机制要区分不同的来源和性质,采用不同的路径,依法合规汇聚。公开语料包括立法机关发布的法律法规、司法机关发布的司法解释、法律新闻资讯;授权语料包括各类法律书刊、著述、文献、报告、纪要、案例等。随着最高人民法院全面推进电子卷宗随案同步生成,各地法院电子卷宗实用化趋势显著,逐步实现自动分类、信息回填、网上阅卷、卷宗调阅、文书生成、类案推送、卷宗归档等功能,智能化、信息化、大数据分析等手段日益融入法院立案、庭审、执行等各环节,结构化、标注精准、高质量的法律数据大规模聚集。要根据数据分类分级管理要求,依据数据敏感性,明确相应的保护级别与措施。

(三)

建立全环节内容安全机制体系

法律基座大模型要建立全环节、体系化的内容安全机制。在输入环节设置校验机制,检查输入数据是否符合要求、是否被篡改或添加了异常信息,对输入的文本进行语法、语义分析,过滤掉不符合法律规范和逻辑的内容。在输出环节设置审核机制,对模型生成的内容通过自动审核和人工审核相结合的方式,确保输出内容的准确性、合法性和专业性。设置触发预警机制,支持检测和过滤不恰当的内容,识别并过滤掉损害国家安全以及违法、有害或不适宜公开的内容,包括但不限于色情、暴力、仇恨言论、虚假信息、敏感信息等,以维护内容安全。要建设内容安全词库机制,通过定期更新和维护、标记敏感内容,支持实时动态更新管控规则,并根据预设的规则进行处理或发送给人工审核团队进行进一步分析,确保违规内容得到及时处理,同时可自动生成监测报告,详细记录监测结果、处理情况及统计分析,便于管理和决策。

(四)

配套规范、科学化的评测体系

规范化、科学化的测评体系对法律基座大模型的工程化具有重要意义。准确性、完整性方面的测评可以保障法律基座大模型的质量,运行效率、响应时间、系统稳定性输出方面的测评可以优化法律基座大模型的性能,敏感隐私信息方面的测评可以确保法律基座大模型的安全合规,使用体验、交互界面方面的测评可以提升法律基座大模型的可用性。

行业大模型测评与通用大模型的测评有所不同,除了通用能力和技术指标外,更加注重结合专业知识和应用场景进行评估。法律行业较早提出大模型评测指标和方法的有智慧司法技术总师团队、浙江大学、上海交通大学与阿里云等联合发布的《法律大模型评估指标和测评方法》,从功能、性能、安全性、质量四个方面建立了法律大模型评估指标。

由中国中文信息学会主办、清华大学互联网司法研究院等机构承办的中国法律智能技术评测CAIL(Challenge of AI in Law)也将法律大模型能力列入评测任务,提出法律模型应当具备六个层次的能力,包括记忆层、理解层、推理层、辨别层、生成层、伦理层,并设定了裁判文书事实生成、裁判文书说理生成、法律要素和争议焦点识别、二审改判类案检索与原因预测、法律咨询对话生成、司法客观题考试、多人多罪判决预测、司法主观题考试八类任务。

对法律大模型的评测,既包含能力评测,也包含能力在场景任务中应用的评测。例如,在立案场景下评测大模型,就可以细分为以下指标(见表2)。

descript

(五)

搭建专业、规范化的知识工程体系

若想将生成式人工智能运用到司法场域,那么,对于数据的选取不应盲目追求数据的全样本化,而应在确保数据质量的前提下尽可能实现司法数据的全样本。在预训练阶段,建立防火墙至关重要,例如,对于一些普通网站上的数据予以隔离,避免预训练数据库受到污染,可以通过给予专业法律法规文库、法学专业文献、CSSCI核心期刊、法答网精品问答、人民法院案例库等高质量数据,确保数据输入端的质量。专业、规范化的知识工程对法律基座大模型的增强训练和应用十分重要,能够增强模型的知识表示能力,促进模型的推理和解释能力。法律基座大模型的开发中常用的知识工程包括以下四个。

1.数据标注工程

在对海量法律数据依法合规汇聚之后,就需要对大模型进行数据标注。《生成式人工智能服务管理暂行办法》第8条规定:“在生成式人工智能技术研发过程中进行数据标注的,提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法守法意识,监督指导标注人员规范开展标注工作。”开展数据标注工程,一是进行法律数据的清洗与预处理,包括去除重复数据,清理错误、不完整或格式混乱的数据,对数据进行标准化处理,如统一文本格式、规范术语表达等;二是进行法律数据标注,需要制定标注规范,由经过法律知识和标注技能培训的专业人员在大模型要素提炼能力的基础上进行标注、审核和质检。对大规模的法律数据进行标注,要采用“机器+人工”的标注方式,最小化各种潜在的不准确风险和伦理风险(见表3)。

descript

2.知识体系工程

在传统的专业知识服务领域,知识体系工程是将知识进行系统获取、表示、存储、组织、利用和创新的工程。法律知识体系工程包括分类与分层架构设计、知识体系与知识关联等内容。法律大模型具体匹配何种底层知识体系,与应用场景密切相关,如“法信法律基座大模型”的知识工程就是依托目前国内权威的法律知识分类导航体系——“法信大纲”(见图1)。法律知识工程可以利用存储的法律知识进行推理,还可以通过对已有研究成果的整合、分析和关联,发现新的研究问题和方向,促进知识的创新。

descript

图1 “法信大纲”知识体系(以离婚行为为例)

3.外挂库工程

现阶段,进行一次全量语料的大模型训练成本高昂。法律大模型的外挂库可以存储大量不同类型的法律知识,如法律法规、案例分析、学术文献等,独立进行数据更新,及时补充最新的法律数据,确保模型掌握的知识始终保持时效性和准确性。外挂库可以分担模型部分存储和检索功能,使模型专注于核心的语义理解、推理和生成任务,避免因存储大量数据导致模型规模过大、训练和推理速度变慢,从而提高模型的运行效率和响应速度。将敏感或特定的法律数据存储在外挂库中,还可以实现数据的隔离和独立管理,便于制定严格的访问控制和安全策略,确保数据的安全性和合规性,防止数据泄露和滥用。外挂库通过提供应用程序编程接口(API)与法律基座大模型进行连接。外挂库中的法律知识可以转换为向量表示形式,与法律基座大模型中的知识向量进行融合。

4.提示词工程

法律基座大模型作为底层能力被各种场景调用时,必然要根据不同的场景,引导模型按照特定任务要求进行理解和回答。提示词工程主要是根据场景和需求,设计相应的提示模板,模板可以包括固定的指令部分和可变的输入部分,将预处理后的输入数据进行重构,进而对法律基座大模型进行微调,使其更好地适应特定的法律任务和场景。通过微调和优化,模型可以学习到特定领域的问题模式和专项知识,进而提高对法律问题的理解和处理能力。

法律基座大模型的整体架构需要体系化设计(见图2),在供给层面要综合多层因素和配套工程,在应用层面要能支持不同层级的行业特性和场景需求,丰富法律人工智能应用的场景和生态。大规模的法律数据安全汇聚、体系化的内容安全和测评、专业的法律知识工程配套,都需要大量的投入和系统资源的支持,因此,需要从国家战略层面协同各方共同推进。最高人民法院组织研发的“法信法律基座大模型”,功能定位为国家级法律人工智能基础设施,正在实施严格规范的训练、优化工程。

descript

图2 法律基座大模型的整体架构

(六)

有效落实国家公共数据战略

法律基座大模型的建设与发展,是党中央、国务院对于充分发挥数据的基础资源作用和创新引擎作用的战略要求在法律行业有效落实的重要体现。法律基座大模型在顶层设计阶段即已充分结合国家数据战略,尤其是公共数据资源利用的工作部署;在建设路径上,通过安全合规汇聚模型语料,搭建科学化、规范化和权威化的内容安全机制体系、评测体系、知识工程体系;在充分发挥法律大数据和其他数据的基础资源和创新引擎作用的同时,能够有效防范数据关联汇聚引发的系列风险。法律基座大模型在作为法律行业人工智能技术基础设施的同时,亦应与法律大数据基础设施建设工作协同一体,作为国家数据基础设施战略中的关键组成部分,为做大做强国家数字经济、加强和完善社会主义法治、确保国家整体安全提供有力支撑。

四、法律基座大模型的应用展望

descript

法律基座大模型经过海量、权威和高质量的法律大数据预训练和增强训练,形成了很强的法律语言理解能力、法律文本信息抽取能力、法律逻辑推理能力以及根据提示的文本生成能力等。在这些底层能力之上,可以对接、支撑各类法律人工智能产品和服务。在技术层面,未来基于法律基座大模型,通过智能体、多模态和端侧部署等方式,还可以全面释放大模型多个维度的能力,提供高度丰富和多样化的法律服务体验。如利用多模态技术,高效创建丰富的短视频等法律宣传内容;通过端侧适配轻量级小参数模型,支持政务体系现有各种设备的智能化。在应用层面,通过提升对法律数据和内容安全的保障能力,推动法律数据的畅通循环、整合归集、共享利用,提升法律基座大模型依托的数据资源规模和质量,夯实政法领域各类数字化、智能化系统的建设基础,助力公正高效司法。同时,提升法律基座大模型社会化服务水平,“抓前端、治未病”,服务矛盾纠纷源头化解,提升法治数字政务的服务效能和水平。

展望未来,我国的法治建设将在人工智能大模型等技术支撑下守正创新、稳健前行,推动实现可感可知的更高层次公平正义,助力经济社会高质量发展。