塑料机械网 > 塑料资讯 >

论法律大数据“领域”的构建

时间:2021-01-13 05:20 来源:未知  手机版

饮水机怎么清洗,滨崎步 失聪,水库养鱼

来源:法治日报——法制网

□ 前沿关注

□ 王禄生

一、问题的提出:法律大数据“领域理论”的现状与不足

(一)法律大数据领域本体论有待构建

由于对法律大数据的领域本体论反思还较为缺乏,因此学界一般认为,法律大数据就是在法律领域中使用的具备“4V特征”的数据集。在实践中,出现了片面强调大体量、全样本、高速度、实时性、多种类的观点,甚至人为设定标准来固化地区分“大数据”与“小数据”,如PB量级才是法律大数据、没有全样本不是法律大数据等。实际上,“4V特征”并不完全适用于法律领域。因此,要推动法律大数据的研究与应用,必须构建法律大数据领域本体论,挖掘属于法律的“领域特征”。

(二)法律大数据领域认识论有待更新

由于缺乏对领域认识论的充分反思,当前法律大数据应用较多采取基于大数据分析的知识发现范式。具体而言,就是借助数据挖掘技术从大量判决书、案件卷宗等非结构化、半结构化数据中发现法律规律并加以应用的过程。此种认识论在大数据与大算力的支撑之下取得了一定的成效,但却与法律领域的特殊需求不完全匹配。这体现在:其一,演绎思维冲突;其二,因果思维冲突;其三,说理思维冲突。可见,为了避免在法律大数据应用中方法论与法律思维的冲突,就势必需要更新法律大数据领域认识论。

(三)法律大数据领域方法论有待优化

由于在本体论与认识论上套用了大数据的一般分析框架,当前法律大数据在方法论上表现为“通用技术+通用流程”的特点,也就是在数据获取、预处理、训练、解释、应用等的常见步骤中使用通用的大数据分析技术、算法与模型,没有考虑技术在法律领域的兼容性,更没有针对法律“领域知识壁垒”而进行专门的技术与流程优化。

二、领域本体论的构建:法律大数据的“3A特征”

(一)本体论视角下法律大数据概念的厘清

“法律大数据”本体论的构建首先需要实现“法律领域中大数据”(big data in law)向“法律领域的大数据”(legal big data)转变。换言之,在本体论的视角下,“法律大数据”是指在立法、执法、司法等法律过程中形成或依法获取的,既在一定程度上具备大数据的通用特征,又满足适配性、正确性和易变性的领域需求,必须结合法律领域的特定算法与模型来实现辅助法律决策、优化法律过程目标的数据集。上述概念有三个关键点:其一,法律大数据是“领域大数据”而非“领域中的大数据”;其二,除了通用领域的部分特征之外,法律的特殊性使得法律大数据具有特定的领域特征;其三,法律大数据的领域特征决定了通用大数据分析工具也需要结合法律领域进行优化。

(二)本体论视角下法律大数据的领域特征

法律领域的特殊性决定了法律大数据除了部分具有通用大数据的“4V特征”之外,还具备从属于法律领域“3A特征”。

第一,法律大数据的适配性(Adaptability)。与其他领域强调样本的“大与全”相比,法律大数据特别强调样本的适配性,而并不必然要求大量的全样本。第二,法律大数据的正确性(Accuracy)。在通用领域中,样本大数据质量的高低判断标准通常是纯技术的形式判断,比如数据缺失、数据重复、数据格式不统一等。一般而言,研发者并不需要对样本数据进行“对”与“错”的实质价值判断。与之形成鲜明对比的是,在法律领域中,作为各种算法训练基础的法院判决则很可能存在对错之分,法律大数据训练样本质量的高低判断除了借助技术逻辑进行形式审查之外,还需要依托专业逻辑——基于法学知识的专业判断。第三,法律大数据的易变性(Astability)。对于通用领域而言,数据的价值是相对稳定的,可以通过多次挖掘进行深度的运用,而对于法律领域而言,部分数据具有易变性,情境一经调整,原有数据将失去挖掘价值。

三、领域认识论的更新:法律大数据的知识发现逻辑

本站所有文章均来自搜索引擎和其他站点公开内容,如有侵权或表述不当,请联系并标明身份和情况后立即删除。
本文地址: http://www.huaminsujiao.com/suliaozixun/29414.html

本文标签:法律 数据 领域 认识论 知识

相关文章

热图 更多>>
热门文章 更多>>