前言
伴随数字化时代的到来,大数据不仅已成为近年来的热门话题,更是诸多领域研究的新课题。如今,大数据已广泛渗透并不断融入人类社会经济生活的方方面面,其应用无处不在,诸如新闻传播、文化娱乐、广告推送、语音对话、物流快递、导航出行等领域,都离不开大数据的支撑。可以说,数字化改变了我们的工作方式、生活方式、互动方式,也正在逐步影响和塑造当今的经济社会发展秩序。数字化演进的加速以及算力的爆发,催化了一批大模型应用,如ChatGPT,使通用人工智能成为可能,实现了信息海量采集与多重应用、数据即时清洗与深度挖掘、算法升级与应用创新。新一轮智能化浪潮正在驱动经济社会逻辑由商品逻辑向数字逻辑转换,实现物理世界向数字世界的跨越式变革,向人类展现出新的图景。
麦肯锡全球研究院在2011年发布的《大数据:创新、竞争和生产力的下一个前沿》(Big Data: The Next Frontier for Innovation, Competition and Productivity)研究报告中首次提出”大数据时代已经到来”,并描述了大数据的概念和特征,即一种规模大到在获取、存储、管理、分析方面大大超出传统数据库软件工作能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型、价值密度低和获取途径真实五大特征。随后,维克托·迈尔-舍恩伯格教授(Viktor Mayer-Sch?nberge)在《大数据时代》一书中形象地说,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。挖掘数据价值,征服数据海洋的主要”动力”之一就是大数据及数据处理技术。而随着现代数据采集,如视频云监控以及云存储的形成,数据的威力变得越来越大。通过云数据,甚至可以描绘出某一个人甚至亿万人的生活轨迹、兴趣爱好,知道他们常喜欢去哪些店铺,愿意在哪里活动,喜欢哪种风格的服饰,经常跟谁在一块儿……比如,彭博终端机提供的全球金融精英海量数据就是绘制心理地图的基础,其既是全球金融精英获得身份和文化认同的典型标志之一,也在金融家的文化节奏和思维脉络中打上深深的印记。今天,大数据正在重塑人们的工作、学习和思维方式。随着具有普适性、自主性、创造性和学习能力的人工智能系统的出现,通用人工智能实现了跨领域、跨任务、跨模态的多元化场景运用,大数据的高质量发展和深度应用也将迎来新天地。
在这一发展过程中,司法大数据以其结构化数据的独特优势,成为大数据最为重要的应用领域之一。中国司法大数据的发展从初步的搭建数据收集平台,提供基础的数据平台、动态监控管理的服务功能发展为数据统计分析功能。司法大数据的发展由点及面,从地方先行先试走向全国统一推广。从中央、地方两个层面来看,大数据司法建设的推进重点有所不同。例如,在应用技术上,中央更注重通过深度学习、云计算等实现司法智慧化,推出类案检索、量刑预警等应用;地方则更多地运用信息技术优化工作程序,如将信息技术运用于立案、保全、送达等程序性工作环节。在此过程中,法院不仅实现了数据的自动化管理,还紧贴社会需求,围绕不同的法律热点问题,生成具有针对性的报告,充分发挥司法大数据作为经济社会发展的”风向标””晴雨表”的作用,服务各级党委、政府实现决策科学化、社会治理精准化。可以说,司法大数据已经实现了从管理数据到分析数据,由统计阶段转向创造阶段的转变,实现了从”人找数据”到”数据找人”的革命性转折。近年来,随着人工智能领域的快速发展,司法大数据与大数据技术日益结合,司法大数据正在由自动化走向智能化。
近年来,大数据应用在司法领域取得重大进展,我国已经成为司法大数据应用大国,中国法院信息化建设水平已然处于世界领先地位。通过挖掘蕴藏在司法大数据中的丰富信息,探索司法案件与社会活动、政府行为之间内在的关联与规律,是人民法院借助司法大数据延伸司法功能、积极参与社会治理的创新举措。然而,司法大数据种类繁多、格式各异、信息量巨大,社会治理问题纷繁复杂,且法律往往滞后于社会现实;尽管可以利用大数据的预测模型预测不同案件的走势与规律,但是数据能否全面准确并同步反映法律在社会中运行的状态,仍有待进一步检验。至今,关于司法大数据的一系列研究尚未形成逻辑缜密、论证严谨的系统化理论研究学科范式,但司法大数据研究的实践价值已日益凸显。进一步深化司法大数据在人民法院乃至经济社会发展中的应用,使其更好地为司法赋能,为社会发展助力,以数字正义推进实现更高水平的公平正义,既是一个长久的实践课题,也是一个常新的理论课题。