8个月,发现问题34857个,发现涉嫌违纪问题线索2613个,挽回经济损失3 .64亿元。
这是沈阳市纪委监委2018年的一组监督工作数据。3万多个问题平均到8个月,意味着每天被发现的问题超过140个。
高效监督的背后,是沈阳市纪委监委与中国科学院计算技术研究所合作建设的大数据监督平台——机器日夜不停地运转,通过交叉比对几十亿条电子政务数据,帮助纪委监委获得问题线索。
沈阳市并不是唯一通过大数据开展监督工作的城市。据不完全统计,2012年至今,江西省的修水县,湖南省的麻阳县、澧县、宁乡市、怀化市和麻阳市,都探索应用了大数据监督平台,且覆盖了民生资金、工程项目等涉及到国库集中支付的领域。
“雁过拔毛”
“大数据碰撞”发现基层冒领“死人低保”
2018年1月,江西省九江市修水县民生资金项目大数据监察平台上线运行。很快,县纪委发现异常情况:有人已经去世,却仍在领取低保。
吃“死人低保”,是基层腐败案件的一大典型。公安、民政部门和银行的数据无法及时打通,一些基层干部便钻了信息不对称的空子,冒用死者身份继续领取低保金。
修水县是江西省面积最大的县,也是国家扶贫开发工作重点县和省定特困片区县。基层干部“雁过拔毛”式腐败,贪腐金额看似不多,却直接影响到原本就生活困难的特殊群体,同时,也影响到当地的脱贫攻坚与经济发展。
“雁过拔毛”式腐败问题,往往相当隐蔽。此前,纪委调查这样的问题需要走村入户、实地谈话,收集线索后,再协调相关部门一一核实。就算能发现异常,一个问题可能也要追踪几个月。
“我们这里地处山区,很多村子比较偏远,开车过去要两三个小时。而且以前都是人工发放资金,审计起来比较难。”修水县信息中心电子政务管理科科长卢宇鹏说。
在民生资金领域,除了违规领取农村低保,还有其他类似的腐败现象,如伪造危房改造资格、违规领取贫困寄宿生补助、同时领取城市低保和农村低保,等等。
怎样能更好地发现此类问题,提升纪委监督效率?抱着这样的想法,有修水县纪委人员联系到中科院计算所方金云研究团队,寻求技术支持。经过数月攻关,在修水县民生资金电子监管平台的基础上,大数据监察平台建设完成。
修水县纪委常务副书记、监委副主任陈小平用“大数据碰撞”通俗地解释平台运作原理。“将农村低保资金与基础数据中的死亡人员名单进行互斥比对,就会发现死人吃低保的现象。”他举例说。
进行大数据监督,打通政府部门间的“数据孤岛”是关键。陈小平坦言,初期也遇到过职能部门数据更新不及时的现象。为此,修水县专门出台了相关管理制度和调度机制,“要求民生资金下达文件下发后5个工作日内,数据必须上传到位,必要时启动约谈”。
纪委牵头推动之下,大数据监督初见成效。据修水县统计,平台上线一年多以来,纠正违规使用资金问题6000多例,涉及资金2300余万元;产生预警信息5583条,发现有价值的线索164条,处理111人。
数据探针
通过比对、叠加和交叉验证找到问题线索
1999年,政府上网工程正式启动。到今天,中国的电子政务已发展了30年,积累了大量数据。
中科院计算所研究员方金云认为,党员干部、公职人员的权力行使过程,一定会留下数据痕迹。政务数据就是权力运行的“数据日记”。但长期以来,各个部门的电子政务数据没有打通,导致一些问题隐匿其中。
监督是否有效,发现问题是关键。大数据监督的要义,就是通过数据比对、叠加和交叉验证等方式,从电子政务数据中找到问题线索。就像探针一般,深入到人类难以察觉之处。
以修水县为例,陈小平告诉南都记者,纪委将民生项目划分为计划、设计、招标、建设、监理、拨款、验收等19个关键环节,共设置28个评价指标。每个指标被赋予一定分值,系统发现异常后自动扣分,并进行实时预警。
异常线索推送给相关职能部门及纪委后,由职能部门进行核实和整改。若各职能部门在核实过程中发现有价值的线索,则须反馈给县纪委,由县纪委再进行调查核实。
将党章法规、国家政策中的诸多规定转化为机器可以理解的指标和规则,并不容易。方金云说,以低保为例,不同的地区发放额度不同,中央的规定到了地方后也可能再做调整,很复杂。
机器与人不同,接收到的指令必须清晰明确、没有歧义。文件中也许只有一句话,转换到系统里,就要变成几十行的代码 。要把复杂的政策给机器解释清楚,工作量很大。
而从另一个角度看,即便是人本身去读政策,不同的人也难免有不同的理解。方金云说,为了能清楚地反映政策要求,每次设置规则,当地纪委监委、研究团队都要与领域内的资深专家对接,共同确定分析规则,让机器知道什么是对、什么是错。
“比如说民政部门有规定,如果一个人有两套及两套以上房产或者店铺的,就不符合低保领取条件。”修水县信息中心电子政务管理科科长卢宇鹏举例。
关口前移
防止错误行为由小到大、由轻到重的恶化
大数据监督是减存量、遏增量的有效手段。
2018年3月,监察法颁布施行。关于六类监察对象的规定,从法律层面上把所有行使公权力的公职人员纳入监督,实现国家监察全面覆盖。
随着监察全覆盖的推进,监督对象大量增加,对精准监督提出了更高要求。要履行好监督的第一职责,纪委监委既不能“胡子眉毛一把抓”,也不能“隔墙扔砖、砸到谁算谁”。
对纪委监委而言,把监督挺在前面,是为了发挥监督的基础性作用,防止干部错误行为由小到大、由轻到重的恶化。简而言之,关口前移、抓早抓小。
“我们每个人都特别痛恨腐败,但也有句话说,没有监督的权力,必然产生腐败。”方金云认为,许多干部犯错 ,其实都是从“小问题”开始,也反映出监管制度存在漏洞。
人力毕竟有限,未必能面面俱到。让大数据监督织就一张网,把腐败问题发现在细微之时,既能帮助纪委监委堵住漏洞、改进制度、促进经济发展,也能防止干部进一步犯错。
在修水县纪委常务副书记、监委副主任陈小平看来,大数据平台,犹如打通了监督的“最后一公里”,有效破解了民生资金项目来源“多头化”、管理层级“复杂化”、管理责任“无序化”造成的监管漏洞。
他告诉南都记者,大数据平台启用后,每笔资金公开到村、到户、到人头,大大提高了精准监督和末梢监督的效率。公职人员及家属领取低保、有商品房或车辆的群众领取低保、重复领取农村低保和城镇低保、去世人员领取各类补贴等现象,基本得到杜绝。
方金云本人也是党员。他说,帮助纪委监委做大数据监督,除了能切实探索如何把权力关进制度的笼子里,也常常觉得“心里挺软的”。
有一年,某县的监督平台查出一批违规领取低保的行为,追回3000多万元低保资金。结合大数据系统,该县纪委重新确定了符合领取条件的贫困家庭,选在一天集中发放。
方金云也去了现场。发放过程中,一位妇女听完干部对大数据系统的介绍,忽然走到方金云面前,用当地方言说了些什么。方金云没有听懂,却眼见着这个妇女要跪下,赶紧将对方扶起。
“不到一万块钱,对基层贫困户来说却是雪中送炭。这个事儿确实搞得人心里特别软,也坚定了我们做大数据监督的信心。”方金云说。
沈阳样本
“不仅要看怎么用钱,还要监督决策、行权过程”
辽宁省沈阳市纪委监委大楼八层,有着近百台服务器。沈阳市纪委监委和中科院计算所合作建设的大数据监督技术实验室,就坐落在这里。尽管计算所的办公室在北京,过去一年,方金云却把大多数时间花在了沈阳的实验室。
2018年,沈阳市纪委监委开始与中科院计算所深度合作,探索大数据支持下的精准监督。
方金云说,以往针对民生资金、工程项目的监督平台,还只是“1.0版本”,主要监督的是钱袋子。在沈阳,纪委监委希望打造2.0版本,把涉及公共财政的项目、资金、物资、决策和权力,都纳入监督范畴。
“对于要监督的部门,不仅要看它怎么用钱,还要监督它的决策过程、行权过程。这样一来,就把监督的笼子扎紧了,让干部少犯错。”他说。
行权过程,听起来抽象,但在实践中,其实会有各种各样的数据痕迹可供分析。方金云举例说,管理水务的部门,收水费就是行权。如果某个人或某个单位的水费为零却又有用水量,数据就比较可疑,这就反映了水务部门的行权情况。
“我们在沈阳做了信息化普查,统计到大约2400多个信息系统。这其中其实有大量的行权数据。”方金云说。
通过大数据做监督,数据是基础。过去,不同部门建设了不同种类的信息系统,就像一个个数据孤岛。对于部门来说,数据如同资产,谁的数据多,谁的优势就大。这导致条块分割问题突出,电子政务数据很难被利用。
为了打破这一困境,沈阳市纪委监委推动全市建立数据备案机制。纪委监委对房产局、民政局、人社局等业务单位的数据进行汇集和备案,经过数据清洗和加工,形成“大数据仓库”。
信息整合以后,许多曾经隐秘的贪腐问题变得无处藏身:有建筑公司近三年投标337次,中标0次,存在围标嫌疑;有人员有房有车,却一直在领取低保。
结合大数据监督平台的线索,纪委监委人员会进行调查核实。以前几十个人的团队工作半年才发现的问题线索,平台可能只需要一天就达到同样数量,准确率在86%以上。
沈阳市纪委监委数据显示,截至目前,沈阳市共计纳入数据25.1亿条,其中,财政资金数据5060万条。已发现疑似问题90737条,涉及人员11719人。通过人机结合方式,已核查确认违规问题70480条,立案1538件,给予党纪政务处分1237人、移送司法机关25人、诫勉谈话61人、批评教育11228人,有13694人主动说明问题。
长期任务
机器学习的过程“无时无刻不在优化”
方金云提到,大数据监督还有一个重要优势:能有效防范数据造假。
党员干部违法违纪行为中,有一类行为叫做“烧账本”。“湖北一名干部竟故意将‘小金库’的账本和部分凭证焚毁”“山东一名干部烧掉账目资料并于事后谎称车辆自燃”……类似的案例,在公开报道中屡见不鲜。面对纪委,一些党员干部心存侥幸,试图通过这种方式毁灭证据、逃避处罚。
大数据监督平台如何寻找“烧掉的账本”?“他把自己部门的记录给删了,但是我们在别的部门又发现了相关的记录。这就找到了痕迹。他得说明,为什么这条记录没有了?钱去哪里了?说不清楚,就可能有问题。”方金云解释。“很多数据不是某个权力部门能干涉的。各种信息和数据交叉验证,即使某个数据被删除了,问题线索也还在。”
值得注意的是,大数据监督平台的背后,也有着人工智能的影子。
教会监督平台发现问题的过程,其实是机器学习的过程。方金云介绍,监督规则的调整,术语叫做“调参”。哪怕是针对同一个问题,在不同的地区和不同的数据体量下,规则也会不一样。监督规则不一定都是内容越来越细、条数越来越多,有时候也会根据地方实际减少数据采集环节和条数。
除了监督规则,监督平台的运行中,也涉及到计算机系统本身的优化。方金云回忆,刚在湖南某市做实验时,计算某个项目的结果,花了40多个小时,后来经过算法优化,只用1个多小时就能结束战斗。
作为给纪委监委提供技术支持的一方,研究团队最担心的是“不准确”。“一定要讲究准确率,现在发现问题的准确率可以达到86%,将来不能说到100%,但是一定要不断地提高。”方金云说。
在他看来,优化是一个长期的任务,“无时无刻不在优化”。
已被发现的案例,也能反哺平台。过去半年,经沈阳市纪委监委特许,研究团队访谈了数位留置人员,了解他们的腐败“经验”。
“他为什么能腐败,是怎么腐败的?”方金云说,访谈获知的情况,可用于调整平台规则和参数,从而帮助纪委监委进一步提升精准监督实效。
在访谈中,一位留置人员提到,他曾帮助28个人伪造工龄,调高其养老金。由于相关数据还是手工登记,该留置人员认为,就算纪委监委用上了大数据,也很难发现问题。
方金云把28个人的资料放进机器,经过20多个小时的运算,挖掘出数据特征:异地转入养老时间短、本地补缴时间长、审批数据和工龄数据异常,有些涉及伪造公章,有些涉及伪造劳动文件。
研究团队据此对比了沈阳市的工龄认证文件,发现了数千个相似案例。
目前,纪委监委仍然是设置监督规则的主力。方金云希望今后能完成技术攻关,让机器能在一定程度上去自主学习、理解和设定规则。
但他认为,精准监督本身,仍需要持续探索。“机器有强大的存储和检索能力,比人记得多、找得快。但它没有人类的综合能力。当前,纪委监委的监督工作,还是要人机结合。”他说。
采写:南都记者 冯群星 见习记者 陈志芳