法律知识
登录        电话咨询
宽严相济刑事政策的经济学分析
发布日期:2012-07-04    文章来源:互联网
【出处】《云南大学学报法学版》2009年第3期
【摘要】本文认为用经济理论来分析宽严相济的刑事政策是可行的,因为合理的配置司法资源也就成为有效执行宽严相济刑事政策的重要保障;本文用经济学博弈论具体分析如何在司法资源既定的条件下,通过宽严的不同配置来达到最佳的案件侦破效果;本文得出结论认为在不同的情况下要采取不同的宽严政策将更有利于打击和预防犯罪。
【关键词】宽严相济;博弈论;囚徒困境
【写作年份】2009年


【正文】

一、引言

本文试图从经济学的角度来分析宽严相济的刑事政策,包含三个问题:第一,用经济学理论来分析宽严相济的刑事政策是否妥当;第二,在理论上,经济学如何看待宽严相济的刑事政策;第三,在实践上,经济学对宽严相济给予的可能知道。

经济学的伦理学基础是功利主义,即假定个体行为的目的是个体福利的最大化,而社会整体目的是最大多数人的最大多数利益。具体到宽严相济的刑事政策即为宽严相济的刑事政策是否最有效率的实现了犯罪的侦破与预防。需要注意,经济学分析并不是分析宽严相济刑事政策的唯一合理进路,任何一项刑事政策必然是两个分析进路的统一:价值理性和工具理性的统一。[1]价值理性的伦理学基础是道义论(deontology)。Deontology源自希腊词deon,意为义务(obligation)或职责(duty)。道义论关注的是行为本身的正确与错误,与关注行为后果的正确与错误相对应。[2]这种理论的代表性言论为即使天塌下来也要实现正义(Let justice be done though the heavens fall)。工具理性的价值基础是后果主义consequentialist或目的主义teleologica,l通过行为的结果来确定行为的善与恶。[3]工具理性的典型代表即是前文提及的功利主义(utilitarianism)。

二、宽严相济的刑事政策释义与经济学分析的合理性

(一)学者的解读

关于宽严相济刑事政策的内容,学者之间、学者与实践部门之间的理解并不一致。高铭暄老师认为:“宽”意味着对犯罪情节轻微或具有从轻、减轻、免除处罚情节的,依法从宽处罚,即使是严重的刑事犯罪,如果具有自首、立功等从宽处罚情节的,也应当从轻或减轻处罚。同时,在“宽”的基础上,也不能忽视“严”的要求,对于某些严重的刑事犯罪、惯犯、累犯,应当依法严惩,充分发挥刑罚的打击效果和威慑效应。[4]

马克昌老师认为:宽严相济的内涵为:该严则严、该宽则宽、严中有宽、宽中有严、宽严有度、宽严审时。[5]该严则严指对严重犯罪,依法从严惩处,应当判处重刑的,依法判处重刑应当判处死刑的,依法判处死刑直至判处死刑立即执行。当宽则宽指对罪行较轻、犯罪人主观恶性较小的,则应从宽处罚,对轻微违法犯罪人员特别是对失足青少年,根据条件可以免予处罚,也可以适当多判一些缓刑或者安排到社区矫正。严中有宽指即使所犯罪行严重,但有法定或酌定从轻、减轻处罚情节的,应予以从宽处罚罪当判处死刑,如有从轻、减轻处罚情节或者不是必须立即执行的,应依法判处死刑缓期二年执行、无期徒刑或者十年以上有期徒刑。宽中有严指虽然罪行较轻,但有法定从重处罚情节如累犯的,应依法从重处罚。宽严有度即对犯罪人的处理,不论“宽”或“严”都必须以“事实为根据,以法律为准绳”,在法律范围内进行。宽严审时指对犯罪人的处理,必须考虑一定时期的社会情况或者从严或者从宽。

储槐植老师认为:宽严相济政策当前的具体内容是主张和强调刑法的宽和、适当、人道与谦抑。[6]吴宗宪老师认为:宽严相济的刑事政策分为司法和立法两个层次。作为司法政策的宽严相济是指刑事司法机关要在法律规定的范围内从宽或者从严,“宽”不是法外施恩,“严”也不是无限加重,而是要严格依照《刑法》、《刑事诉讼法》以及相关的刑事法律,根据具体的案件情况来处理犯罪案件,该宽则宽,该严则严,宽严相济,罚当其罪,真正在刑事司法活动中贯彻实事求是、严格执法的原则。作为立法政策的宽严相济是指导刑事立法机关工作的刑事政策,是突破现行法律规定的内容而探讨更加科学、更加合理、更加有效的刑事法律的政策。[7]

陈兴良老师认为:“宽”包括该轻而轻、该重而轻两种情况。该轻而轻是罪刑均衡的应有之意;该重而轻是指所犯罪行较重,但行为人具有坦白、自首或者立功等法定或酌定情节的,法律上予以宽宥,体现刑法对于犯罪人的感化。“严”包括严格和严厉之意。严格是指该作为犯罪处理的一定要作为犯罪处理,该受到刑罚处罚的一定要受到刑罚处罚。严厉是指判处较重刑罚。[8]

(二)官方的解读

罗干同志认为:宽严相济是“指对刑事犯罪区别对待,做到既要有力打击和震慑犯罪,维护法制的严肃性,又要尽可能减少社会对抗,化消极因素为积极因素,实现法律效果和社会效果的统一”,“贯彻宽严相济的刑事政策,一方面,必须坚持‘严打’方针不动摇,对严重刑事犯罪,依法严历打击,什么犯罪突出就重点打击什么犯罪,在稳准狠上和及时性上全面体现这一方针;另一方面,要充分重视依法从宽的一面,对轻微违法犯罪人员,对失足青少年,要继续坚持教育、感化、挽救方针,有条件的可适当多判一些缓刑,积极稳妥地推进社区矫正工作”。[9]

肖扬同志认为:加强刑事审判工作,依法惩罚犯罪。一是坚持“严打”方针不动摇;二是坚持宽严相济的刑事政策,对犯罪情节轻微或具有从轻、减轻、免除处罚情节的,依法从宽处罚。[10]贾春旺同志认为:在检察工作中认真贯彻宽严相济的刑事政策,坚持区别对待。对严重刑事犯罪坚持严历打击,依法快捕快诉,做到该严则严对主观恶性较小、犯罪情节轻微的未成年人、初犯、偶犯和过失犯,贯彻教育、感化、挽救方针,做到当宽则宽。[11]

(三)本节结论

尽管上述解读有几个基本问题没有回答:“宽”和“严”是否有参考系;“宽”和“严”的参照系是否是基本犯罪构成的惩罚;如果其参照系是对基本的犯罪构成的惩罚,那对基本犯罪构成的惩罚是否要采取宽严相济的刑事政策;宽严相济的刑事政策与刑法的基本原则,罪刑法定、罪刑平等、罪刑均衡、主客观相统一,之间是什么关系;但是,上述解读均承认坚持宽严相济的刑事政策的重要目的之一是预防犯罪,即“充分发挥刑罚的打击效果和威慑效应”,[12]“既要有力打击和震慑犯罪,维护法制的严肃性,又要尽可能减少社会对抗,化消极因素为积极因素”。[13]因此,用经济理论来指导宽严相济的刑事政策,以达到最佳的预防效果,也就相应的具备了合理性。同时,刑法的目的为报复与预防的统一,报复对于的是道义伦理学,预防则对于的是后果主义伦理学。

三、宽严相济的经济学

用经济理论分析法律,就是要求法律能实现社会福利最大化,即通过有效的法律制度设计来实现社会福利的最大化。需要注意,经济理论在高效的解决校正正义问题上,高歌猛进;可在分配正义领域,目前限于主流的经济理论认为个体福利不可比性,经济理论在分配正义领域难有斩获。尽管科斯定理宣称如果交易成本为零,那么权利的原始配置状态不影响最有效率的结局。[14]但现实的情况上交易成本确实存在,而且在很多时候由于交易成本的昂贵,在很多时候无法达成协议;同时,即使通过合意达到有效率的后果,可不同的权利分配规则会影响福利在不同人之间的分配,即经济学接受的有效率的结果不是唯一的,而这不同的结果之间人与人之间的福利分配并不一致。[15]为了缓和福利不可比带来的压力,经济学提出了卡尔多—希克斯(Kaldor—Hicks简称KH)检测法,通过事后补偿给权利收到损失的人,以实现帕累托最优。但仍然有问题:第一,事后补偿实际是认可的基数效用论;第二,福利是个主观概念,如果事后就补偿无法达成一致,此情况下,也不能说是社会的整体福利得到改变。因此,KH检测法的适用范围仍然受到严重限制。因此,经济学家认为政府有时可以改善市场的结果,这实质是承认了在某些条件下的效用的可比性。

经济学认为按以下方式考虑问题是妥当的:社会资源是既定的,相对于人的欲望总是稀缺的,因此需要对该社会资源有效的分配,对自己的需求权衡取舍,以实现福利的最大化。这些需求包括生存需求、安全需求、当下需求、未来需求等。第一次社会资源分配是在当下需求和长远需求之间展开。社会资源的目的是满足人们需求,可是如果全部用于满足现在的需求,则长远需求持续得到满足,因此,需要一部分资源用来投资发展经济,以确保人们需求的持续满足。在此次分配中,分配准则是最大多数人的最大多数福利。

在用于满足当下需求的资源中,有一部分作为满足安全的需求而投入惩罚和预防犯罪。该部分司法资源是既定的,相比较人的司法愿望,即惩罚和预防所有的犯罪,司法资源总是稀缺的,因此,我们需要讨论如何有效的利用稀缺的司法资源惩罚和预防犯罪。第一,由于司法资源有限、且司法资源在任何犯罪上的投入达到一定程度后都会边际效用递减,因此,我们不能无节制的将司法资源用于某一类犯罪,而且要综合考虑各种犯罪。第二,犯罪原因与犯罪预防紧密相关,惩罚不是犯罪预防的唯一方式,如果过高的犯罪率来自极大的社会贫富差距,在既定的条件下,将一部分司法资源拿出用于投资教育、投资公共设施建设来降低贫富分化差距,亦可以实现最大程度的预防犯罪的目的。第三,在具体犯罪的侦查中,也要考虑在既定资源下,如何有效的安排制度,以实现惩罚和预防福利的最大化。

经济学的原理之一为人们会对激励(incentive)做出反应。所谓激励是引起一个人做出某种行为的某种东西,比如惩罚或者奖励的预期。[16]因此,要针对不同的犯罪原因,确定不同的激励:或者惩罚为主、或者教育为主、或者惩罚与教育并行,才有可能实现社会福利最大化。这些措施正是坚持宽严相济刑事政策的结果。因此,在此意义上宽严相济的刑事政策符合经济理论。

在既定的司法资源下,如何考虑有效的发挥制度的作用,以最大程度实现惩罚最大化,也是经济理论要考虑的问题。比如通过设定坦白从宽的原则,鼓励犯罪嫌疑人坦白,亦能在现有的司法资源条件下提高惩罚率。而坦白从宽的政策正是坚持了宽严相济刑事政策的结果。该制度的设置主要理论基础是博弈论,通过设置不同的制度来设置不同的博弈,从而实现最高效率的实现预期目标。

四、宽严相济经济学视角的实践之一

——非合作博弈之囚徒困境

囚徒困境是博弈的形式之一。博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。博弈包含四个基本内容:博弈参与者、博弈目的、博弈策略、和博弈者掌握的信息。

博弈可以分为合作博弈和非合作博弈。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。合作博弈亦称为正和博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。合作博弈采取的是一种合作的方式,或者说是一种妥协。妥协其所以能够增进妥协双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。这种剩余就是从这种关系和方式中产生出来的,且以此为限。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型,这是一种具有互不相容味道的情形。非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。非合作博弈又可以分为负和博弈和零和博弈。

(一)囚徒困境的内容及适用范围

1950年,就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)提出出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

经典的犯罪嫌疑人困境内容如下:警方逮捕A、B两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人坦白认罪,并作证检控对,而对方保持抵赖,坦白者将即时获释,抵赖者将判监10年;若二人都抵赖,则二人同样判监半年;若二人都坦白,即互相坦白立功(互相“背叛”),则二人同样判监2年。其博弈战略示意图如表2.6。

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓

┃ 表2.6:囚徒困境策略图 ┃

┣━━━━━━━━━━━┳━━━━━━━━━┳━━━━━━━━━┫

┃ ┃ 囚徒A ┃ ┃

┃ 囚徒困境博弈 ┃ ┃ ┃

┃ ┣━━━━━━━━━╋━━━━━━━━━┫

┃ ┃ 立功 ┃ 不立功 ┃

┣━━━━━┳━━━━━╋━━━━━━━━━╋━━━━━━━━━┫

┃ 囚徒B ┃ 立功 ┃-10,-10 ┃-10,0 ┃

┣━━━━━╋━━━━━╋━━━━━━━━━╋━━━━━━━━━┫

┃ ┃ 不立功 ┃ 0,-10 ┃-0.5,-0.5 ┃

┗━━━━━┻━━━━━┻━━━━━━━━━┻━━━━━━━━━┛

囚徒困境转换成法律术语应该是犯罪嫌疑人困境。囚徒困境中的坦白在法律上既包括坦白自己的罪刑、也包括揭发他人的罪刑(立功),因此,此后合称坦白立功。其适用范围为共同犯罪的场合。犯罪嫌疑人困境实质是,为侦破共同犯罪而通过宽严相济的刑事政策为犯罪嫌疑人设置的非合作博弈。

(二)不同的选择、不同的博弈

基本假设:警察发现了某共同犯罪;警察所能使用的司法总资源是既定的;A和B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人;A和B被分别审查不能够进行沟通;在证据不足的情况下,只要有一方坦白,都可以使证据达到确凿的程度;警察的目的是实现惩罚的最大化;A和B的目的是实现惩罚的最小化。问题:警察如何实现惩罚的最大化?

警察有两个选择:第一,对坦白立功不采取从宽的政策,即使坦白立功对方,也不会得到任何减刑,即不选择宽严相济的刑事政策。第二,囚徒困境场合,即选择宽严相济的刑事政策。第一种选择:对坦白立功不采取从宽的政策,即不坚持宽严相济的刑事政策。在这种情况下对犯罪嫌疑人刑罚的影响见图2.7。

图(略)

可见,在第一种选择的情况下:第一,如果证据确凿,犯罪嫌疑人是否坦白立功对自己的刑罚不产生影响;第二,如果证据不足,坦白立功则面临10年监禁,证据不足则是0.5年监禁。

在第一种选择的情况下,假设B抵赖,则犯罪嫌疑人A坦白立功对犯罪嫌疑人B刑罚的影响同图2.7,即A的策略对B刑罚的影响与对自己的影响相同:在证据确凿的情况下,犯罪嫌疑人A是否坦白立功对B的刑罚不产生影响;在证据不足的情况下,A的坦白立功致使B面临10年监禁,不坦白立功则对B的刑罚没有影响,B的惩罚仍为0.5年监禁。

在第一种选择的情况下,警察所可能实现的刑罚如图2.8所示。

图(略)

可见,在第一种选择的情况下,如果证据确凿,警察实现的惩罚值都是20,立功与否对实现的惩罚值无影响。如果证据不足,警察可能实现的惩罚值有20和1三种可能。在证据不足的情况下,如果一方坦白立功,则另一方的态度不会对其刑罚构成影响。因此,警察是否能实现刑罚最大化取决于犯罪嫌疑人是否会坦白立功。从实际情况来看,在证据确凿的情况下,犯罪嫌疑人坦白立功与否对自己的刑罚不构成影响;在证据不足的情况下,犯罪嫌疑人的坦白立功会加重自己和共同犯罪人的刑罚;且由于信息不对称,犯罪嫌疑人不知道警察的证据是否确凿。因此,出于自己刑罚最小化的考虑,犯罪嫌疑人会选择不坦白立功。由于犯罪嫌疑人策略相同,因此,双方选择不坦白立功,则在证据不足的情况下,警察实现的惩罚值只有1年。当然,现实中不排除犯罪嫌疑人基于良心的谴责在翻然悔悟后坦白立功,亦不排除某个犯罪嫌疑人基于对共同犯罪人的憎恨和报复而鱼死网破的坦白和立功,但一般情况下,犯罪嫌疑人是没有坦白立功的动力的。

当然,警察也可以投入更多的司法资源去搜集证据,则最后可能实现的刑罚是20年。但需要注意,新投入的司法资源是有机会成本的。在司法资源既定的条件下,在本犯罪中投入更多的司法资源,意味着在其他案子中投入的司法资源相应减少,即使通过调查,最后实现了20年的惩罚,即警察增加了在本案中的惩罚值,但会减少在其他案件中的惩罚值,警察实现的惩罚总值在整体上没有变更,或者随着边际效用的递减,警察实现的惩罚总值在整体上也可能是减少的。

第二种选择,囚徒困境场合,即坚持宽严相济的刑事政策,坦白立功会得到减刑。犯罪嫌疑人在不同情况下的决策图及警察由此所能实现的刑罚总量如图2.9。

图(略)

第二种选择与我国刑法的规定相符合,坦白是酌定的量刑情节、立功是法定的量刑情节。在证据确凿的情况下,一方的坦白立功只对自己的刑罚产生影响,对另一方的刑罚不产生影响,即只要坦白立功,就可能获得减刑,我们假设在证据确凿的情况下,坦白立功的惩罚值为8年。在证据不足的情况下,如果均选择坦白立功则均获刑2年;A选择抵赖,则B选择坦白立功,则A获刑10年,B获刑0.4年;双方均选择抵赖则获刑0.5年。因此,在A选择抵赖的情况下,B选择抵赖获得的刑罚值为0.5年,选择坦白立功获得的刑罚值为0.4年;在A选择自首立功的情况下,A选择抵赖则获刑10年,选择坦白则获刑2年,因此,在证据不足的情况下,不管A的策略如何,B的最佳策略都是选择坦白。因此,不过证据确凿还是证据不足,对犯罪嫌疑人来说最佳的选择都是坦白。

如此,警察能实现的刑罚值为:证据确凿的情况下为16年,证据不足的情况下为4年。因此,在证据不足的情况下,坦白立功是量刑情节与坦白立功不是量刑情节相比,前者可以增加警察实现的刑罚值。因此,在证据不足的情况下,对警察来说,最佳的选择是坚持宽严相济的刑事政策,对坦白立功进行减刑。

囚徒困境的适用范围。第一,证据不足的案件。在证据确凿的场合,一方坦白与否对另一方的量刑不存在影响,因此,不存在设置非合作博弈的可能。第二,案外因素的影响。前述假定之一为犯罪嫌疑人的目的是刑罚最小化,但现实中,刑罚最小化只是犯罪嫌疑人的主要目的之一,犯罪嫌疑人的最根本目的是成本最小化。此处的成本包括接受的刑罚、刑满后或家人受报复的成本等等。因此,如果坦白立功所获得的减刑收入小于日后被报复所受到的损害,则犯罪嫌疑人也会选择抵赖。

第三,不同情况下的刑罚配置问题,即减刑的幅度问题,这是犯罪嫌疑人困境的关键点。犯罪嫌疑人困境博弈的结果必须使警察、犯罪嫌疑人之间都满意。要使囚徒困境的结果为警察所接受,则必须在双方都坦白立功的情况下的惩罚总值,大于一方坦白立功一方抵赖、及双方均抵赖的情况。依据表2.6,在双方都坦白的情况下,警察实现的惩罚值是4,而一方抵赖一方坦白的情况下,警察实现的惩罚值是10,因此,这不可能是警察接受的囚徒困境。要使犯罪嫌疑人双方接受囚徒困境结果,则必须满足:如果一方选择抵赖,则另一方选择坦白立功比选择抵赖的刑罚值低;如果一方选择坦白,则另一方选择坦白比选择抵赖的刑法值低。具体条件见表2.7。

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓

┃ 表2.7:囚徒困境策略图 ┃

┣━━━━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┫

┃ ┃ 囚徒A ┃ ┃

┃ 囚徒困境博弈 ┃ ┃ ┃

┃ ┣━━━━━━━━━━━━╋━━━━━━━━━━━━┫

┃ ┃ 立功 ┃ 不立功 ┃

┣━━━━━┳━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━━┫

┃ 囚徒B ┃ 立功 ┃P(t2下标),P.t2下标)┃P(t1下标),P(d1下标)┃

┣━━━━━╋━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━━┫

┃ ┃ 不立功 ┃P(d1下标)P(t1下标) ┃P(t0下标)P(t0下标) ┃

┗━━━━━┻━━━━━┻━━━━━━━━━━━━┻━━━━━━━━━━━━┛

P(t0下标)是指没有人坦白情况下,每个犯罪嫌疑人的惩罚值;

P(t1下标)是指一个人坦白立功,则该坦白立功人的惩罚值;

P(d1下标)是指一个人抵赖,则该抵赖人的惩罚值;

P(t2下标)是指在都坦白立功情况下,每个犯罪人的惩罚。

囚徒困境的适用公式为:

f(1下标)(x)=P(10下标)-P(t1下标)>0

f(2下标)(x)=P(d1下标)-P(t2下标)>0

f(3下标)(x)=2P(t2下标)-(P(t1下标)+P(d1下标))>0

f(4下标)(x)=(P(t1下标)+P(d1下标))-2P(t0下标)>0

这意味着:第一,一方选择抵赖的情况下,另一方选择坦白立功比选择抵赖的刑罚值要低,即方程f1(x)。第二,在一方选择坦白立功的情况下,另一方选择坦白立功要比选择抵赖的刑罚值低,即方程f2(x)。第三,在双方均选择坦白立功的情况下的惩罚总值,比一方坦白立功一方抵赖的情况下的惩罚总值高,即方程f(3下标)(x)。第四,一方坦白立功一方抵赖的情况下实现的惩罚总值,高于均抵赖情况下的惩罚总值,即方程f(4下标)(x)

第五,证据水平。如证据水平为零,则都抵赖的情况下的惩罚值为零,因此一方坦白立功一方抵赖的情况下坦白立功方的刑罚值要小于零,惩罚值为负数。这点和现实不符合。在此种情况下,需要设定其他激励机制,比如一定数额的奖金,才有可能是囚徒困境继续有效。

第六,现有刑法中,坦白是酌定量刑情节,一般立功是可以从轻或减轻,有重大立功的是可以减轻或免除处罚,都不是必须。因此,囚徒困境是否成功,一个很大的因素在于犯罪嫌疑人是否相信警察的信誉。第七,囚徒困境的拓展。为更有效的利用囚徒困境,法律可以设定先坦白立功的减刑幅度大于后坦白立功的犯罪嫌疑人。同时,囚徒困境还可以被用于同时犯罪的场合。

(三)本节结论

从上述分析可以看出,警察的不同选择会影响最后实现的刑罚数值。在证据确凿的情况下,是否设置坦白立功制度,对警察实现的刑罚值影响不大。但在证据不足、且不能再投入更多司法资源去搜集证据的情况下,是否设置坦白立功制度,对警察实现的刑罚值影响甚大。因此,坚持宽严相济的刑事政策,可以在证据不足的情况下,更有效的惩罚犯罪。

在证据确凿的情况下,坚持宽严相济的刑事政策与对坦白立功不减轻刑罚相比,会减轻处罚。但这点与警察的刑罚最大化的目的不相违背。第一,坦白立功是可以从轻和减轻处罚,是酌定情节,因此,坦白和立功未必一定减轻处罚;第二,警察的目的之一是刑法最大化,警察还有预防犯罪的目的追求,甚至预防犯罪才是警察的根本目的。一般来说,对心智成熟的成年人犯罪的预防主要是通过惩罚来形成心理强制,因此,需要刑罚最大化;同时,又会对其行为表现出来的悔改情节进行从轻,以鼓励犯罪嫌疑人改过自新。

坚持宽严相济的刑事政策需要注意:宽严相济的刑事政策的实际效果与证据水平密切相关,或者准确的说,与犯罪嫌疑人觉察到的警察所能掌握的证据水平有关。犯罪嫌疑人觉察到的警察所能掌握的证据水平,决定了其判断如果双方均抵赖的情况下,犯罪人所能获得的刑罚,从而影响其博弈进程。由于犯罪嫌疑人不知道警察掌握的证据情况,因此,如何充分利用既有的证据信息,尽可能多的让犯罪人感觉警察已掌握比实际情况更多的证据,也成为囚徒困境有效运作的一个重要内容。

五、宽严相济经济学视角的实践之二

——合作博弈之辩诉交易与坦白从宽辩诉交易和坦白从宽、抗拒从严都是坚持了宽严相济的刑事政策。从经济学角度看,该政策是合理的,因为其实质是在司法资源既定、证据不足的情况下,司法机关通过该制度安排,使司法机关与犯罪嫌疑人或被告人达成合作博弈,从而获取合作剩余的结果。

(一)辩诉交易与坦白从宽

辩诉交易(plea bargain),是美国的一项司法制度,指在法官开庭审理之前,处于控诉一方的检察官和代表被告人的辩护律师进行协商,以检察官撤销指控、降格指控或要求法官从轻判处刑罚为条件,换取被告人的认罪答辩(plea of Guilty)。或者进一步抽象为“理性的诉讼当事人即控辩双方给予较大的诉讼风险以及昂贵的诉讼成本,发现进行交易更符合他们的利益,从而达成一致,选择退出诉讼,打断诉讼进程并获得相应收益的‘辩诉和解’”。[17]

辩诉交易自产生以来就产生重大争议且从来没有停止过,拥护者和反对者的力量都很强大。1970年,美国联邦最高法院正式确认了辩诉交易的合法性。美国1974年修订施行的《联邦刑事诉讼规则》明确地将辩诉交易作为一项诉讼制度确立下来。1973年,阿拉斯加州检察长命令全州所有检察官停止参加辩诉交易。“全国刑事审判标准及目标咨询委员会”还在全国呼吁争取在1978年之前废除辩诉交易。

“坦白从宽,[18]抗拒从严”在进入21世纪之前,是我国司法活动中长期实施的一项未成文刑事政策。1956年,董必武在《关于肃清一切反革命分子问题的报告》中指出:镇压与宽大相结合的政策,这就是坦白从宽,抗拒从严,立功折罪,立大功受奖的政策。同年,罗瑞卿在《我国肃清反革命的主要情况与若干经验》中也指出:惩办与宽大相结合就是首恶必办,协从不问,坦白从宽,抗拒从严,立功折罪,立大功受奖。1984年1月9日最高人民检察院在《关于在严厉打击刑事犯罪中具体应用法律的若干问题的答复》指出:“坦白从宽,抗拒从严,是我们党的一贯政策。在这次严厉打击刑事犯罪的斗争中,仍要坚持按照犯罪分子的不同表现,区别对待……”。尽管在司法实践中有重要地位,且也得到了官方的认可,但是我国1979年所颁布的刑事诉讼法和刑法、1996年所修订的刑事诉讼法和1997年所修订的刑法,均没有将之法条化。

进入21世纪以后,在人权保障的旗帜下,法学界质疑声不断,认为“坦白从宽,抗拒从严”政策的背后,其实就是“有罪推定”的原则。一些公检法部门也开始修正这一政策。武汉市公安局、辽宁省抚顺市检察院、北京市海淀区检察院、海浦东新区看守所等等都陆续的从看守所和审讯室的墙上撤下这八个字。于是有评价认为该政策寿终正寝。本文认为“坦白从宽、抗拒从严”是否妥当要看从何种角度理解该政策,而从下述角度理解,该政策是合理的。第一,理解坦白从宽、抗拒从严的标准是证据水平:坦白从宽是指比照证据确凿情况下的惩罚从宽;抗拒从严是指与坦白从宽相对应的从严,相对于坦白后的从宽,不坦白但证据确凿情况下的惩罚就是“抗拒从严”。第二,从上述角度来理解,坦白从宽、抗拒从严和有罪推定是没有关联的。第三,“坦白从宽、牢底坐穿;抗拒从严,回家过年”俚语成立的条件是证据不足,在证据不足的情况下,从犯罪嫌疑人角度来看,坦白会导致重刑罚,抗拒会导致轻刑罚。下文我们会详细讨论此点。

辩诉交易实质是坚持宽严相济的刑事政策,在司法资源既定的条件下,检察官通过降低刑罚的严厉程度(从宽)来达到提高犯罪人的惩罚率(从严)的效果。

坦白从宽、抗拒从严亦是坚持了宽严相济的刑事政策,在司法资源既定的条件下,警察或检察官通过对犯罪嫌疑人坦白从宽来达到提高犯罪惩罚率(从严)的效果。

(二)不同选择、不同博弈

辩诉交易与坦白从宽、抗拒从严的博弈结构相同,本文只分析坦白从宽、抗拒从严的博弈结构。博弈参与者为:警检方与犯罪嫌疑人(被告人);博弈目的为有效惩罚犯罪与有效逃避惩罚;博弈策略为坦白从宽与坦白不从宽;博弈者掌握的信息为非完全信息。

基本假设:警察发现了某犯罪;警察所能使用的司法总资源是既定的;犯罪嫌疑人的目的是最大限度逃避惩罚;警察的目的是实现惩罚的最大化;犯罪嫌疑人和警察的信息是不对称的,即这使非完全信息博弈。问题:警察如何实现惩罚的最大化?

同审查共同犯罪一样,警察有两个选择:第一,对坦白不采取从宽的政策,即使坦白,也不会得到任何减刑,即不采取宽严相济的刑事政策。第二,采取坦白从宽的政策,即采取了宽严相济的刑事政策。

在第一种选择情况下,不论证据确凿与否,犯罪嫌疑人都没有坦白的动力。在前文囚徒困境中已经讨论过,在此不赘述。在第二种情况下,采取坦白从宽、抗拒从严的政策。假设证据确凿的情况下,惩罚值为10年,证据不足的情况下惩罚值为3年。其博弈图2.10所示。证据确凿情况下,坦白惩罚值为8年,证据不足的情况下,坦白惩罚值为5年。

合作博弈是否达成,取决于警察与犯罪嫌疑人是否可以就坦白以及由此减轻的刑罚达成一致。如果要警察接受坦白结果,则意味着在证据不足的情况下,坦白比不坦白实现的惩罚值要大。如果要犯罪嫌疑人接受坦白结果,则意味着在证据不足的情况下,坦白比不坦白实现的惩罚值要大。因此,上图的博弈结果,犯罪嫌疑人肯定不会接受。

关键问题是信息不对称。犯罪嫌疑人不知道警察手中的证据可以达到几年的量刑标准。如果犯罪嫌疑人知道警察手中的证据确凿,毫无疑问会选择坦白,因为即使不坦白,一样会被定罪量刑,而坦白会被减刑。如果犯罪嫌疑人知道警察手中的证据不足,[19]但不知道证据具体达到合作程度,是否坦白就变得不确定。犯罪嫌疑人处境有三种可能:第一,不坦白,警察投入更多的资源破案,最后证据确凿,被量刑10年;第二,不坦白,警察投入更多的资源搜集证据,但无法搜集更多的证据,或警察无力投入更多的司法资源搜集证据,最后无罪释放或量低比坦白后的量刑要轻;第三,坦白,获得减刑,但减刑后的刑罚与不坦白的刑罚相比,或者轻、或者重。因此,选择坦白与否,犯罪嫌疑人需要做概率衡量。如果不坦白,犯罪嫌疑人获得的刑罚值是10*X*Y,X是警察继续搜集证据的概率、Y是继续搜集证据后证据确凿的概率。如果坦白,犯罪嫌疑人获得的刑罚值是10-M,M是被减刑的数值。因此,坦白与否取决于下面的方程:

f=10*X*Y-(10-M)

只有f>0,犯罪嫌疑人才有坦白的可能。同时,犯罪嫌疑人还需要考虑减刑被兑现的可能性(用N标示),因为最后的量刑者是法官,而不是警察。因此,是否坦白公式就相应变更为:

f=10*X*Y-(10-M*N)

从警察角度来看,则相反。只有f<0,才会接受犯罪嫌疑人的坦白,而不继续调查。因此,看起来警察和犯罪嫌疑人似乎永远无法就坦白达成一致。但现实是警察和犯罪嫌疑人经常达成一致,原因在于双方信息不对称,因此,双方对X、Y和N这三个概率的判断不一致。如此,坦白从宽合作博弈的取得根本取决于双方对概率的判断不一致。控辩交易也适用同样的道理。

(三)本节结论

因此,坚持坦白从宽、抗拒从严的刑事政策,即坚持宽严相济的刑事政策有助于警察与犯罪嫌疑人之间合作博弈的达成。警察可以通过相关策略影响犯罪嫌疑人对X、Y和N这三个概率的判断,从而实现让犯罪嫌疑人坦白的目的。

六、结论

通过上面的分析,本文认为:第一,用经济理论来分析宽严相济的刑事政策是可行和妥当的。刑罚的目的是惩罚与预防的统一,任何刑事政策均是价值理性与工具理性的统一,用经济学理论来分析宽严相济的刑事政策实质是分析如何有效的进行犯罪预防,着重的是宽严相济的工具理性。第二,用经济理论来分析宽严相济的刑事政策对预防犯罪有重要启示:预防犯罪要考虑宽严结合、考虑司法资源的不同使用方式。由于人们会对不同的激励做出不同的反应、且任何事物的效用都是边际效用递减,因此,“严打”的作用是有限度的,一味的从严会并不会达到最佳的犯罪预防效果。犯罪与社会的正义程度、教育程度、贫富分化程度紧密相关,因此,预防犯罪并不必然意味着更多的警察、检察官、法官和监狱,将拟增加用于上述用途的司法资源投入教育、社会保障可能会得到更加的犯罪预防效果。第三,宽严相济刑事政策的发挥效用需要合理的配置宽和严的程度,而经济学理论可以指导我们如何确定宽和严的有机结合点,以发挥宽严相济刑事政策的预期效果。




【作者简介】
牛广济,北京大学刑法学博士研究生。


【注释】
[1]马克思·韦伯首次将价值理性(Wertratingalitat)与工具理性(Zweckrationalitat)对立使用,认为价值理性为一定行为的无条件价值,强调动机纯正和手段正确的去实现自己意欲达到的目的,而不管其目的是否达致,即“有意识地对一个特定行为的无条件的、固有价值的纯粹信仰,不管是否取得成就”;韦伯认为工具理性是指“通过对外界事物的情况和其他人的举止的期待,并利用这种期待作为‘条件’或者作为‘手段’,以期实现自己合乎理性所争取和考虑的作为成果的目的”。赵士发:《关于合理性问题的研究综述》,《人文杂志》,2000年第2期;(德)马克斯·韦伯:《经济与社会(上卷)》,林荣远译,北京:商务印书馆,1997年,第56页。
[2]Olson,Robert G.1967.“Deontological Ethics”.In Paul Edwards(ed.)The Encyclopedia of Philosophy.London:Collier Macmillan:343.
[3]Flew,Antony.1979.Consequentialism.'In A Dictionary of Philosophy,(2nd Ed.).New York:St Martins:73.
[4]高铭暄、张杰:《宽严相济刑事政策与酌定量刑情节的适用》,《中国刑事政策报告(第一辑)》,北京:中国法制出版社,2007年,第5页。
[5]马克昌.:《宽严相济刑事政策刍议》,《人民检察》2006年第10期。
[6]储槐植、赵合理:《国际视野下的宽严相济的刑事政策》,《法学论坛》2007年第3期。
[7]吴宗宪:《解读宽严相济的刑事政策》,《中国人民公安大学学报(社会科学版)》2007年第1期。
[8]陈兴良编:《宽严相济刑事政策研究》,北京:中国人民大学出版社,2007年,第11—13页。
[9]罗干在2005年12月5日全国政法工作会议上的讲话,转引自马克昌:《宽严相济刑事政策刍议》,《人民检察》2006年第10期。
[10]肖扬.最高人民法院工作报告(2006年3月11日在第十届全国人民代表大会第四次会议上)(EB/OL).http://www.gov.cn/jrzg/2006—03/19/content_230762.htm,2008—1—8日访问.
[11]贾春旺.最高人民检察院工作报告(2006年3月11日在第十届全国人民代表大会第四次会议上)(EB/OL).http://www.spp.gov.cn/site2006/2006—03—20/000185866.htm,l2008—1—8日访问.
[12]高铭暄、张杰:《宽严相济刑事政策与酌定量刑情节的适用》,《中国刑事政策报告(第一辑)》,北京:中国法制出版社,2007年,第5页。
[13]罗干在2005年12月5日全国政法工作会议上的讲话,转引自马克昌:《宽严相济刑事政策刍议》,《人民检察》2006年第10期。
[14]张五常:《科斯定理的谬误》,(EB/OL).张五常新浪博客http://blog.sina.com.cn/s/blog_47841af7010003th.htm,l2008—1—7日访问。
[15]A养了一条爱叫的狗,A从养狗中获得收益;B是A的邻居,因狗叫而无法正常入眠,B因此遭受到损失。A和B可以谈判来解决这个问题。但是A和B的谈判并不能总达成一致,比如A和B来自不同的国家说不同的语言,因此,要谈判需要雇用翻译,而翻译费用很高,因此,A和B选择拒绝谈判。假设A和B选择了谈判,现在讨论是A付钱给B赔偿B的损失,还是B付钱给A购买安宁,从经济学来看,这两种结果均是有效率的结果,可从法律来看,在两种情况下,A和B的福利会受到不同的影响。(美)曼昆:《经济学原理—微观经济学分册》,梁小民译,北京:北京大学出版社,2006年,第206页。
[16](美)曼昆:《经济学原理—微观经济学分册》,梁小民译,北京:北京大学出版社,2006年,第7页。
[17]龙宗智:《正义是有代价的—论我国刑事司法中的辩诉交易兼论一种新的诉讼观》,《政法论坛》2002年第6期。
[18]在本文的“坦白从宽”的“坦白”是指如实供述中的“坦白”,即“犯罪行为已被有关组织或者司法机关发觉、怀疑,而对犯罪分子进行询问、传讯,或者采取强制措施后,犯罪分子如实供认这些罪行的行为。对于罪犯确能坦白其罪行的,依照刑法第五十七条的规定,视坦白程度,可以酌情从宽处理”,详见《关于处理自首和有关问题具体应用法律若干问题的解答》。
[19]在多数情况下都是这种情况,因为如果证据确凿,在警察审讯犯罪嫌疑人过程中,犯罪嫌疑人很容易捕捉到该信息。
相关法律知识
咨询律师
孙焕华律师 
北京朝阳区
已帮助 42 人解决问题
电话咨询在线咨询
杨丽律师 
北京朝阳区
已帮助 126 人解决问题
电话咨询在线咨询
陈峰律师 
辽宁鞍山
已帮助 2475 人解决问题
电话咨询在线咨询
更多律师
©2004-2014 110网 客户端 | 触屏版丨电脑版  
万名律师免费解答咨询!
法律热点