3250200000006

第6章职称业绩要点啥季羡林教授曾经讲道：“原来我开过玩笑，我说将来只要进了北大，包括工人在内，一

第二节人才评价的误区

要了解人才评价的误区，必须首先了解一下科技评价的现状。

（一）评价主体政府化

科技发展有它自身的规律性，而科技人才评价就是要适应这种规律。政府主管部门只能依照科技发展规律进行间接管理，而不可以用主观意志行事。在科学理论上，一般要采取同行评议和“百花齐放，百家争鸣”相结合的方式进行评价；技术成果要靠成果查新和生产实践检验相结合的方式进行评价。受“官本位”观念的影响，科技评价政府化的模式一直是我国自主创新的羁绊。造成行政标准和专家标准之间的差异，除了思维方式和考虑问题的角度不同外，公务员的个人素质和部门利益也有一份。正如英国科学家马凯所讲：“多数公务员都不是科学家，他们不会自然而然地想到用科学方式去处理问题。”

科技评价政府化的基本标志就是行政级别化，将科技上的许多事物都贴上行政级别的标签，然后按照标签的级别来判断该事物的优劣，具体包括科研课题的级别、成果鉴定的级别、成果奖励的级别、人才培养的级别、出版机构的级别等。各级政府在规划科研计划时，一般是为了适应经济建设的急需和技术储备而开展的。依照科学学的划分，那种为实现特定目标，由国家资助的规模宏大的科研课题被称之为大科学；而将那些由科学家凭兴趣自发进行的，不以实用为目的的基础性研究称之为小科学。从文艺复兴到工业革命的200多年间，科学的每一次进展无不凝聚着小科学研究的功绩。20世纪下半期，随着社会经济对科学技术提出的要求加强，各国政府都加强了对科技规划的控制。但即使是在这样一个时代，小科学非但没有消亡，反而以更加积极主动的姿态参与其中。从另一个角度来看，暂时的“无用”，可能就是将来的“大用”。自然科学史中许多重大突破，往往是自由探索的结果，即使是近代科学已经强调集体研究之后，重大发现如DNA双螺旋结构的发现等，仍然是少数科学家自由探索的结果。由此可以看出，科学家的自由探索都有可能成为大科学之源，大科学与小科学的关系是相互依存、相辅相成的。但是我们在对科研项目的评价上，以政府的行政级别代替对课题的实际评价，这在满足大科学需要的同时，也就极大地压抑了小科学的发展。其实也有不少“有心栽花花不开，无心插柳柳成荫”的反差现象，我国立项课题的成果转化率只有百分之十几就是事实。既然是小科学就意味着很少能得到政府的资助，不被立项资助就属于自选课题，也就意味着无政府课题级别，无级别就不能算做一条业绩，也就表明科学家的工作得不到承认，因此就不能成为高层次人才。

我国省部级以上课题的申请资助率仅有10%，而不被资助的课题还有很大的比例以自费的形式在进行。这种不花国家的钱就不是高层次人才的做法，让许多科学工作者感到心寒，从中您可以窥视到人才的标准是怎么回事。另一方面，目前工业发达国家的研究开发经费大多数都来自企业的投资，在企业是技术创新的主体已经确立的今天，课题层次的政府级别化，更加引导了科技力量向“政府”计划靠近，而不是向企业和市场靠近。某著名大学的校长就曾经谈到，国家科研经费的争取关系到高校的地位，必须全力以赴；而企业的科研经费则无关紧要。这种思想对于科技大军投向国民经济建设的主战场，对于科研选题企业化、科技成果商品化、科技与经济相结合都是一个极为不利的导向。

其次，成果鉴定、出版物和奖励都打上政府的规格，对于科技的发展也非常不利。其实，无论成果鉴定属什么级别，无一不是建立在同行评议基础之上的，而同行评议的标准取决于同行专家的科学素质，而与政府的行政级别没有太大的关联。

（二）条件指标“一刀切”

现代科学认为，自然界及其社会现象存在着多因多果、多因一果和一因多果等表现形态。然而在科技评价的指标设置上，却出现了“唯条件论（主要指资格条件）”，甚至只考虑外部条件，不考虑内部条件，认为外部条件必然会产生事物的结果。在条件指标的设置上，各种条件指标，或称作资格规范，它既有与产出指标密切联系的一面，同时也有互相分离，甚至互相排斥的一面。“二战”之后，美国成为世界的科学中心，条件之优越是其他国家所无法比拟的，但是战后最伟大的发现——基因双螺旋结构，却是在遭受战争严重破坏的英国卡文迪什实验室出现的，这说明了单靠好的物质条件并不一定能最快产生最好的科研成果。我国两弹一星的研制成功，基本条件之一就是爱国心、使命感和由此而来的献身精神和高度的责任心。目前我国的条件指标多为“一票否决制”，走向极端，形成典型的“过度开采”和“应力集中”，在某种程度上架空了“产出指标”，并有“塌方”的隐患。如外语水平的高低与一个人接受信息的流量和质量成正比。但是如果一个人把全部精力或绝大多数精力都用在外语水平的提高上面，很少或从不接受最新的专业信息，则有违于条件指标的设置，形成一种“单纯的外部条件决定论”。所以我们讲，优秀的科技人才必定具备良好的外语水平，但具备良好的外语水平并不一定就是优秀的专业技术人才，因为仅有外语水平而无专业水平的人才，是绝对不能胜任专业工作的。这种怀疑不是没有根据，《中国青年报》1999年曾载文：大学生为了外语过级，几乎占用了全部的课余时间，有的甚至在专业课上都在学外语，他们视外语过级为取得文凭走向社会的敲门砖，目的达到之后便将外语抛到一边，结果是专业未学好，外语的实际水平也不怎么样，这种竹篮打水一场空的局面在专业技术人员晋升职称中也大量存在。2006年《光明日报》记者赵婧、杜婷报道，《八千万学子习外语，翻译人才缺九成》一文说的就是一种敲门砖现象。我们的近邻印度由于历史上的原因，是一个英语化程度很高的国家，但其科技水平就未必高，多年来其国际论文的数量都未能进入十强。相反，在亚洲参加“托福考试”每年超过千人的九个国家中，日本几乎年年名列倒数第一，但日本却是著名的科技强国。

我们知道，人才是分层次的，对高层次科技人才实行“条件一票否决制”多少还有些道理，而对于一些中低级科技人才也实行“一票否决制”则是赶鸭子上架，也不符合本国国情和人才群体结构的需要，这牵涉到一个“知识结构协调与适应”的问题。在正常情况下，一个人的时间、精力和能力是有限的，过度强调某一个或某几个单项指标形成“应力集中”现象，必然会压抑和限制其他指标的发展提高，从而导致知识结构和能力结构的严重失衡。如在体育竞赛上，过度的训练会导致激素的反应出现异常，形成“训练得越多，成绩反而越差”的反常现象。因此，条件指标实行“一票否决制”，应局限在高层次科技人才和青年科技人才的特殊岗位内。对于非高层次科技人才和非青年科技人才要淡化条件指标，重在实绩和贡献。因为人的各种素质是有差异的，按照“一刀切”的模式，虽然也能构建一支“整齐划一”的人才队伍，但扼杀了人才的个性，对于整个有层次的科技队伍来讲却是弊多利少。因此，重视实际能力和实际产出，也应成为人才评价的一个基本原则。

（三）吹大的气球怕针扎

由于科技评价的结果通常关系到集体和个人劳动报酬的分配、社会地位的提高，而人的行为又都是以最小的代价来谋取最大的利益，这就是“最小用力原理”。用“短径效应”可以表述为，“如果一个运动员在较短的赛道上能够摘取金牌，那么较长的赛道必定会长满荒草的”，那种总是从善良的愿望出发，认为一切事物都是美好的，所有成员都是科学规范的楷模的理想主义者，在指标体系的设置上产生了许多纰漏，造成了形式上件件齐全，创新上却平平庸庸，造成业绩指标的泡沫化。

首先是业绩指标与产出指标不一致，许多指标的设置将课题的级别、经费的多少，甚至学历和职称的高低等投入指标和条件指标也列为业绩指标，似乎谁要来的钱多谁就是最杰出的科学家，谁未获得经费资助谁就不是一个合格的科学工作者。如果投入指标是未来的产出，则无疑是虚假业绩，是子吃卯粮；如果投入指标是低产出或不产出，则又作如何解释？没有人能够保证所有的投入都会有产出。我们可以通过一个经济学案例，来揭示这种逻辑的荒谬性：2007年，美国约有40～50万个家庭因为无力偿还次贷而陷于“负资产”的窘迫状态。美国人历来是不存款的，而是靠贷款预支为生的。房地产涨了，把涨的30%再抵押借钱来花。直到房市跌落时，美国出现了严重的“次贷危机”，波及全球经济，美国人这下子尝到了“寅吃卯粮”、只管近期、不顾长远的苦头了。国内外有许多人沦为“银行卡奴”，同样是超前消费的苦果。

其二是随意拔高成果的鉴定水平，形成“鲜有通不过的鉴定”。某地区在4000多项成果的鉴定中，就有1000多项被评为国际先进水平。在鉴定过程中，领导拍板、课题组变相行贿、违反鉴定程序、查新报告走过程、非同行专家参与等现象已是见怪不怪，但许多管理部门（含组织人事部门）和一些评估研究者，还一如既往地视成果鉴定为金科玉律，是业绩指标中的硬棒货。

其三是名词增长产量不增长。科技劳动产品一般表现为理论成果和技术成果两大类，其中每一类都有许多不同的表现形式。但是现在的指标设置不是依照这两类成果来评判的，而是围绕着一些具体的形式来发签，只盯影子不盯人。如一项理论成果，先是发表一批论文，对论文进行评奖，继而是汇集出版学术著作，然后进行成果鉴定，最后去申请各级各类科技奖励。这几种连贯的形式是逐渐增加的，且每一种都是建立在前一种的基础之上，所以对其评价是一个追加过程，而不应是一种相加过程。

其四是重视数量轻视质量，重视形式齐全轻视创新水平，造成业绩的泡沫化。

其五是商业性出版泛滥，直接造成泡沫式的虚假繁荣。卖书号、卖版面屡禁不止，根本原因在于许多管理者和评估者的眼中只有钱，而对于真正的研究成果则不知爱惜。而一大批商业性出版物更是钱到即发、钱多多发、钱少少发，多卷本一个赛一个，一位科技人员每年收到近百封这样的邀请函就是最好的证明。

（四）民间已多年，天上才一日

我国的人才评价大致经历了政治评议、同行评议、量化打分和科学计量等阶段，它们既有理论上的可行性，又有典范的成功案例，但被推广应用却非常迟缓。一些管理者习惯于延续个人的思维，搞投票表决和暗箱操作的评价方式，奉行着“说你行你就行不行也行”的选票原则，缺少一个看得清、摸得着的阳光标准，不同的评价客体缺乏数量上和质量上的比较。若某人提出不同意见，他们还振振有词，反正你票不够，谁也没有办法。于是请客送礼、行贿受贿半公开地进行。科学共同体中产生的引证评价，是真正意义上的同行评议，是一种本色标准，但这种引证评价目前却很少应用。造成这种评价方法滞后化的原因，一是评价的主体与学术研究相分离，即负责科技评价的管理人员不了解科技发展的规律，也不去了解科技评价的前沿动态，自以为是、自作主张，形成“民间已多年，天上才一日”的隔离状态，评价方式十几年不变。如科技部在1999年上半年就决定对“九五”攻关成果不再进行鉴定，但组织人事部门对于人才的评价，仍将人才与鉴定成果绑在一起，并与社会福利紧密联系。二是部门利益牵制的结果，如果公开量化、比分高低，则失去了自身的利益，结果会使某几个人说了算的时代不再灵验。解决这个症结，最好的办法是实行科学民主的管理办法。

（五）量化评价，乱点“鸳鸯谱”

业绩指标的分析处理要本着从价值规律出发，按照价值质量的高低和社会必要劳动时间来计量。科学计量学专家蒋国华教授也认为，指标的处理，除了在试用过程中，听取各方意见并及时加以修改外，还要加强大范围的科学计量研究。如搜取全国范围的统计数据，并对这些数据进行相关性研究，从不同数据间的相关度，来确定它们应占的比重，从而使量化的人为因素减少，使权重设计更加科学。然而目前在一些综合加权的处理上，主观化倾向不能不令人担忧，使科学计量工作在很大程度上蒙受了阴影。2000年教育部科技司负责人就谈道：“一个高科技企业相当于多少篇SCI论文？百万科技经费等于多少专利成果？以此方法评价高校科技实力，似有关公战秦琼之嫌。”如网大发布的“2000中国大学排行榜”，在权重的处理上自然科学国际论文（SCI）和社会科学国际论文（SSCI）的赋分同为3.8分；而在学术专著的权重处理上，自然科学专著为社会科学专著的12倍，这中间有什么理论依据？吴书连教授所做的对学术专著进行专家问卷调查中，有的认为“现在出专著，只要给钱就行，水平可以不问”，“最多相当于地方学术期刊上的两篇论文”；而有的却认为“专著所起的作用也比一个国家奖大”。这些回答都从一个侧面评价了学术专著的分量，但要取其中位数作为权重进行“均贫富”，却不大合适，更不应当搞此贵彼贱，简单地认为人文社科类就容易，自然科学类便高深。在学术界中，学术会议出版的论文集要比同级学术期刊的分量低得多，但有些指标的处理者却将论文集的权重高于同级学术期刊，让人莫名其妙。科学计量学的理论和实践都认为，不同类别的业绩指标，不同学科期刊的影响因子，都是缺乏可比性的。如果在起跑线上和路线上出现了错误，即使设计得非常精致，计算的数学模型非常高深，也不过是主观的产物。这一点，在指标的处理上必须引起重视，否则会为方兴未艾的量化评价带来灾难。

第6章 职称业绩要点啥 季羡林教授曾经讲道：“原来我开过玩笑，我说将来只要进了北大，包括工人在内，一

第6章职称业绩要点啥季羡林教授曾经讲道：“原来我开过玩笑，我说将来只要进了北大，包括工人在内，一