聊聊互联网的评分系统

评分系统是现在各大互联网产品的常规配置，尤其是电子商务、点评、社交、应用下载等产品更是重要，只是采取的形式各有不同，有些严谨、专业，有些轻松、娱乐。在一些专业性比较强的网站上，评分高低直接影响用户的决策。如豆瓣上电影的评分，已经能够影响票房了。

评分系统目前主要有两种形式：星级评价、二元化评价。星级评价常见的有五星制、十星制，其中五星制为主流；二元化评价根据表述不同则有“赞成/反对”、“顶/踩”、“喜欢/不喜欢”等。

一、星级评价

采用星级评价一般多为电子商务网站、点评类、社交网站，如淘宝、大众点评、豆瓣等。星级评价相对来说比较严谨、专业，他的评分结果对用户有极大参考价值，对评分行为的要求也相对较高。

星级评价目前主要有五星制和十星制。

五星制的最常见，如豆瓣：

但也有一些网站提供了十星制，如时光网、imdb、.metacritic等影评类网站

Mtime时光网

Imdb

Metacritic

那么，五星制还是十星制？

评分系统是为了将用户对某一种事物的主观体验转化为一个客观的量化标准，从而对没有体验过的用户形成一个参考。这里必须考虑作为分数提供者的“人”的因素。心理学家认为，进行成对比较的因素太多，将超出人的判断能力，最多大致在7正负2的范围，也就是5和9。5星制和9星制存在明显的中间值，中间值是评分准则的安全岛。10 星制则就不存在安全岛（上面metacritic的例子，有个0分，事实上算11分了）。

另外，太多的选择对用户来说，反而增加了压力，你无法精确的估量10星制中3分和4分之间的差异。颗粒度越细，评价的难度也就越高。当然如果简化到只有好、中、差3个层级，则又显得颗粒度太小，排除很好和很差的，其余的只能归为“中”了。而5星制第1到第5颗星分别为”很差”、”较差”、“还行”、“推荐”、“强烈推荐”。用户对这种5星制的评分系统本身已经非常熟悉，每颗星代表的含义在不同的用户身上的认知也比较统一。

另外很多学者进行研究发现，5分值可以有效还原9分值体系的内容，在绝大部分情况下可以还原原始数据的90%以上的信息，3分值体系可以还原70%左右。

因此，结合定性转化为定量数据的有效精确性和用户操作评分的过程难易来讲，五星制对于互联网来说比较合适。当然，十星制（九星）也并非毫无是处的，他颗粒度更细，能提供更精准的数据，只不过评分者更累些，适合更学术性的。

星星以外的

“烂番茄”（Rotten Tomatoes）这个网站除了提供评分外，还有一个“新鲜度”的指标。下图的“番茄”图标代表“新鲜”，那个看上去有点像青菜（我的第一感觉是看上去像青菜，实际是个“腐烂” 图标）的图标代表“腐烂”。若正面的评论超过60%以上，该部作品将会被认为是“新鲜”（fresh）。相反的，若一部作品的正面评价低于60%，则该作品会被标示为“腐烂”（rotten）。

Rotten Tomatoes

Goodfilms 这个网站也采用了两个维度的评分，星星表示“评分”，表情表示“可反复观看指数”。

另外，还在详情页上展示了一个比较有意思的二维图来表示结果。图中的横坐标代表大家熟悉的“评分”，纵坐标代笔了“可反复观看指数”。图中趋向右上角的点越多，说明影片的综合质量和享受程度越高。图1比图2明显更优。

（图1）

（图2）

二、二元化评分

二元化评价指的是评价非此即彼，不是肯定的就是否定的，如“顶/踩”、“喜欢/不喜欢”。常用于问答类、文章图片分享类等网站，如知乎、糗事百科。

相比于打分评价，这种评价更加的快速、简单。用户使用频率高且单个花费成本低的适合作为二元化评价系统的评论对象。在电子商务网站上，用户的购买行为花费的成本要高的多，而且频率低，用户会更愿意花费相应时间和精力去评价完成的这次体验。而当你在知乎上看文章的时，半个小时足可以看很多篇，每篇文章用户花费的成本很低，并且看文章频率相对较高，这个时候快速、简单的评价方式更容易让用户触动鼠标。

另外，为了避免打消内容发布者的积极性，一般只有“顶”，没有“踩”，或者只显示“顶”的数量，而不显示“踩”的数量。知乎上“踩”一下等于在“顶”的数量上-1，但并不显示“踩”的数量。

一、星级评价

那么，五星制还是十星制？

星星以外的

二、二元化评分

发表评论 Cancel comment reply