从IMDb的角度看,豆瓣评分真的有那么不堪吗?

尽管豆瓣的评分体系在准确度上依然略逊于IMDb,但评分体系本身并没有好坏的明显界限。只要建立合适的放作弊机制,任何体系都是值得信赖的。

下面火箭君就给你解释为什么这样认为:

了解下IMDb

IMDb是什么? IMDb全称为互联网电影资料库(Internet Movie Database),是目前全世界最知名的电影评分网站之一,同时它的评分均来自于观众而非专业电影从业者。它目前的Alexa世界网站排名为55,而豆瓣为346。可见其体量和知名程度。

豆瓣与IMDb评分系统的差别

01 评分算法的差别

IMDb的算法: 根据IMDb网站中有关评分计算的自述,其IMDb 250榜单的排名采用了贝叶斯估计法,并遵照了以下的计算公式: weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 其中

  • R-该部电影的加权平均分

  • v-投票人数

  • m-进入IMDb 250榜单所需要的最小票数,目前为1250票

  • C-目前所有电影的平均得分

豆瓣的算法: 尽管豆瓣官方并没有出台过有关评分计算的具体方法,但通过豆瓣创始人阿北之前博文中的描述:

豆瓣的注册用户看完一部电影,心情好的话会来打个一到五星的分(有时候心情不好也会来)。比方说一部电影有42万用户打分。我们的程序把这42万个一到五星换算成零到十分,加起来除以42万,就得到了豆瓣评分。这个评分会自动出现在豆瓣各处,中间没有审核,平时也没有编辑盯着看。每过若干分钟,程序会自动重跑一遍,把最新打分的人的意见包括进来。

可以基本理解为,豆瓣的算法基本就是最简单的加权平均。同时,简单将5星评分系统转换成10分制的评分结果,也必定造成一定的误差。

02 投票统计的差别

IMDb的统计 IMDb对于每一部电影的评分,均进行了较为详实的投票人群分析,从性别、年龄等多个维度展现了投票人群画像。

豆瓣的统计: 而豆瓣在评分统计时,仅能体现全体用户所打的星数,以及对应的占比。但火箭君个人认为,豆瓣通过用户行为的分析,基本能给投票人群进行较为准确地区分,只不过这种间接的分析结果,可能会造成用户对于评分可信度的质疑。与其多一事,还不如少一事,因此豆瓣就没有将投票打分人群再进行更细的划分。

03 防作弊机制的差别

IMDb的防作弊: 虽然IMDb没有公布具体防作弊机制的原理,但就IMDb 250榜单的投票人群选择上,其明确表示,只接受Regular Voter的投票结果: 尽管没有明确定义,但至少可以认为这样的举措将有利于降低刷票的行为。 豆瓣的防作弊: 这点上豆瓣一如既往地固执其自身的判断法则,也没有对外公布防作弊机制。我们仅能从阿北的博文中窥探一些他的“执念”:

豆瓣这两年的原则是“所有能判断属于非正常评分的一概不算”,不分高低贵贱颜色。(捍卫评分公正的用户,真的抱歉加感激。但这应该是我们的工作,不是大家的,一时没做好是我们失职。)。“不算”非常简单可操作,但“判断属于非正常评分”不是那么直接。豆瓣一代接一代的算法工程师、程序员、编辑和产品经理在这件事上贡献过才智,最后都落实在二十四小时跑的大小程序上面。这确实是持续的、魔高一尺道高一丈的事情。但现在门槛已经很高,声称能刷分的基本是在骗人。

但不公布,不代表不做。从阿北的博文中可以看出,豆瓣对于打击刷分行为的严肃程度,在这几年并没有放松,相反,还有所上升。只不过,任何时候,你考虑问题都很难做到尽善尽美,但只要不断改进,那防作弊系统的成果还是可以值得用户信赖的。

要分清的是,IMDb所公布的计分方法,仅适用于Top 250榜单。对于榜单外的计分方法,这也是一个迷。