jionlp数据分析

V1

2022/10/25阅读:18主题:默认主题

实锤!豆瓣8.0分的梦华录究竟有多大水分?豆瓣上的影视剧评分可靠吗?

前段时间,电视剧《梦华录》大火。

这部剧自从上架开播以来,就争议不断,豆瓣上的喝彩声和批评声汇成一片。

于是,我就从豆瓣上找了一些数据拿来分析了一下,发现了《梦华录》这部剧的营销和刷分手段是有多么风骚。本文就用这些豆瓣评论数据,好好分析揭露一下,《梦华录》到底在豆瓣上做了些什么。

《梦华录》豆瓣主页
《梦华录》豆瓣主页

截至本文发稿时,《梦华录》在豆瓣上的评分是8.0分,总共有77万人做了打分,有40%的豆瓣用户给该剧打出了5颗星,即满分10分。

豆瓣统计影视剧评分的手段是把每一个用户给出的分数做一个平均数。我对这个分数十分存疑,因为我们根本看不到所有的用户打分情况

豆瓣还包括用户的短评,即用户不仅仅是打个分就完了,还对电视剧进行了简短的评价,有35万人做出了评价。

这35万人的评价信息,豆瓣并非完全开放给用户,它只开放了最热门,用户点赞最多的600条短评。

我统计了一下《梦华录》的这600条评论的打分情况,得到的分数情况是这样的:

《梦华录》短评平均分比官方打分低了近3分
《梦华录》短评平均分比官方打分低了近3分

好家伙,我计算得到5.3分的时候,都震惊了!这评分怎么就和豆瓣官方展示的评分差了这么多?

与官方显示40%的用户打了5星相比,最热的600条评论呈现明显的两极分化,有20%的人打5星高分,也有一半多的人打了1星和2星。反而是3星和4星的人很少。

本着严谨的态度,我又仔细观察了一下这些最热的短评,还发现了一些蛛丝马迹。有一个豆瓣机器命名的账号给《梦华录》打了5分。《梦华录》2022年6月2日开播,该账号2022年6月5日注册。

水军僵尸账号实锤
水军僵尸账号实锤
水军僵尸账号注册时间:梦华录开播3天后
水军僵尸账号注册时间:梦华录开播3天后

该账号注册进来以后,就在6月5日干了一件事:给《梦华录》打5星好评。

水军账号的所有操作
水军账号的所有操作

此后,至本文发稿的时候,该账号都再没有上线活跃过。《梦华录》的水军僵尸买分实锤了。这是该账号的链接,感兴趣可以去看看水军账号

可能很多小伙伴对我的统计有质疑,明明官方打分是十几万人共同打分的结果,而我仅仅选取了其中最热评600条,就说《梦华录》的真实打分只有 5.3 分,是不是太过不严谨?

首先需要明确的是,豆瓣官方本身限制了用户对所有评论的查阅权限,这本身就使得官方打分不够信服。

其次,豆瓣的每一条短评还包含一个赞同键,只要有人觉得某条短评质量好,就可以对其进行点赞。

短评点赞扩大了用户范围
短评点赞扩大了用户范围

这样一来,我们的600条短评就不仅仅是 600个用户的打分了,而至少是上万人的打分。这样数据量就大大增加了。

近3万人的赞同,相对于间接评价
近3万人的赞同,相对于间接评价

如果把赞同数也算在统计范畴之内,并且剔除掉之前的那些机器人评价。那么最热评论的打分就成了一种加权统计,结果如下表:

梦华录的加权平均
梦华录的加权平均

从图中可以看出,两级分化地更加严重了。与无加权平均分相比,只有1星的占比是固定不变的28%,而5星的占比大幅度上升至40%多。直白一点讲,结论就是有很多用户极力地给5星评价点赞,导致分数比纯平均分高

当然,我们依然不能够说,6.3分就是梦华录的最终得分,豆瓣短评除了已看评论,还有在看评论。统计在看评论加权平均分可以得到如下表:

过于失真的在看评论统计
过于失真的在看评论统计

由于此部分数据量较少,仅仅200条,这个数据统计出来竟有 9.5 分。这个分数在全豆瓣已经超过了《肖申克的救赎》、《霸王别姬》。看到这里相信很多人和我有相同的感觉,那就是惊得下巴掉了,如果我说这个在看短评是被《梦华录》的水军及粉丝操纵过的,应该没有人有意见吧?

《梦华录》的水军们,刷分要刷的自然一点、丝滑一些,不要这么僵硬,可以吗?

《梦华录》的不同统计口径得出的分布差异过大,不符合随机采用统计规律

用白话讲,就是不论我是2022年统计,还是2025年统计,《梦华录》的评分应该变化不大才对,从统计学角度来讲,这个叫做平稳分布

由于每一条评论都包含评论发出的日期,于是我统计了《梦华录》自从开播以来的豆瓣打分结果走向:

开播前三天,综合评分最高
开播前三天,综合评分最高

该剧6月2号开播,7月5号完结。

自从6月2号开播以来,该剧的评分直冲到 9.1分,此后不断降低,直到6月30日的 6.3分,才维持在了一个稳定的分数。

对于普通观众来说,在《梦华录》开播时,都会第一时间上豆瓣上搜一搜,看看这部剧的质量究竟怎样,如果剧比较烂,那就直接不再关注了。

相应的,对于剧方来说,抓住刚开播的时机,马上在豆瓣上用大量的5星好评给观众洗头,才是收获播放量的有力杠杆。

等到电视剧在7月5日完结了,热度一过,也就不需要再炒作,豆瓣评论分数也就回归了一个稳定的均值。

结论:剧方在《梦华录》刚开播时,大量投入水军拉高评分,收获观众和播放量,等到电视剧完结,热度减退,评分回归稳定均值

《梦华录》的大结局完结时间是7月5日。那么,如果我把7月5日之前的所有带分短评全部忽略(注意是忽略掉所有星级的评分,包含5星和1星),得到的《梦华录》的得分是:

7月5号之后,已经少有水军的平均分
7月5号之后,已经少有水军的平均分

我了个去,评分直接跌到了 5.5分。此刻我望着豆瓣官网上《梦华录》的8.0分,只有一个字:

此时应该有很多读者想到豆瓣的《梦华录》主页(链接)上看看,证实一下我文中所述是否是真的,而非我造谣。

那么你可能会在短评区看到大量的5星好评:

首页的高分短评,见不到差评
首页的高分短评,见不到差评

在短评首页里,你几乎看不到任何1星短评,和我数据统计里的大量1星数据看上去相违背

其实,这和豆瓣网站呈现短评的方式有关。我统计了所呈现短评的每一页的评价打分,结果如下表:

首页平均分最高,差评低分都在靠后页
首页平均分最高,差评低分都在靠后页

豆瓣的每一页默认包含20个评论,很明显,网站将高分评论优先安排在了首页,而1星和2星等低分则被安排在了靠后页

同理,在豆瓣正在看类型的短评列表也是同理,因此才会看到前述该类型的评分均值为 9.5分的情况。

既然有水军五毛党在刷5星,那么有没有恶意黑手在故意黑《梦华录》打1星呢?其实也不难,我们分析一下这些短评都在具体评论些什么,就知道了。

我将所有的5星短评都抽取出来,用 jiojio分词工具 做了一个分词,然后统计最高频的词汇,制作词云,5星评论的词云如下:

5星评分主要集中在刘亦菲颜值
5星评分主要集中在刘亦菲颜值

看到这里我真的要笑出来了,好了啦!我读懂啦,刘亦菲,好美!好漂亮!天仙姐姐颜值在线!所以,给《梦华录》5颗星!

刘亦菲姐姐,我知道你美若天仙,可是,作为一个科班出身的职业演员,《梦华录》雇的水军只会拿你的美貌做营销点,你自己丝毫不 care 吗?

然后我们来看一看1星和2星的评论词云:

低分吐槽聚焦点
低分吐槽聚焦点

低分评论的着眼点主要在于演员的台词,剧情、编剧,以及令人反感的营销

其实大家都知道《梦华录》在营销,只是缺少我出来实锤,对吗?

我们来总结一下,《梦华录》在豆瓣的营销都干了哪些事。

一、自从6月2号开播开始,《梦华录》在豆瓣大量雇水军刷5星好评,主要营销点是刘亦菲的美貌。水军刷分到7月5日基本截止,评分回归均值。

二、豆瓣将高分评论优先放置在首页,给观众造成误导。

三、豆瓣禁止用户访问几十万的用户评论,造成用户难以看到8.0评分背后的虚假评分。

四、《梦华录》的真实评分,大概率介于5.5~6.5 分之间,比官方打分低了2.5~3.5分。

本文到这里,已经可以作为结束了,有的读者可能会问,是不是我对《梦华录》恶意太大了?现在的营销剧那么多,难道别的影视剧没有营销吗?

哎~,我还真的找到了一部近期上映的电影,《隐入尘烟》,我同样统计了该电影的短评,它确实是没有在豆瓣购买水军刷分。(小声哔哔,可能剧组没钱刷分~~)

以下是隐入尘烟的官方打分8.5分:

该影片7月8号上映,9月12日下映,短评统计得分为:

发现没有,《隐入尘烟》下映后的评分反而更加高了,达到了 9.2分

虽然该片的短评分8.3分与豆瓣官方打分8.5分有出入,但出入不大,介于 正负一分以内。

此刻应该有人坐不住了,问我:“你拿的出来数据吗?就在这里乱黑《梦华录》?”

有的,我已经把两部影视剧的评论数据集公开出来,可以扫码关注wx号JioNLP,回复下载获取。

JioNLP 是一个专注挖掘并分析互联网数据的wx 公众号,来看看这里有没有你想要的数据吧。

除了《梦华录》,你还想知道哪些影视剧的豆瓣真实评分呢?可以在评论区或公众号直接回复哦~~~~

分类:

人工智能

标签:

数据挖掘

作者介绍

jionlp数据分析
V1

jionlp开源作者,数据分析专家