
1 SeaRecluse Aug 27, 2019 分析抓取的数据分布有问题,不同类型的电影不应该用同一分数去切,应该先统计不同类型下的得分分布然后去切。例如动画的得分一般偏高,以及国产标签的 debuff (小声) |
2 cifermail OP @SeaRecluse 这些也想到了,动画片、同性片、评分基数小于 1000 人的冷门片、部分国产膨胀片、部分媚外片、幸存者偏差片、水军片都是评分虚高的。一方面把这些因素都考虑在内就太复杂了,这些应该是评分网站去评估的事,报告只负责统计;另一方面,如果分开类型统计,数据量就太小了,意义不大。 |
3 ysoserious Aug 27, 2019 via Android 有意思。 可是博客申请通知权限是什么鬼? |