为什么评分已过时:评价体系的变革与未来趋势

游戏评价曾是一种判断游戏品质的重要依据
过去,游戏评论的评分能直观地反映一款游戏的品质。杂志和网站通常会将不同方面拆分评分,比如故事、画面、玩法等。如果某款游戏的故事得分为9/10,而你喜欢以故事驱动的游戏,那么这就成为你决定是否购买的一个重要指标。
没有视频和社区反馈时,评分才更有意义
在视频平台和社交媒体产生之前,玩家无法在线观看游戏的前半小时内容,也无法看到社区的真实反应。那时,有限的货架空间和缺乏Twitch或YouTube等平台,使得评价分数变得尤为重要。
因此,玩家当时更多依赖编辑的评分作为参考依据。现在,情况发生了巨大变化。
玩家自主决策,评分变得次要
如今,玩家可以自主选择观看实机演示、社区评论甚至直播内容,更直观地了解游戏。而且,很多玩家的决策并不完全符合专业评测的意见。正因如此,评价分数的权威性逐渐降低。
游戏已变成丰富的体验,不再是单一的“完工品”
我们在推出《你好,邻居》(Hello Neighbor)时,曾获得某大媒体4/10的评分。虽然游戏曾存在BUG,我们也投入大量时间修复,但更值得注意的是:评审《邻居》就像评《堡垒之夜》(Fortnite)一样难。因为游戏的最终产品,远不止单一版本,它包括了季节内容、特别活动,甚至不断变化的体验。
开发者Alex谈体验的变化
以《你好,邻居》为例,我们的体验从首个Alpha版本开始就带来了不同的感受。有一次,我们忘记禁用开发者控制台,玩家可以窥见开发中的内容、模型,甚至看到游戏的最终形态慢慢成形。这种“幕后”内容成为游戏的一部分,增加了玩家的参与感和体验深度。
不同世代的玩家对评价的关注点不同
重要的是要区分不同年龄段的玩家。30岁以上的玩家,比如我自己,习惯用评分作为参考。因此,评价分数对他们具有一定的指导意义。
而年轻一代的玩家——从互联网成长起来,使用没有实体按键的手机,成为了当今最大的游戏社区,他们更偏向于从实际体验和社区互动中找到价值。
这种变迁大约发生在2010年代初,那是“我的世界”(Minecraft)等沙盒游戏的崛起时期。这批12岁的年轻玩家开始接受和热爱以非传统方式呈现的游戏内容,他们推动了游戏从“成品”转向“体验”的新趋势。
早期展示游戏,赢得玩家青睐
在当今时代,开发者需要尽早展露自己的作品。不是为了逃避评分,而是为了让潜在玩家自行判断是否感兴趣。你需要建立社区,让玩家在试玩、测试版本中积极参与,喜欢互动、反馈,并在Discord等平台保持活跃,逐步提升游戏的知名度和口碑。
最关键的是,保持诚实和透明。用户关心的,不只是产品本身,更是游戏带来的体验和它所孕育的社区。
游戏内容变得更加丰富且持续更新
游戏一直在通过补丁和内容更新不断改进,甚至早期的街机游戏、DOS游戏,也都曾经过版本修订或扩展包。比起过去,现在的更新频率和性质都发生了巨大变化。
回到评测层面,这意味着一款游戏的评价可能在上市后就不再准确。例如,早期无限制的“战争框架”(Warframe)或《你好,邻居》在发售时的评分,无法反映其后续的内容丰富和改进。这就带来了一个问题:很多平台不会重新评测游戏,导致最初的评分成为人们唯一的参考。
尤其是在线持续运营的游戏,初期的评测更可能偏离现在的实际情况。比如,2013年发布的《Warframe》的评分,根本无法反映今时今日的游戏内容。同时,像《你好,邻居》这样的游戏,经过多次更新,用户评价已经发生了巨大变化,但评分仍停留在最初阶段,无法反映最新的状态。
这也告诉开发者:要不断与社区保持互动,展示最新内容,而用户评价的及时性、真实感比单一的初始评分更具价值。
用户评论赋予更及时的游戏信息
虽然每个平台都存在问题,但一些平台,比如Steam,提供“近期评价”和“全部评价”两个维度,让玩家可以看到最新的反馈。这样,潜在的购买者能通过最新的评论,获得更真实、更及时的游戏体验信息,从而做出更明智的决定。
总结
游戏的本质已经从单一的“完工品”转变为动态、多变的体验。传统的评分体系在这种背景下变得不再全面甚至失去实际意义。开发者和玩家都应关注社区、内容更新和真实反馈,共同推动游戏行业向更健康、多元的方向发展。
常见问答(FAQ)
Q: 为什么我看到的游戏评分似乎和我实际玩的体验不同?
因为很多游戏在上市后经过了大量更新和调整,早期评分无法反映最新版本的状态。建议关注“近期评价”和官方更新日志,获取更准确的信息。
A: 开发者如何应对评价体系的变化?
开发者应提前与玩家互动,尽早展示内容,持续提供更新,并鼓励社区反馈。这样可以建立更真实的玩家评价和持续的口碑传播。
用户评价与评分系统的优势
用户评价,以及筛选掉差评攻击,可以让玩家一目了然地了解游戏的整体反馈。例如,《无人深空》的整体评分虽然受到初期糟糕发售的影响,但通过积极的当前版本评价,玩家可以更好地判断游戏质量。
(图:游戏《你好邻居》的截图)
意见反馈对游戏销售的影响
在TinyBuild公司,我们观察到,如果一款游戏在Steam上的首发评价较高,随后在主机平台的发行通常也会取得不错的销量。这表明,早期的用户评价具有一定的后续销售指向性。
旧评分的局限与当下的偏好
考虑到旧的评价可能并不完全可靠,玩家现在越来越关注Steam、YouTube等渠道的最新反响,帮助自己做出购买决策。
用户评分的弊端与网站差异
当然,用户评分也存在问题。例如,Metacritic上普遍存在差评攻击行为,Steam也为此引入了相应的制度,以应对类似的恶意刷分。不同平台的评分标准差异巨大,例如:《你好邻居》这类游戏会随着时间变化,但其评分不会变。各大媒体和网站根据自己的规则打分,差异明显。
评分尺度差异的影响
比如,著名的Edge杂志使用完整的评分尺度,5/10代表普通,6代表良好,7非常好,9和10极少给予。多数网站除非游戏明显问题,否则很少用60%以下的评分。这些差异让评分在不同平台的可比性变得复杂,使得通过单一分数判断游戏优劣变得不靠谱。
需要理解评分背后的标准
对于读者而言,了解各个媒体的评分标准非常重要。仅依靠数字难以全面评估游戏,反而阅读完整的评测更有参考价值。
评论在不理想条件下的局限
以今年新宠《艾尔登法环》为例,它的游戏时间长达数百小时,几乎无人能在一周全部体验完。而早期的评分,或者在快速完成游戏后给出的评价,不能真实反映游戏的全貌。许多游戏需长时间慢慢体会,逐步理解,尤其是多人在线游戏,也难以在发售前准确评估其整体品质。这些因素让即时评分的准确性受到影响。
改进建议:如何应对当前评价体系的问题?
面对这些问题,除了批评之外,我们也应提出一些建议。以下是一些可能改善现状的方法:取消评分体系:一些大媒体如Eurogamer已经采用“推荐”或“必玩”标签,减少对数字评分的依赖,鼓励玩家深入了解内容。远离单一评分:像Metacritic这样的总分系统,试图用一个数值覆盖复杂的评价,可能会误导玩家。特别是某些工作室用评分作为奖金依据(如《辐射:新维加斯》)。增加内容更新:虽然完全重写评测可能不切实际,但添加关于评测时间的说明,提醒观众此评价是否过时,或指出游戏的关键变化,可以提升内容的相关性。在流媒体、游戏视频盛行的时代,这更显重要。
总结
长文评测和评论依然具有价值,但考虑到游戏更新迅速,第一天的评分和初体验已无法代表全部。读者应结合多方面信息,不断提升对高分评判标准的理解,才能更好地把握游戏的真实价值。
作者介绍
Alex Nichiporchik,Indie发行商TinyBuild的CEO兼创始人。