您当前的位置:首页 >> 体育
AI选出来的史上最佳电影Top 10,我一个都没看过
发布时间:2019-04-07
 

有个朋友跟我吹,

说什么 IMDb 百大电影全都看过。

我问他肖申克是谁,

他却支支吾吾……

开个玩笑。

虽说电影这件事见仁见智,

但是谈起影史佳片,大部分人都同意,

《肖申克的救赎》稳坐头把交椅。

不过最近有一件有趣的事:

两位意大利科学家发了篇论文,

讲他们如何用 AI 给电影打分排名,

肖申克压根没有上榜……

这就很有趣了。

因为我查了下这两位专家,

Livio Bioglio 和 Ruggero G. Pensa 教授,

是意大利都灵大学计算机专业的。

俩写代码的

为什么要跟电影过不去 :/

质疑研究者的专业性之余,

还是要看下俩人有什么话可说。

电影的成功,通常是由票房收入或专业评论的意见来衡量的。然而,这些衡量方式可能受到外部因素的影响,例如广告营销或者趋势,而且它们无法准确呈现一部电影长期的影响力。

仔细一琢磨,还真略有道理。

如果跟业内人士讨论最“成功”的电影。

你说《阿凡达》和《星战:原力觉醒》

不会有人反驳你。

前者全球票房28亿美元创纪录

后者美国票房将近10亿排第一

票房越高,看过的人越多。

如果这不算成功,这没有影响力,

什么片子成功,什么叫影响力?

可是在两位科学家开发的 AI 眼里,

这两部电影算不上有影响力。

因为这 AI 评出的最具影响力十大电影,

压根就没有21世纪上映的:

这个排名里的片子我都听说过,

出于对不同电影主题的兴趣,

只看过其中几部。

比如我很喜欢科技,也喜欢科幻。

所以《2001:太空漫游》让我看得很爽。

尽管它节奏真的慢爆

作为一个卡在八零末尾的半吊子电影迷,

这个排名让我意识到自己看得还不够多。

可你看,前十名都是上世纪的老电影,

明明是2018年的 AI,

把一百年前的电影都翻出来了,

是不是有点太老古董了??

在粗略看了一遍论文后,我发现,

这俩科学家提出的电影评价方法

确实挺有意思:

就像评价网页排名那样,

他们用超链接的数量和权重,

去评价一部电影的影响力。

我是没看过多少电影,称不上专家。

但网页排名我知道啊!

虽然我也没干过 SEO,

但做了这么久内容,至少略懂一二吧。

概览这篇论文,评价指标一共四个:

In-Degree, Closeness, Harmonic, PageRank.

先别发懵,这四个指标其实很好理解。

咱们一个一个看。

In-Degree 入度中心性

简而言之,

或者你在微信上有300个好友,

那么你在微信上的入度中心性就是300。

明白了吧?

或者看下面这个图:

一号圈的度中心性=0

因为没有其它圈指向它;

二号圈的度中心性=2

因为有两个圈指向它。

搜索引擎给网页排名的时候,会用这个指标,

如果有另外两个网页上有这个链接,

那么硅星人FM的 In-Degree 得分就是2。

(欢迎收听硅星人FM)

那么回到这篇论文,

也是利用这个评价指标,

研究人员从 IMDb 数据库里

寻找电影 b 对电影 a 的指向。

这个指向,可能是所谓的“致敬”

比如《大话西游》对《重庆森林》的台词戏仿:

其实星爷特别喜欢戏仿其他经典影视剧,感兴趣的朋友可以多了解下。

或者美版《无间道》直接翻拍港版:

甚至只是剧情上的引用,

比方说《夜宴》直接引用了哈姆雷特的剧情。

再比如科幻电影《2001:太空漫游》

它的章回体叙事节奏被不少电影采纳,

场景设计后来也出现在其它太空电影里。

总体来讲,它在更多层面上影响了更多电影。

比如回转的太空舱

不管怎样,只要电影 a 被其他电影

以各种方式致敬翻拍和引用,

那么电影 a 的 In-Degree,

就是这些致敬电影的总数。

Closeness 接近中心性

这一条也比较好理解。

比方为一座商场选址,

地产商要计算商场和周边居住区的距离。

最后选择的地址,

和所有居住区之间的距离之和最小。

那么它的接近中心性就是最高的。

比如下图,所有的点都是居民区,

把它当成北京市

直觉上把商场建在王府井 E 是最近的,

然而实际上 B 点才是接近中心性最高的,

(大约青年路或者望京附近)

因为它同时兼顾了市区以及通州燕郊的居民。

利用这个指标,

很容易评价最有影响力的演员。

比如萨缪尔·L·杰克逊,

在这个算法选出十大演员里排第一:

他合作了不少演员,

参与了82部电影,

演过佳片也有不少。

这种演过电影多的、

跟其他演员合作多的、

表演技巧被其他演员采用的,

他/她们的接近中心性都很高。

Harmonic 和谐中心性

比方说有5个网页上有硅星人FM链接,

这5个网页被称作一度网页,

那么硅星人FM 的和谐中心分数就是5

又有10个网页上有上面那5个网页,

它们叫做二度网页,

那么分数就变成了5+(10/2)=10

又有36个网页上有上面那10个网页,

(你一定知道它们叫什么……)

分数又变成了5+(10/2)+(36/3)=22

我们回到电影的语境,

还是用《2001:太空漫游》举例。

它的设定被《星际穿越》采用了,

而只晚一年上映的《火星救援》

也有跟《星际穿越》类似的桥段。

再假设另外6部电影借鉴了《火星救援》

那么可以这样计算:

《2001:太空漫游》的和谐中心分数

就是 1+(1/2)+(6/3)=3.5。

现在你明白了:

一部电影的和谐中心分数,

就是“致敬”了它的电影数量 x ,

加上对 x 致敬的电影数量 y 除以二,

再加上对 y 致敬的数量 z 除以三

这样一直相加下去……

PageRank 佩奇排名

你可以没听说过佩奇排名,

但你肯定听说过它的发明者:拉里·佩奇!

没错,就是 Google 的联合创始人。

如果把网页a在 b、c、d上每一个链接

都看做其他网页对 a 的一次投票,

那么把这个投票再加上b、c、d的权重,

就成了佩奇排名。

比方说只有某个小网站上有你的链接,

那么你的得分就比较低。

但如果你的链接上了 Google 首页,

你的得分就变得超高。

放在电影的语境下也是一样。

《星际穿越》致敬了《2001:太空漫游》

《星际穿越》拿了不少奥斯卡,

相应地,后者的得分就很高。

《星际穿越》大量借鉴了《2001:太空漫游》

反之亦然:

《逐梦演艺圈》致敬了《房间》

可是《逐梦演艺圈》本身是大烂片,

所以《房间》的得分肯定也不咋地……

如果你对这个研究感兴趣,