互聯網電影資料庫

影視數據庫

互聯網電影資料庫(英語:Internet Movie Database,簡稱IMDb)是一個關於電影演員電影電視節目、電視藝人電子遊戲和電影製作小組的線上資料庫。IMDb開辦於1990年10月17日,從1998年開始成為亞馬遜公司旗下的網站,在2020年10月17日時,IMDb慶祝了他們30週年的紀念。

IMDb
互聯網電影資料庫
IMDb官方標誌
網站類型
線上電影、電視和電子遊戲資料庫
持有者亞馬遜公司
創始人柯爾·尼德罕英語Col Needham[1]
網址www.imdb.com
商業性質
註冊選擇性

截至2021年9月,IMDb收錄了共8,313,921部作品以及151,033,000個人物的資料[2]

概要

IMDb上有豐富的電影作品資訊,包括影片演員導演,劇情,影評這類的基本資訊,也有更深層的內容,比如影片相關的瑣事花絮,片中出現的漏洞,影片聲軌,螢幕的高寬比,影片的不同版本等等。演員,導演,作者和其他工作人員都在資料庫中有自己的條目,其中列出他們參加過的影片,通常還有他們的傳記。用戶還可以在akas.imdb.com 找到那些在不同語言不同國家發行時使用了不同片名的電影[3]

IMDb不只是電影和電子遊戲等的資料庫,還提供每日更新的電影電視新聞,以及為不同電影活動比如奧斯卡獎推出特別報道。IMDb的討論區也十分活躍,除每個資料庫條目都有留言板之外,還有關於多種多樣的主題的各種綜合討論版。IMDb擴充出來的姐妹站IMDbPro為專業人士提供額外的資訊,如電影業界人士的聯絡方式,電影活動日期表等等。IMDbPro不是專門為普通大眾設計服務的,內容也不是免費的。

任何人只要有電子信箱並使用接受Cookie的Web瀏覽器就可以在IMDb上建立帳戶,提交資訊和對參加各種主題的投票。針對自動化查詢的需求,資料庫的大部分都能以壓縮的文字檔案格式下載,並用提供的工具解壓(通常在命令列進行)。[4]

歷史

  • 1989年時,Col Needham和其他人在Usenet新聞組rec.arts.movies電影和交換資訊。他們編寫了一個常見問題解答(FAQ)列表,包含演員,導演和已經去世的電影製作者的傳記。在1990年末,他們的FAQ已經收錄了將近10,000部電影和電視劇。
  • 在1990年10月17日,Needham發佈了一套UNIX的Shell指令碼,該指令碼可以搜尋這4個FAQ,IMDb也由此誕生,不過那時的名字是rec.arts.movies電影資料庫。
  • 到了1993年,資料庫已經擴充到包括瑣事花絮,傳記,影片情節等內容,還帶有一個集中的電子郵件介面,用於搜尋該資料庫。當年晚些時候,IMDb被移到了萬維網上(當時還處在嬰兒期的網絡)。資料庫被放置在威爾斯卡地夫大學的電腦科學系的伺服器上。最初的網頁介面作者是Rob Hartill。
  • 在1994年,擴充了的電子郵件介面開始接受自動數據提交,人們不必再給指定的維護人員發信而間接提供新內容了。這些年裏,資料庫在連接着世界各地鏡像的網絡上靠捐贈的頻寬執行。
  • 在1995年,這一專案發展得很大,對Col Needham和其他的志願者來說,依靠捐款和他們的空閒時間來維護它的執行已經明顯不太可能。
  • 1996年,成立商業公司的決定被作出,IMDb在英國註冊成為互聯網電影資料庫公司。維護資料庫的人們成為其股東,依靠廣告,許可證和合作獲得利潤。
  • 這種狀態持續到1998年。資料庫每時每刻都在成長,再一次到達了關鍵的時刻;利潤被用在裝置上,股東們很難接受辛苦勞動卻只能得到很少收入的事實。一些大公司出價試圖收購資料庫,然而IMDb的股東們不肯輕易將其出售給無法保證繼續免費提供其資訊的其他企業。
  • 就在這時,亞馬遜的傑夫·貝索斯出現了。達成的交易是,IMDb得到了為股東們提供應有收入的資金,而Amazon.com可以在出售其DVD和錄影帶時使用IMDb的資訊資源。
  • IMDb的功能繼續不斷擴充,2002年新增了針對娛樂界專業人士的IMDbPro,提供多樣的服務,包括電影製作和票房詳細資料,以及電影公司目錄。訂閱的價格是每月$12.95,或每年$99.95(2005年4月5日價格)。

250部最佳影片

「佳片250」旨在列出資料庫內評級最高的250部電影,評級以資料庫註冊用戶評分為基礎,再套用下列所述公式[5]。入選規範必須是曾公開上映的非紀錄片,片長至少45分鐘,評分達兩萬五千人次以上[6],並且只有定期投票習慣的用戶才會採用計票,至於有效票數量多少、如何才是符合「有定期投票習慣」則還不為人知。IMDb宣稱為了保持「佳片250」名單的公信力,他們「故意不公開有效計票的標準」[7]。除此之外,「佳片250」還套用精算學的「可信度公式」,對評分作加權評級[8],獨立資料的數量越大(在此就是指合格用戶的評分),統計處理後的可信度越高,IMDb原以下列公式計算加權評級(IMDb不公開現時公式):

 

以上:

 =加權評級
 =電影從0到10的平均分數(Rating)
 =評分人次(Votes)
 =進入名單的最少評分人次(目前為25000票)
 =全名單平均分數(目前維持在7.1)

公式所得的 即為「貝式後驗平均值」(詳見貝氏定理)。

該榜因其綜合廣泛性以及不時的令人吃驚的結果而受到囑目。上榜的電影中既有老電影(如《吸血殭屍》,1922年),也有新電影(如《黑暗騎士》,2008年);既有流行影片(如得到超過420,000次投票的《魔戒首部曲:魔戒現身》),也有少有人問津的影片(如只有12,700張投票的《日出》)。榜上有各種不同類型的電影(如黑色影片《雙重保險》、科幻片《2020》、音樂片《萬花嬉春》、西部片《黃昏三鏢客》、動畫片《太空奇兵·威E》等等);以及票房一般、很少獲獎但卻在影迷群體中有廣泛的追隨者的電影(比如《月黑高飛》、《死亡幻覺》等等)。截至2024年9月7日《月黑高飛》、《教父》、《黑暗騎士》為排名前三的電影。

這些條件是否能提供一個公正沒有偏見的排行榜是有爭議的。比如,新近上映的影片總是容易從一見鍾情的影迷那裏得到較高的評分,而這與成功影片應該經得起反覆觀賞的觀念是不相符的。因此,有時新上映的影片衝進250最佳影片榜,甚至前100名,但隨着更多觀眾的評分和重複觀看後的評分而退出榜外的情景就十分常見了。另外一種對該榜的主要批評則是它反映的只是影片的受歡迎程度,並不體現對影片歷史和藝術的客觀知識。但實際上,在評論家年度評選和歷史影片評選中,名列前茅的影片在最佳250部影片中通常排名很高。

目前在最佳250部電影名單中,主演最多影片的演員以占士·史超域的10部作品最多,羅拔·迪尼路夏里遜·福各以9部作品居次。

在IMDb上還有最差的100部影片榜用基本相同的方法投票產生。經常位列榜首的影片是《馬諾斯:命運之手》和《外太空九號計劃》。[9]

前20名名單

名次 年份 電影名稱 導演
1 1994 月黑高飛
The Shawshank Redemption
Frank Darabont
法蘭·達拉本特
2 1972 教父
The Godfather
Francis Ford Coppola
法蘭斯·哥普拉
3 2008 黑暗騎士
The Dark Knight
Christopher Nolan
基斯杜化·路蘭
4 1974 教父續集
The Godfather: Part II
Francis Ford Coppola
法蘭斯·哥普拉
5 1957 十二怒漢
12 Angry Men
Sidney Lumet
薛尼·盧梅
6 1993 舒特拉的名單
Schindler's List
Steven Spielberg
史提芬·史匹堡
7 2003 魔戒三部曲:王者再臨
The Lord of the Rings: The Return of the King
Peter Jackson
彼德·積遜
8 1994 危險人物
Pulp Fiction
Quentin Tarantino
昆頓·塔倫天奴
9 2001 魔戒首部曲:魔戒現身
The Lord of the Rings: The Fellowship of the Ring
Peter Jackson
彼德·積遜
10 1966 獨行俠決鬥地獄門
Il buono, il brutto, il cattivo
Sergio Leone
沙治奧·里昂
11 1994 阿甘正傳
Forrest Gump
Robert Zemeckis
羅拔·湛米基斯
12 1999 搏擊會
Fight Club
David Fincher
大衛·芬查
13 2010 潛行凶間
Inception
Christopher Nolan
基斯杜化·路蘭
14 2002 魔戒二部曲:雙城奇謀
The Lord of the Rings: The Two Towers
Peter Jackson
彼德·積遜
15 1980 星球大戰:帝國反擊戰
Star Wars Episode V: The Empire Strikes Back
Irvin Kershner
爾文·克許納
16 1999 22世紀殺人網絡
The Matrix
The Wachowskis
華高斯基兄弟
17 1990 盜亦有道
Goodfellas
Martin Scorsese
馬田·史高西斯
18 1975 飛越瘋人院
One Flew Over the Cuckoo's Nest
Miloš Forman
米洛斯·福曼
19 1995 七宗罪
Seven
David Fincher
大衛·芬查
20 1954 七武士
七人の侍
Akira Kurosawa
黑澤明

留言板

IMDb另一受歡迎的特色是其對應每個資料庫條目,並且有47個主要板塊的留言板系統。註冊用戶可以在這些留言板上分享和討論關於電影,演員,導演的訊息。至今已有超過六百萬註冊用戶使用過留言板。[10]

版權問題

所有為資料庫提供內容的自願者都對其作品擁有版權,但同時准許對其的複製,修改,並將其內容許可給IMDb。相應的,IMDb不允許其他人在未經許可情況下使用其電影概述或生平簡介。使用軟件方法封鎖該網站顯示的廣告也被明令禁止。影片名錄中一小部分可以被參照,而且只能用於非商業性的網站。

可信度

由於資料庫的人物傳記、瑣事等部分是採取用戶自由貢獻,但又並未要求用戶對其貢獻內容附上參考來源,因此缺少有效而立即的機制,以阻止蓄意破壞者添加未經查證、或對該人物詆毀性的資料。部分人物訊息準確度因此有爭議。

中國大陸訪問狀況

  • 2010年1月7日,IMDb.com被中國大陸防火長城封鎖,與其他被封的海外網站一樣,官方沒有提供任何解釋。[11]2010年2月3日,在中國大陸被解封,可以正常訪問。[12]
  • 2010年10月,IMDb.com再次被封鎖。坊間盛傳的一個原因是,當時IMDb首頁上出現了一部和西藏有關的記錄片《雲後的太陽》(《When the dragon swallowed the sun》)的預告影片[來源請求]。此後在中國大陸訪問該網站一直處於不穩定狀態。
  • 2013年3月初,IMDb.com被解除封鎖,各項功能均可在中國大陸正常使用,頁面顯示完整。[13][14]
  • 2016年3月,測試發現部分影片頁面無法訪問,如凜冬烈火頁面無法打開,訪問此連結後一段時間內無法打開IMDb網站,而後網站恢復訪問。因此IMDb不屬於在中國大陸完全自由訪問的網站[15]。但2020年8月的測試顯示全部影片頁面均可以訪問。
  • 2021年7月,測試發現使用中國移動網絡無法訪問IMDb網站。

API

IMDb的數據在官網上可以免費下載,可惜的是免費提供下載的數據是文字格式,不能檢索。為了使IMDb的數據能夠被更多人使用,許多開發人員用各自的方法實現了不同的API,目前主要有以下幾種:

IMDB API ORG

此介面由中國人開發[16],是一個輕量級的Web服務(RESTful介面),它提供一種IMDB數據的有效訪問方式。就像前面說的一樣,雖然IMDB的數據可以在官網上免費下載,但是卻沒有提供一個很好的API來檢索這些資訊。此Web服務旨在一定範圍內解決這一問題。[17]

此介面相較於其它介面具備以下特點:

  1. 支援中文譯名檢索
  2. 支援中文數據返回
  3. 支援JavaScript呼叫介面(可以使用AJAX技術直接取得結果,非JSONP方式)
  4. 返回的數據欄位更豐富
  5. 支援多條結果返回
  6. 請求限制寬鬆

此介面是唯一支援中文檢索的IMDb API。

OMDB API

此介面的作者為Brian Fritz[18],是之前The IMDB API介面的作者,因為受到IMDb官方的要求而更換了域名,是較早一批提供IMDb數據檢索的服務(RESTful介面)。

在英文世界,該服務有較高的知名度。

該介面支援JAVASCRIPT呼叫。

此介面是由The Movie Database資料庫開放的API,嚴格來說它並不是檢索的IMDb數據,它是一個獨立的資料庫,只是返回數據中提供了IMDb的一些相關數據,如:IMDb ID,IMDb Rating等。[19]

該介面提供的方法更多,但是需要授權使用,限制較多。

參考文獻

  1. ^ 黃敏. 英影迷建成最大电影数据库. 經濟參考報. 2011-01-07 [2022-01-20]. (原始內容存檔於2022-01-20) (中文). 
  2. ^ Database Statistics. IMDb. [2017-03-10]. (原始內容存檔於2015-11-07). 
  3. ^ IMDb - Movies, TV and Celebrities. IMDb. [2017-03-10]. (原始內容存檔於2015-06-27). 
  4. ^ Alternative Interfaces. IMDb. [2017-03-10]. (原始內容存檔於2020-11-29). 
  5. ^ Top 250 movies as voted by our users. IMDb. [2007-03-01]. (原始內容存檔於2009-02-18). 
  6. ^ Types of titles excluded from the Top 250. IMDb. [2007-04-25]. (原始內容存檔於2017-03-25). 
  7. ^ The user votes average on film or show X is 9.4, so it should appear in your top 250 Movies or TV list, yet it doesn't. Why?. IMDb. [2017-03-10]. (原始內容存檔於2017-03-25). 
  8. ^ Ragnar Norberg, Department of Statistics. Credibility Theory (PDF). London School of Economics. [2007-03-01]. (原始內容 (PDF)存檔於2007-07-03). 
  9. ^ Users, IMDb. IMDb Bottom 100. IMDb. [2017-03-10]. (原始內容存檔於2007-12-09). 
  10. ^ IMDb Message Boards. IMDb. [2017-03-10]. (原始內容存檔於2017-02-28). 
  11. ^ China blocks access to movie site. 荷里活報道. 2010-01-08 [2010-01-22]. (原始內容存檔於2010-01-29). 
  12. ^ IMDB unblocked after 29 days site. 環球時報. 2010-02-08. (原始內容存檔於2013-04-24). 
  13. ^ 全球最大电影数据库3年后解封. 雲南資訊報. 2013-03-07. (原始內容存檔於2013-04-28). 
  14. ^ 中国解禁互联网电影数据库IMDb. RFA. 2013-03-08. (原始內容存檔於2019-05-03). 
  15. ^ 10 Crazy Ways China Censors The Internet. 2016-02-13. (原始內容存檔於2016-03-14). 
  16. ^ IMDB API 发布. 蒙趣空間. 2013-04-28 [2017-03-10]. (原始內容存檔於2013-04-28). 
  17. ^ IMDB API, IMDB Web Service. archive.is. 2013-05-03 [2017-03-10]. (原始內容存檔於2013-05-03). 
  18. ^ OMDb API - The Open Movie Database. omdbapi.com. [2017-03-10]. (原始內容存檔於2020-11-20) (英語). 
  19. ^ TMDb API Documentation — Movie & Cast Information. archive.is. 2013-05-03 [2017-03-10]. (原始內容存檔於2013-05-03). 

外部連結