Google图书

谷歌圖書搜索服務

Google图书(英语:Google Books)是一个由Google研发的搜索工具,它可以自Google所扫描、经由光学字符识别(OCR)、存储的数码化数据库中搜索资料。此服务于2004年10月法兰克福书展发布,命名为Google Print。当用户使用关键字搜索,Google图书搜索的结果索引会显示在Google网络搜索服务的上方。用户还可以在Google图书搜索搜索书籍。点击Google图书搜索的结果索引打开页面,使用户可以查看书籍中的页面以及内容相关的广告,链接到出版商的网站和书店。Google以限制网页的浏览数量,来阻止书籍被打印和保护文字内容的复制著作权,并追踪用户使用记录,作为通过各种准入限制和保障措施的依据。[1]

Google图书
网站类型
数码图书馆
持有者Google
网址books.google.com 编辑维基数据链接
推出时间2004年10月,​20年前​(2004-10
现状营运中

Google图书搜索允许公有领域的作品和内容,免费全文浏览,并提供PDF的格式下载。对于在美国境外的用户,Google必须确保其没有触犯到用户所在国家的法律,根据Google图书搜索支持小组的成员说法:“一本书是否属于公有领域往往是一个棘手的法律问题,我们会谨慎处理,直到我们确定本书已进入公有领域。”[2]

关于扫描方面,许多书籍使用Elphel 323相机扫描,这种相机每小时可以照1,000页。[3]

而Google的这个计划受到极大称赞,因为它可能成为前所未有、全球最大的网上主体的人类知识,[4][5]但它仍有着有关侵犯著作权上的批评。[6]

计划目的

Google图书扫描图书的目的,并不是给人类阅读,而是用于训练人工智慧[7]

扫描数量

Google曾表示,他们目前一天可扫描三千本书籍。到2007年3月为止,Google已经数码化100万本图书。Google拒绝透露项目开支,但《纽约时报》在2008年时估算其花费了约500万美元。[8]在2008年10月28日Google说,通过此项服务,他们有700万本的图书被搜索,其中包括扫描的20,000个出版商的合作伙伴[9]。在这700万册图书当中,有100万本在出版商正式授权下提供“完全预览”服务,另外100万属于在公有领域,其余500万是绝版或商用。[10]

竞争

  • 微软在2006年开发了一个类似的计划,名叫Live Search Books英语Live Search Books。它持续进行了一段时间,直到2008年5月取消[11]。所有的Live Search Books的资料,现已存在Internet Archive。Internet Archive是非营利性的,它是继Google之后第二大图书扫描计划。截至2008年11月已有超过100万全文公有领域的作品被扫描上网。
  • Europeana主宰约300万份的数码物件,其中包括影像、照片、绘画、音频、地图、手稿、印刷书籍、报纸等,这些文件超过一千项是由欧盟自过去两千年的欧洲历史搜集而成的。[12]

时间表

2004

  • 十二月:Google公布扩张Google Print计划,初期称为Google Print Library Project[13]。Google宣布与几所知名大学和公共图书馆建立伙伴关系,包括密歇根大学哈佛大学(哈佛大学图书馆)、斯坦福大学Green Library英语Green Library)、牛津大学博德利图书馆),以及纽约公共图书馆。根据新闻稿和各大学图书馆长所言,Google计划在十年内数码化并提供约1,500万册的Google图书搜索服务。Google动作之迅速引发了争议,出版商和作者协会质疑这不仅是针对公共领域的图书,同时也挑战了著作权。

2005

2006

  • 八月:加州大学系统宣布它们将加入图书搜索数码化的计划。[15]
  • 九月:马德里Complutense大学图书馆成为加入Google图书计划的第一个西班牙语图书馆。
  • 十月:威斯康星大学麦迪逊分校宣布,它与威斯康星州历史学会的图书馆,将加入图书搜索数码化计划。合并后,图书馆馆藏变为720万册。
  • 十一月:弗吉尼亚大学加入该计划。该库包含超过5万册和1,700多万份的手稿、珍贵书籍和文件。[16]

2007

  • 一月:得克萨斯州大学奥斯汀分校宣布将加入图书搜索数码化计划。至少有一万册数码化将是由该大学的13个图书馆定位。
  • 三月:巴伐利亚州图书馆宣布与Google建立合作伙伴关系,来扫描超过100万份在公共领域,和绝版的德语以及英语、法语、意大利语、拉丁语和西班牙语作品。[17]
  • 五月:一本数码化计划的书,被公告为Google及县立、洛桑大学图书馆所纳入。[18]
  • 五月:根特大学的Boekentoren图书馆,将参与Google图书数码化计划,且将把19世纪的图书制成法国和荷兰的语言并上线。[19]
  • 六月:合作委员会(Committee on Institutional Cooperation英语Committee on Institutional Cooperation)宣布,其12个成员图书馆未来六年将参与扫描1,000万本书。[20]
  • 七月:庆应义塾大学成为Google在日本的第一个图书馆合作伙伴,他们将数码化至少12万本公共领域的书籍。[21]
  • 八月:Google宣布,它将数码化达50万本有著作权的书籍,也将数码化在康奈尔大学图书馆的公共领域书籍。Google还将提供一个系统,可将数码化复制的所有作品扫描并纳入大学自己的图书馆。[22]
  • 九月:Google新增功能,允许用户在公共领域共享片段的书籍。
  • 九月:Google推出一项新功能,名为“我的图书馆”,允许用户创建个人化的图书馆。他们可以运用标签、审查、利率、或全文检索来选择图书。[23]
  • 十二月:美国哥伦比亚大学成为数码化公共领域的伙伴。[24]

2008

  • 五月:微软逐渐衰微,并打算结束其扫描计划。该计划扫描了75万份书籍和八千万篇杂志文章。[25]
  • 十月:出版业和Google经过两年的谈判后达成协议。Google同意以补偿作者和出版商,来换取将数以百万计的图书提供给公众。[6]
  • 十一月:Google和合作伙伴的图书扫描计划达到了700万大关。其中一百万已达成“完全预览”模式,另外一百万已是可完全浏览和下载的公共领域的作品。[26][10]

Google图书计划参与者

 
哈佛大学哈佛大学图书馆
 
牛津大学博德利图书馆
 
庆应义塾图书馆旧馆
 
纽约公共图书馆

参与计划的成员人数自Google图书馆计划实行之初已成长许多[13];迈索尔大学在许多媒体的报导都提到其为此计划之合作伙伴,[27][28]但他们实际上并没有被Google列为合作伙伴。[29]  

首批参与者

后期加入参与者

争议

违反著作权、合理使用等争议

出版业与作家协会批评该计划列入片段的作品是侵犯著作权的行为。2005年秋季,作家协会和美国出版商协会分别控诉Google。Google反驳说,该计划的每个项目皆是合理使用,并且在这数码时代,每一个字都有对应到其出版索引。[6]2006年6月,在诉讼之后,法国出版商宣布它打算控诉法国Google。[30]2006年底,德国控诉被撤回。[31]
2007年3月,Google被告侵犯著作权法的图书搜索服务。微软的副总兼法律顾问托马斯·鲁宾(Thomas Rubin)批评Google一再任意复制作品,并且总是直到有人出面指证才会停手。[32]2008年11月28日,作家协会、出版界和Google签订了和解协议,Google同意支付总共1.25亿美元,包括诉讼费用及建立图书权登记处。该解决方案将在2009年5月得到法院的批准。[6]解决的反应有好有坏,其中一个与Google合作的图书馆表示,如果Google无法找到“更合理的条款”,它会选择撤回与其合作的关系。[33]

弗吉尼亚大学的副教授Siva Vaidhyanathan英语Siva Vaidhyanathan,以法律观点研究一已出版的见解[34],之后他指出Google该计划构成了危险的理论——合理使用,因为索赔的使用其实是不合理的,它可能会导致司法限制这一权利。[35]而之后作家协会控诉Google没有去法院,导致合理使用争端得不到解决方案。

Google许可的公有领域作品也是一个令人关注的议题。[36]一些出版作业是在公有领域进行的,例如美国联邦政府创造的所有作品,但那些作品仍被视如其他著作权保护的作品般对待,导致它们在1922年之后遭禁。[37]

语言争议

一些欧洲政治家和知识分子批评Google有语言帝国主义倾向,理由是因为绝大多数的书籍都扫描成英文,这会导致英文成为世界代表性的自然语言,如此一来受欢迎的语文学例如德语、汉语、俄语、法语则会渐渐不被重视,并不公平。在这些批评声浪中出面表达意见的是法国国家图书馆馆长Jean-Noël Jeanneney英语Jean-Noël Jeanneney[38]

Google图书与Google学术搜索

当Google图书大量扫描一些过期学报、杂志时产生了一个问题,就是其扫描时并没有办法将元数据(metadata)也一并扫入。这使得Google学术搜索只好开办自己的数码化计划,并放置认同这个计划的出版社的过期期刊文章。[39]

参考文献

  1. ^ Greg Duffy. Google's Cookie and Hacking Google Print. Kuro5hin. March 2005 [2008-12-04]. (原始内容存档于2021-01-26). 
  2. ^ Ryan Sands. From the mail bag: Public domain books and downloads (blog). Inside Google Book Search. 2006年11月9日 [2008-12-04]. (原始内容存档于2011-07-21). 
  3. ^ Kelly, Kevin. Scan This Book!. New York Times Magazine. 2006年5月14日 [2008-03-07]. (原始内容存档于2021-01-25). When Google announced in December 2004 that it would digitally scan the books of five major research libraries to make their contents searchable, the promise of a universal library was resurrected. ... From the days of Sumerian clay tablets till now, humans have "published" at least 32 million books, 750 million articles and essays, 25 million songs, 500 million images, 500,000 movies, 3 million videos, TV shows and short films and 100 billion public Web pages. 
  4. ^ Bergquist, Kevin. Google project promotes public good. The University Record (University of Michigan). 2006年2月13日 [2007-04-11]. (原始内容存档于2007-10-12). 
  5. ^ Pace, Andrew K. Is This the Renaissance or the Dark Ages?. American Libraries. American Library Association. January 2006 [2007-04-11]. (原始内容存档于2007-04-03). Google made instant e-book believers out of skeptics even though 10 years of e-book evangelism among librarians had barely made progress. 
  6. ^ 6.0 6.1 6.2 6.3 6.4 Copyright infringement suits against Google and their settlement: The original lawsuits in 2005:
  7. ^ Dyson, George. Turing's Cathedral: The Origins of the Digital Universe. Knopf Doubleday Publishing Group. 2012: 312–313 [2020-10-18]. ISBN 978-0-307-90706-6. (原始内容存档于2020-11-14) (英语). 
  8. ^ Hafner, Katie. History, Digitized (and Abridged). New York Times. March 10, 2007 [2008-04-10]. (原始内容存档于2020-11-22). Google, on its own, is digitizing books at the Library of Congress, which has its hands full with other items. ... In its quest to scan every one of the tens of millions of books ever published, Google has already digitized one million volumes. Google refuses to say how much it has spent on the venture so far, but outside experts estimate the figure at at least US$5 million. The company has also been scanning and indexing academic journals to make them searchable, and is working with the Patent Office to digitize thousands of patents dating back to 1790. 
  9. ^ New Chapter. Google. [2008-10-29]. (原始内容存档于2020-11-09). 
  10. ^ 10.0 10.1 In Google Book Settlement, Business Trumps Ideals. PC World. October 28, 2008 [2008-10-31]. (原始内容存档于2011-12-29). Of the 7 million books Google has scanned, 1 million are in full preview mode as part of formal publisher agreements. Another 1 million are public domain works. 
  11. ^ Microsoft starts online library in challenge to Google Books. AFP. [2008-11-24]. (原始内容存档于2018-06-18). Microsoft launched an online library in a move that pits the world's biggest software company against Google's controversial project to digitize the world's books. 
  12. ^ Europe's Answer to Google Book Search Crashes on Day 1. Wired. 2008 [2008-11-24]. (原始内容存档于2009-04-16). 
  13. ^ 13.0 13.1 O'Sullivan, Joseph and Adam Smith. "All booked up,"页面存档备份,存于互联网档案馆Googleblog. December 14, 2004.
  14. ^ Jen Grant. Judging Book Search by its cover (blog). Googleblog. 2005年11月17日 [2008年12月4日]. (原始内容存档于2021年1月6日). 
  15. ^ UC libraries partner with Google to digitize books. [2008-12-04]. (原始内容存档于2006-08-15). 
  16. ^ The University of Virginia Library Joins the Google Books Library Project. [2008-12-04]. (原始内容存档于2012-05-25). 
  17. ^ Bavarian State Library + Google digitizing project partnership announced. [2012-07-15]. (原始内容存档于2012-07-15). 
  18. ^ Reed, Brock. "La Bibliothèque, C'est Google" (Wired Campus Newsletter),页面存档备份,存于互联网档案馆Chronicle of Higher Education. May 17, 2007.
  19. ^ Ghent/Gent + Google digitizing project partnership announced. [2008-12-04]. (原始内容存档于2009-01-22). 
  20. ^ CIC + Google digitizing project partnership announced. [2008-12-04]. (原始内容存档于2007-06-14). 
  21. ^ Keio + Google digitizing project partnership announced. [2008-12-04]. (原始内容存档于2013-03-09). 
  22. ^ Cornell + Google digitizing project partnership announced. [2008-12-04]. (原始内容存档于2013-09-11). 
  23. ^ Google's "personal library" feature announced. [2008-12-04]. (原始内容存档于2020-11-14). 
  24. ^ Columbia + Google digitizing project partnership announced. [2008-12-04]. (原始内容存档于2013-03-09). 
  25. ^ Microsoft Will Shut Down Book Search Program. New York Times. 2008年5月24日 [2008-05-24]. (原始内容存档于2016-11-30). Microsoft said it had digitized 750,000 books and indexed 80 million journal articles. 
  26. ^ Massive EU online library looks to compete with Google. Agence France-Presse. November 2008 [2008-11-24]. (原始内容存档于2013-03-02). Google, one of the pioneers in this domain on the other hand, claims to have seven million books available for its "Google Book Search" project, which saw the light of day at the end of 2004. 
  27. ^ Ars Technica. [2008-12-04]. (原始内容存档于2008-12-06). 
  28. ^ Hindustani Times "Google to digitise 800,000 books at Mysore varsity". [2008-12-04]. (原始内容存档于2007-12-13). 
  29. ^ Google Library Partners. [2008-12-04]. (原始内容存档于2012-12-18). 
  30. ^ John Oates. French publisher sues Google. The Register. 2006年6月7日 [2008年12月4日]. (原始内容存档于2020年5月6日). 
  31. ^ Danny Sullivan. Google Book Search Wins Victory In German Challenge. Search Engine Watch. 2006年6月28日 [2006-11-11]. (原始内容 (blog)存档于2006年10月17日). 
  32. ^ Thomas Claburn. Microsoft Attorney Accuses Google Of Copyright Violations. InformationWeek. 2007年3月6日 [2008年12月4日]. (原始内容存档于2007年10月12日). 
  33. ^ Google Online Book Deal at Risk. [2008-12-04]. (原始内容存档于2009-09-21). 
  34. ^ Siva Vaidhyanathan,. “The Googlization of Everything and the Future of Copyright,” University of California Davis Law Review volume 40 (March 2007), pp. 1207–1231, pdf页面存档备份,存于互联网档案馆
  35. ^ First Monday页面存档备份,存于互联网档案馆) Transcript September 2007
  36. ^ Michael Liedtke. Publishers Protest Google's Online Library Project. Associated Press. 2005年5月24日 [2008年12月4日]. (原始内容存档于2006年2月9日). 
  37. ^ Robert B. Townsend, Google Books: Is It Good for History?页面存档备份,存于互联网档案馆), Perspectives (September 2007).
  38. ^ Jean-Noël Jeanneney. Google and the Myth of Universal Knowledge: A View from Europe (book abstract; Foreword by Ian Wilson). 2006年10月23日 [2007-02-21]. ISBN 0-226-39577-4. 
  39. ^ Barbara Quint : Changes at Google Scholar: A Conversation With Anurag Acharya页面存档备份,存于互联网档案馆 Information Today, August 27, 2007

外部链接

参见