沃森 (人工智慧程序)

IBM開發的人工智能計算機系統

沃森(英语:Watson)是能够使用自然语言来回答问题的人工智慧系统,[2]IBM公司的首席研究员大卫·费鲁奇英语David Ferrucci所领导的DeepQA计划小组开发并以该公司创始人托马斯·J·沃森的名字命名。[3][4]

沃森的头像,灵感来自IBM智慧地球英语Smarter Planet标志[1]

2011年,沃森参加综艺节目《危险边缘》来测试它的能力,这是该节目有史以来第一次人与机器对决。[3]2月14日至16日广播的3集节目中,沃森在前两轮中与对手打平,而在最后一集里,沃森打败了最高奖金得主布拉德·鲁特尔英语Brad Rutter和连胜纪录保持者肯·詹宁斯[5][6]沃森赢得了第一笔奖金100万美元,而肯·詹宁斯和布拉德·鲁特尔分别只有30万和20万。赛后,詹宁斯和鲁特表示将一半奖金用于慈善事业,IBM公司也将沃森的奖金分给了两家慈善机构。[7]

沃森在比赛节目中按下信号灯的速度始终比人类选手要快,但在个别问题上反映困难,尤其是只包含很少提示的问题。对于每一个问题,沃森会在屏幕上显示3个最有可能的答案。沃森4TB磁盘内,包含2亿页结构化和非结构化的资讯,[8]包括维基百科的全文。[9]在比赛中沃森没有链接到互联网。[10][11]

结构

 
Watson中使用的IBM DeepQA的高级体系结构
The high-level architecture of IBM's DeepQA used in Watson[12]

沃森是IBM制造的电脑问答(Q&A)系统。[2] IBM介绍时说“它是一个集高级自然语言处理消息检索知识表示、自动推理机器学习等开放式问答技术的应用”,并且“基于为假设认知和大规模的证据搜集、分析、评价而开发的DeepQA技术”。[2]

硬件

根据IBM的说法:

沃森是一台专为复杂分析而优化设计的系统,集成大规模并行处理器POWER7英语POWER7和IBM DeepQA软件使其能在3秒内回答危险边缘的问题成为可能。沃森是由90台IBM Power 750伺服器(还包括10个机柜里额外的输入输出端口、网络和集群控制器节点)组成的集群伺服器,共计2880颗POWER7处理器核心以及16TB内存。每台Power 750伺服器使用一个3.5GHz、8核心,每核心4线程的POWER7处理器。只有POWER7处理器强大的并行计算能力才能勉强运行沃森安装的IBM DeepQA软件。[13]

John Rennie说,沃森每秒可以处理500GB的数据,相当于1秒阅读100万本书。[14] IBM研发负责人和高级顾问Tony Pearson估计沃森的硬件花费近300万美元,[15]其80 TeraFLOPs的处理能力在超级电脑世界500强排名第94,在超级电脑世界50强排名第49。[16] Rennie还说,比赛的数据是存放在沃森的内存中的,因为硬盘的存取速度太慢了。[14]

软体

沃森的软件由数种不同语言写成,包含JavaC++和Prolog等,并且采用Apache Hadoop框架分布式计算,还有Apache UIMA(Unstructured Information Management Architecture)框架、IBM DeepQA软件和SUSE Linux Enterprise Server 11 操作系统[8][17][18]“……超过100项不同的技术被用在自然语言分析、来源识别、寻找并生成假设、挖掘证据以及合并推翻假设。”[19]

数据

沃森的资讯来源包括百科全书字典、词典、新闻和文学作品。沃森也使用数据库分类学本体论。特别是DBpedia, WordNet,和Yago英语YAGO (database)[20]

IBM小组为沃森提供数百万的文档,其中包括字典、百科全书和其他能建立知识库的参考材料。[11]尽管沃森在比赛中没有链接互联网,[21]它4TB的磁盘上仍有2亿页结构化和非结构化的资讯供其使用,[8]其中包括了维基百科的全文。[9]

操作

 
面对一个问题时,沃森能同时运行成千上万种算法寻找答案,然后把这些答案汇合,并算出对每一个答案的确信程度。

危险边缘游戏中,所有选手(也包括沃森),必须等到主持人将每个线索念完,然后就绪灯亮起,第一个按下抢答器按钮的人可以获得回答问题的机会。[11][23]沃森像接收电子文本一样得到这些线索的同时这些线索也显示给人类选手[11]。然后它会将这些线索解析为不同的关键字和句子片段,这样做是为了查找统计相关词组。[11]沃森最革新的并不是在于全新的操作算法,而是能够快速同时运行上千的证明语言分析算法来寻找正确的答案。[11][24]算法找出的相同答案越多,沃森就越肯定答案正确[11]。一旦沃森发现一个潜在的解决方法,并且这个解决方法有效,它就会核对数据库来确定答案[11]。在前20个问题中,人类选手抢答平均需要6~7秒,而沃森视听到线索来决定是否抢答。[11]在这段时间内,沃森还必须评价反应和判断对答案是否自信十足。[11]在危险边缘比赛获取胜利的部分系统是用来接收“就绪”信号和检查沃森是否有足够的信心去按响抢答器的电路系统。由于电子信号传递速度比人类反应速度快许多,沃森的反应明显比人类选手要快,但是人类选手会对就绪信号灯亮起的时刻作出预测。[25]拿到抢答权后,沃森将答案按危险边缘的格式整理并用电子语音读出[11]。沃森的语音是演员杰夫·伍德曼(Jeff Woodman)录制的,他参与了2004年IBM语音合成项目[26]

与人类选手比较

 

沃森的基本工作原则是解析线索中的关键字同时寻找相关术语作为回应。这使得沃森与人类选手既有优势又有劣势[27]:沃森不擅长理解线索之间的关联。所以人类选手通常比沃森更快生成思路,尤其当线索很少的的时候[11]。沃森的程序不允许其使用在未确定答案前就按响抢答器这种大众化战术。[11]一旦生成了答案沃森就会迅速反应,按下抢答器,而不会受到人类选手的心理战术影响[11][28]

危险边缘的工作人员使用了不同的手段来显示沃森和人类选手按下抢答器的状态[25],但是却一直备受争议。[28]人类选手用的是一盏灯,他们需要0.1秒的时间来反应[29][30]。而沃森使用的是电子信号,能在8毫秒内(0.008秒)激活抢答器[31]。人类选手尝试要求补偿知觉延迟造成的误差[32],但两者之间的反应时间差依旧是太大了[28]。因为沃森并不需要估算就绪信号何时到达[32][30]

参见

参考文献

  1. ^ YouTube上的IBM Watson: The Face of Watson
  2. ^ 2.0 2.1 2.2 DeepQA Project: FAQ, IBM Corporation, [2011-02-11], (原始内容存档于2011-06-29) 
  3. ^ 3.0 3.1 Hale, Mike, Actors and Their Roles for $300, HAL? HAL!, The New York Times, 2011-02-08 [2011-08-19], (原始内容存档于2012-03-29) 
  4. ^ The DeepQA Project, Research.ibm.com, [2011-02-18], (原始内容存档于2011-06-29) 
  5. ^ Markoff, John, Computer Program to Take On 'Jeopardy!', The New York Times, 2009-04-26 [2009-04-27], (原始内容存档于2011-09-06) 
  6. ^ Loftus, Jack, IBM Prepping Soul-Crushing 'Watson' Computer to Compete on Jeopardy!, Gizmodo, 2009-04-26 [2009-04-27], (原始内容存档于2013-02-07) 
  7. ^ IBM's "Watson" Computing System to Challenge All Time Greatest Jeopardy! Champions, Sony Pictures, 2010-12-14 [2010-12-15], (原始内容存档于2013-06-16) 
  8. ^ 8.0 8.1 8.2 Jackson, Joab, IBM Watson Vanquishes Human Jeopardy Foes, PC World, IDG News, 2011-02-17 [2011-02-17], (原始内容存档于2011-02-17) 
  9. ^ 9.0 9.1 Zimmer, Ben, Is It Time to Welcome Our New Computer Overlords?, The Atlantic, 2011-02-17 [2011-02-17], (原始内容存档于2011-02-18) 
  10. ^ Raz, Guy, Can a Computer Become a Jeopardy! Champ?, National Public Radio, 2011-01-28 [2011-02-18], (原始内容存档于2011-02-28) 
  11. ^ 11.00 11.01 11.02 11.03 11.04 11.05 11.06 11.07 11.08 11.09 11.10 11.11 11.12 11.13 Clive Thompson英语Clive Thompson (journalist). Smarter Than You Think: What Is I.B.M.’s Watson?. The New York Times Magazine. 2010-06-16 [2011-02-18]. (原始内容存档于2011-06-05). 
  12. ^ Ferrucci, D.; et al. Building Watson: An Overview of the DeepQA Project. AI Magazine. 2010, 31 (3): 59 [February 19, 2011]. doi:10.1609/aimag.v31i3.2303. (原始内容存档于2017-12-28). 
  13. ^ Is Watson the smartest machine on earth?, Computer Science and Electrical Engineering Department, UMBC, 2011-02-10 [2011-02-11], (原始内容存档于2011-09-27) 
  14. ^ 14.0 14.1 Rennie, John, How IBM’s Watson Computer Excels at Jeopardy!, PLoS blogs, 2011-02-14 [2011-02-19], (原始内容存档于2011-02-22) 
  15. ^ Lucas, Mearian, Can anyone afford an IBM Watson supercomputer?(Yes), Computerworld, 2011-02-21 [2011-02-21], (原始内容存档于2013-12-12) 
  16. ^ Tony Pearson's blog. [2011-08-19]. (原始内容存档于2019-10-06). 
  17. ^ Takahashi, Dean, IBM researcher explains what Watson gets right and wrong, VentureBeat, 2011-02-17 [2011-02-18], (原始内容存档于2011-02-18) 
  18. ^ Novell, Watson Supercomputer to Compete on 'Jeopardy!' -- Powered by SUSE Linux Enterprise Server on IBM POWER7, The Wall Street Journal, 2011-02-02 [2011-02-21], (原始内容存档于2011-04-21) 
  19. ^ Watson – A System Designed for Answers[永久失效链接]
  20. ^ 存档副本. [2011-08-19]. (原始内容存档于2020-11-06). 
  21. ^ IBM's 'Watson' to take on Jeopardy! champs, AFP, 2011-02-11 [2011-02-19], (原始内容存档于2012-05-25) 
  22. ^ Ken Jennings. My Puny Human Brain. Slate. Newsweek Interactive Co. LLC. February 16, 2011 [February 17, 2011]. (原始内容存档于2011-02-18). 
  23. ^ Libresco, Leah Anthony, A Non-Trivial Advantage for Watson, The Huffington Post, 2011-02-21 [2011-02-21], (原始内容存档于2016-03-04) 
  24. ^ Will Watson Win On Jeopardy!?, Nova ScienceNOW (Public Broadcasting Service), 2011-01-20 [2011-01-27], (原始内容存档于2011-01-24) 
  25. ^ 25.0 25.1 David, David, How Watson "sees," "hears," and "speaks" to play Jeopardy!, IBM Research blog (IBM), 2011-01-10 [2011-02-21], (原始内容存档于2017-11-05) 
  26. ^ Avery, Lise, Actor Jeff Woodman, Voice of IBM's Watson Computer (MP3), Anything Goes!!, 2011-02-14 [2011-02-15], (原始内容存档于2019-09-21) (interview of Jeff Woodman)
  27. ^ 引用错误:没有为名为cnet的参考文献提供内容
  28. ^ 28.0 28.1 28.2 引用错误:没有为名为jenning的参考文献提供内容
  29. ^ Kosinski, R. J.(2008). A literature review on reaction time, Clemson University. 互联网档案馆存档,存档日期2010-06-11.
  30. ^ 30.0 30.1 Baker, Stephen. Final Jeopardy: Man vs. Machine and the Quest to Know Everything. Boston, New York: Houghton Mifflin Harcourt英语Houghton Mifflin Harcourt. 2011: 174. ISBN 0547483163. 
  31. ^ Baker, Stephen. Final Jeopardy: Man vs. Machine and the Quest to Know Everything. Boston, New York: Houghton Mifflin Harcourt英语Houghton Mifflin Harcourt. 2011: 178. ISBN 0547483163. 
  32. ^ 32.0 32.1 引用错误:没有为名为strachan的参考文献提供内容

外部链接

J! Archive

视频