人工智能热潮

人工智能热潮(英语:AI boom)又称人工智能之春(英语:AI spring[1]),指人工智能领域的快速发展时期。该热潮开始于2016年或2017年的OpenAI公司,生成式人工智能为此次热潮的重要组成部分。[2]OpenAI推出的生成式人工智能系统,如2018年推出的各类GPT以及2021年推出的DALL-E,皆对此次发展起到了推波助澜的作用。[3][4][5]

由于大型语言模型在2022年得到了提升,基于这一模型的聊天机器人得以成为现实。与此同时,文本到图像生成模型所绘图片与手工绘图相比已经到了可以以假乱真的地步[6],而语音合成技术亦可成功的模仿人类讲话。[7]

自2022年底至2023年间,随着科技巨擘在市场上站稳脚跟,数十个新AI网站和AI聊天机器人上线,导致AI工具的普及率空前增加。[8]对于这一AI热潮,民众对此的反应可谓褒贬不一。有的人认为AI有助于开发人类潜力,为人类谋福祉。但有的人则认为AI会导致大量失业,并指出了目前的AI技术所存在诸多缺陷。[9][10][11][12]

语言模型

GPT-3是OpenAI于2020年发布的大型语言模型,该模型可以生成高质量的类人文本,其质量几可乱真。[13]随后OpenAI又发布了GPT-3.5版本,该版本被用于ChatGPT,因其能对多个领域的问题给出清晰回答而广受关注。[14]随后OpenAI又于2023年4月发布了GPT-4模型,目前该模型已被用于Microsoft Bing搜索引擎。[15][16]除了OpenAI以外,还有其他多个公司皆发布了自己的语言模型,如谷歌发布的LaMDA模型以及Meta发布的LLaMA模型。

文本到图像生成模型

OpenAI发布的DALL-E为首批受广泛关注的文本到图像生成模型之一,该模型发布于2021年1月。[17]随后能够生成更为逼真图像的DALL-E 2于2022年4月发布,[18]而其开源替代版本Stable Diffusion则发布于2022年8月。[19]

继文本到图像生成模型之后,又涌现了多个受语言模型驱动的文本到视频生成模型,如DAMO、[20] Make-A-Video、[21]Imagen Video[22]以及Phenaki[23],这些模型可通过文本或文本/图像提示自动生成视频。[24]

语音合成

15.ai是首批开放使用的语言合成软件,该产品发布于2020年3月,能够让人们通过输入音频媒体的方式产生对其声音的模仿。[25][26]随后ElevenLabs推出了一个允许公众上传其声音的网站,用于语音合成。不过由于该软件能够让用户模仿知名人士的声音并利用此发布假声名,ElevenLabs受到了各界谴责。[27]除此之外,这一技术引发了民众对其应用于深度伪造的担忧。[28]在有人利用语音合成技术对德雷克威肯的声音进行音乐创作后,不少民众对该技术的合法性及道德提出了质疑。[29]

参考文献

  1. ^ Bommasani, Rishi. AI Spring? Four Takeaways from Major Releases in Foundation Models. Stanford Institute for Human-Centered Artificial Intelligence. 2023-03-17 [2023-05-16]. (原始内容存档于2023-05-07). 
  2. ^ Why am I not terrified of AI?. Shtetl-Optimized. 2023-03-06 [2023-03-19]. (原始内容存档于2023-05-12) (美国英语). 
  3. ^ Newman, Daniel. Exploring The Ins And Outs Of The Generative AI Boom. Forbes. [2023-03-14]. (原始内容存档于2023-03-28) (英语). 
  4. ^ The AI boom: lessons from history | The Economist. The Economist. 2023-03-13 [2023-03-15]. (原始内容存档于2023-03-13). 
  5. ^ Kafka, Peter. The AI boom is here, and so are the lawsuits. Vox. 2023-02-01 [2023-03-15]. (原始内容存档于2023-05-09) (英语). 
  6. ^ Vincent, James. All these images were generated by Google's latest text-to-image AI. The Verge. 2022-05-24 [2023-03-15]. (原始内容存档于2023-02-15) (美国英语). 
  7. ^ AI-Generated Voice Firm Clamps Down After 4chan Makes Celebrity Voices for Abuse. www.vice.com. [2023-03-15]. (原始内容存档于2023-05-07) (英语). 
  8. ^ Firth-Butterfield, Kay. 2022 was a big year for AI development. In 2023, we must decide how best to use it. Asia News Network. 2023-01-18 [2023-05-16]. (原始内容存档于2023-03-19). 
  9. ^ No matter how sophisticated, artificial intelligence systems still need human oversight. ZDNET. [2023-05-16]. (原始内容存档于2023-05-10) (英语). 
  10. ^ Sukhadeve, Ashish. Council Post: Artificial Intelligence For Good: How AI Is Helping Humanity. Forbes. [2023-05-16]. (原始内容存档于2023-05-09) (英语). 
  11. ^ Could AI advancements be a threat to your job security? | Learning People. www.learningpeople.com. [2023-05-16]. (原始内容存档于2023-05-09). 
  12. ^ Zinkula, Aaron Mok, Jacob. ChatGPT may be coming for our jobs. Here are the 10 roles that AI is most likely to replace.. Business Insider. [2023-05-16]. (原始内容存档于2023-05-09). 
  13. ^ Sagar, Ram. OpenAI Releases GPT-3, The Largest Model So Far. Analytics India Magazine. 2020-06-03 [2023-03-15]. (原始内容存档于2020-08-04) (美国英语). 
  14. ^ Lock, Samantha. What is AI chatbot phenomenon ChatGPT and could it replace humans?. The Guardian. 2022-12-05 [2023-03-15]. ISSN 0261-3077. (原始内容存档于2023-01-16) (英国英语). 
  15. ^ Lardinois, Frederic. Microsoft's new Bing was using GPT-4 all along. TechCrunch. 2023-03-14 [2023-03-15]. (原始内容存档于2023-03-15) (美国英语). 
  16. ^ OpenAI announces ChatGPT successor GPT-4. BBC News. 2023-03-14 [2023-03-15]. (原始内容存档于2023-05-15) (英国英语). 
  17. ^ Coldewey, Devin. OpenAI's DALL-E creates plausible images of literally anything you ask it to. TechCrunch. 2021-01-05 [2023-03-15]. (原始内容存档于2021-01-06) (美国英语). 
  18. ^ Coldewey, Devin. New OpenAI tool draws anything, bigger and better than ever. TechCrunch. 2022-04-06 [2023-03-15]. (原始内容存档于2023-05-06) (美国英语). 
  19. ^ Stable Diffusion Public Release. Stability AI. [2023-03-15]. (原始内容存档于2022-08-30) (英国英语). 
  20. ^ ModelScope 魔搭社区. modelscope.cn. [2023-03-20]. (原始内容存档于2023-05-09). 
  21. ^ kumar, Ashish. Meta AI Introduces 'Make-A-Video': An Artificial Intelligence System That Generates Videos From Text. MarkTechPost. 2022-10-03 [2023-03-15]. (原始内容存档于2022-12-01) (美国英语). 
  22. ^ Edwards, Benj. Google's newest AI generator creates HD video from text prompts. Ars Technica. 2022-10-05 [2022-10-25]. (原始内容存档于2023-02-07) (美国英语). 
  23. ^ Phenaki. phenaki.video. [2022-10-03]. (原始内容存档于2022-10-07). 
  24. ^ Edwards, Benj. Runway teases AI-powered text-to-video editing using written prompts. Ars Technica. 2022-09-09 [2022-09-12]. (原始内容存档于2023-01-27). 
  25. ^ Zwiezen, Zack. Website Lets You Make GLaDOS Say Whatever You Want. Kotaku. Kotaku. 2021-01-18 [2021-01-18]. (原始内容存档于2021-01-17). 
  26. ^ Ruppert, Liana. Make Portal's GLaDOS And Other Beloved Characters Say The Weirdest Things With This App. Game Informer (Game Informer). 2021-01-18 [2021-01-18]. (原始内容存档于2021-01-18). 
  27. ^ Jorge Jimenez. AI company promises changes after 'voice cloning' tool used to make celebrities say awful things. PC Gamer. 2023-01-31 [2023-02-03]. (原始内容存档于2023-04-04) (英语). 
  28. ^ Seeing is believing? Global scramble to tackle deepfakes. Yahoo News. [2023-05-16]. (原始内容存档于2023-02-03). 
  29. ^ Coscarelli, Joe. An A.I. Hit of Fake ‘Drake’ and ‘The Weeknd’ Rattles the Music World. The New York Times. 2023-04-19 [2023-05-16]. ISSN 0362-4331. (原始内容存档于2023-05-15) (美国英语).