机器学习

對電腦系統用於在沒有明確指令的情況下執行任務的演算法與統計模型的科學研究

机器学习人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径之一,即以机器学习为手段,解决人工智能中的部分问题。机器学习在近30多年已发展为一门多领域科际整合,涉及概率论统计学逼近论凸分析计算复杂性理论等多门学科。

机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法(要防止錯誤累積)。很多推论问题属于非程序化決策,所以部分的机器学习研究是开发容易处理的近似算法。

机器学习已广泛应用于数据挖掘计算机视觉自然语言处理生物特征识别搜索引擎医学诊断、检测信用卡欺诈英语Credit card fraud证券市场分析、DNA序列测序、语音手写识别、游戏机器人等领域。

定义

机器学习有下面几种定义:

  • 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
  • 机器学习是对能通过经验自动改进的计算机算法的研究。
  • 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。

電腦科學家Tom M. Mitchell英语Tom M. Mitchell在其著作的Machine Learning一書中定义的機器學習為:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.[1]

分类

机器学习可以分成下面几种类别:

  • 监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析统计分类

监督学习和非监督学习的差别就是训练集目标是否有人为标注。他们都有训练集 且都有输入和输出

  • 无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有生成對抗網絡(GAN)、聚类
  • 半监督学习介于监督学习与无监督学习之间。
  • 增强学习机器为了达成目标,随着环境的变动,而逐步调整其行为,并评估每一个行动之后所到的回馈是正向的或负向的。[2]

算法

具体的机器学习算法有:

软件

包含各種機器學習演算法的軟體套裝包括:

免费开源软件

Python软件库及框架

参考文献

引用

  1. ^ Tom M. Mitchell. Machine Learning. McGraw-Hill. 1997年3月: 第2页. ISBN 0070428077 (英语). 
  2. ^ 林东清. 资讯管理:e化企业的核心竞争能力 七版. 台北市: 智胜文化. 2018年8月: 第118页. ISBN 9789864570478 (中文). 

来源

书籍

外部链接

参见