学习方法

机器的学习方法

时间:2021-03-19 08:35:47 学习方法 我要投稿

机器的学习方法三篇

  篇一:什么是机器学习

机器的学习方法三篇

  机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核 心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演译。

  机器学习是关于理解与研究学习的内在机制、建立能够通过学习自动提高自身水平的计算机程序的理论方法的学科。近年来机器学习理论在诸多应用领域 得到成功的应用与发展,已成为计算机科学的基础及热点之一。采用机器学习方法的计算机程序被成功用于机器人下棋程序、语音识别、信用卡欺诈监测、自主车辆 驾驶、智能机器人等应用领域,除此之外机器学习的理论方法还被用于大数据集的数据挖掘这一领域。实际上,在任何有经验可以积累的地方,机器学习方法均可发 挥作用。

  学习能力是智能行为的一个非常重要的特征,但至今对学习的机理尚不清楚。人们曾对机器学习给出各种定义。H.A.Simon认为,学习是系统所 作的适应性变化,使得系统在下一次完成同样或类似的任务时更为有效。R.s.Michalski认为,学习是构造或修改对于所经历事物的表示。从事专家系 统研制的人们则认为学习是知识的获取。这些观点各有侧重,第一种观点强调学习的外部行为效果,第二种则强调学习的内部过程,而第三种主要是从知识工程的实 用性角度出发的。

  机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少 学习的能力。例如,它们遇到错误时不能自我校正;不会通过经验改善自身的性能;不会自动获取和发现所需要的知识。它们的推理仅限于演绎而缺少归纳,因此至 多只能够证明已存在事实、定理,而不能发现新的定理、定律和规则等。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐 成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中尤 其典型的是专家系统中的知识获取瓶颈问题,人们一直在努力试图采用机器学习的方法加以克服。

  机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。

  机器学习已经有了十分广泛的应用例如搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。 自从1980年在卡内基-梅隆大学召开第一届机器学术研讨会以来,机器学习的研究工作发展很快,已成为中心课题之一。

  目前,机器学习领域的研究工作主要围绕以下三个方面进行:

  (1)面向任务的研究 研究和分析改进一组预定任务的执行性能的学习系统。

  (2)认知模型 研究人类学习过程并进行计算机模拟。

  (3)理论分析 从理论上探索各种可能的学习方法和独立于应用领域的算法。 机器学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。现有的计算机系统和人工智能系统没有什 么学习能力,至多也只有非常有限的学习能力,因而不能满足科技和生产提出的新要求。本章将首先介绍机器学习的定义、意义和简史,然后讨论机器学习的主要策 略和基本结构,最后逐一研究各种机器学习的方法与技术,包括机械学习、基于解释的学习、基于事例的学习、基于概念的学习、类比学习和基于训练神经网络的学 习等。对机器学习的讨论和机器学习研究的进展,必将促使人工智能和整个科学技术的进一步发展 。

  一、 机器学习的定义和研究意义

  学习是人类具有的一种重要智能行为,但究竟什么是学习,长期以来却众说纷纭。社会学家、逻辑学家和心理学家都各有其不同的看法。按照人工智能大 师西蒙的观点,学习就是系统在不断重复的工作中对本身能力的增强或者改进,使得系统在下一次执行同样任务或类似任务时,会比现在做得更好或效率更高。西蒙 对学习给出的定义本身,就说明了学习的重要作用。

  机器能否象人类一样能具有学习能力呢?1959年美国的塞缪尔(Samuel)设计了一个下棋程序,这个程序具有学习能力,它可以在不断的对奕 中改善自己的棋艺。4年后,这个程序战胜了设计者本人。又过了3年,这个程序战胜了美国一个保持8年之久的常胜不败的冠军。这个程序向人们展示了机器学习 的能力,提出了许多令人深思的社会问题与哲学问题。

  机器的能力是否能超过人的,很多持否定意见的人的一个主要论据是:机器是人造的,其性能和动作完全是由设计者规定的,因此无论如何其能力也不会 超过设计者本人。这种意见对不具备学习能力的机器来说的确是对的,可是对具备学习能力的机器就值得考虑了,因为这种机器的能力在应用中不断地提高,过一段 时间之后,设计者本人也不知它的能力到了何种水平。

  什么叫做机器学习(machine learning)?至今,还没有统一的“机器学习”定义,而且也很难给出一个公认的和准确的定义。为了便于进行讨论和估计学科的进展,有必要对机器学习 给出定义,即使这种定义是不完全的和不充分的。顾名思义, 机器学习 是研究如何使用机器来模拟人类学习活动的一门学科。稍为严格的提法是:机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。这里所说的“机 器”,指的就是计算机;现在是电子计算机,以后还可能是中子计算机、光子计算机或神经计算机等等

  二、 机器学习的发展史

  机器学习是人工智能研究较为年轻的分支,它的发展过程大体上可分为4个时期。

  第一阶段是在50年代中叶到60年代中叶,属于热烈时期。?>

  第二阶段是在60年代中叶至70年代中叶,被称为机器学习的冷静时期。

  第三阶段是从70年代中叶至80年代中叶,称为复兴时期。

  机器学习的最新阶段始于1986年。

  机器学习进入新阶段的重要表现在下列诸方面:

  (1) 机器学习已成为新的边缘学科并在高校形成一门课程。它综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学形成机器学习理论基础。

  (2) 结合各种学习方法,取长补短的多种形式的集成学习系统研究正在兴起。特别是连接学习符号学习的耦合可以更好地解决连续性信号处理中知识与技能的获取与求精问题而受到重视。

  (3) 机器学习与人工智能各种基础问题的统一性观点正在形成。例如学习与问题求解结合进行、知识表达便于学习的观点产生了通用智能系统SOAR的组块学习。类比学习与问题求解结合的基于案例方法已成为经验学习的重要方向。

  (4) 各种学习方法的应用范围不断扩大,一部分已形成商品。归纳学习的知识获取工具已在诊断分类型专家系统中广泛使用。连接学习在声图文识别中占优势。分析学习 已用于设计综合型专家系统。遗传算法与强化学习在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划 中发挥作用。

  (5) 与机器学习有关的学术活动空前活跃。国际上除每年一次的机器学习研讨会外,还有计算机学习理论会议以及遗传算法会议。

  三、 机器学习的主要策略

  学习是一项复杂的智能活动,学习过程与推理过程是紧密相连的,按照学习中使用推理的多少,机器学习所采用的策略大体上可分为4种——机械学习、通过传授学习、类比学习和通过事例学习。学习中所用的推理越多,系统的能力越强。

  四、机器学习系统的基本结构

  上图表示学习系统的基本结构。环境向系统的学习部分提供某些信息,学习部分利用这些信息修改知识库,以增进系统执行部分完成任务的效能,执行部 分根据知识库完成任务,同时把获得的信息反馈给学习部分。在具体的应用中,环

  境,知识库和执行部分决定了具体的工作内容,学习部分所需要解决的问题完全由 上述3部分确定。下面我们分别叙述这3部分对设计学习系统的影响。 影响学习系统设计的最重要的因素是环境向系统提供的信息。或者更具体地说是信息的质量。知识库里存放的是指导执行部分动作的一般原则,但环境向 学习系统提供的信息却是各种各样的。如果信息的质量比较高,与一般原则的差别比较小,则学习部分比较容易处理。如果向学习系统提供的是杂乱无章的指导执行 具体动作的具体信息,则学习系统需要在获得足够数据之后,删除不必要的细节,进行总结推广,形成指导动作的一般原则,放入知识库,这样学习部分的任务就比 较繁重,设计起来也较为困难。

  因为学习系统获得的信息往往是不完全的,所以学习系统所进行的推理并不完全是可靠的,它总结出来的规则可能正确,也可能不正确。这要通过执行效果加以检验。正确的规则能使系统的效能提高,应予保留;不正确的规则应予修改或从数据库中删除。

  知识库是影响学习系统设计的第二个因素。知识的表示有多种形式,比如特征向量、一阶逻辑语句、产生式规则、语义网络和框架等等。这些表示方式各有其特点,在选择表示方式时要兼顾以下4个方面:

  (1)表达能力强。(2)易于推理。(3)容易修改知识库。(4)知识表示易于扩展。 对于知识库最后需要说明的一个问题是学习系统不能在全然没有任何知识的情况下凭空获取知识,每一个学习系统都要求具有某些知识理解环境提供的信息,分析比较,做出假设,检验并修改这些假设。因此,更确切地说,学习系统是对现有知识的扩展和改进。

  执行部分是整个学习系统的核心,因为执行部分的动作就是学习部分力求改进的动作。同执行部分有关的问题有3个:复杂性、反馈和透明性。

  五、机器学习分类

  1、基于学习策略的分类

  学习策略是指学习过程中系统所采用的推理策略。一个学习系统总是由学习和环境两部分组成。由环境(如书本或教师)提供信息,学习部分则实现信息 转换,用能够理解的形式记忆下来,并从中获取有用的信息。在学习过程中,学生(学习部分)使用的推理越少,他对教师(环境)的依赖就越大,教师的负担也就 越重。学习策略的分类标准就是根据学生实现信息转换所需的推理多少和难易程度来分类的,依从简单到复杂,从少到多的次序分为以下五种基本类型: 1)机械学习(Rote learning)

  学习者无需任何推理或其它的知识转换,直接吸取环境所提供的信息。如塞缪尔的跳棋程序,纽厄尔和西蒙的LT系统。这类学习系统主要考虑的是如何 索

  引存贮的知识并加以利用。系统的学习方法是直接通过事先编好、构造好的程序来学习,学习者不作任何工作,或者是通过直接接收既定的事实和数据进行学习, 对输入信息不作任何的推理。

  2)示教学习(Learning from instruction或Learning by being told)。 学生从环境(教师或其它信息源如教科书等)获取信息,把知识转换成内部可使用的表示形式,并将新的知识和原有知识有机地结合为一体。所以要求学 生有一定程度的推理能力,但环境仍要做大量的工作。教师以某种形式提出和组织知识,以使学生拥有的知识可以不断地增加。这种学习方法和人类社会的学校教学 方式相似,学习的任务就是建立一个系统,使它能接受教导和建议,并有效地存贮和应用学到的知识。目前,不少专家系统在建立知识库时使用这种方法去实现知识 获取。示教学习的一个典型应用例是FOO程序。

  3)演绎学习(Learning by deduction)。

  学生所用的推理形式为演译推理。推理从公理出发,经过逻辑变换推导出结论。这种推理是"保真"变换和特化(specialization)的过 程,使学生在推理过程中可以获取有用的知识。这种学习方法包含宏操作(macro-operation)学习、知识编辑和组块(Chunking)技术。 演绎推理的逆过程是归纳推理。

  4)类比学习(Learning by analogy)。

  利用二个不同领域(源域、目标域)中的知识相似性,可以通过类比,从源域的知识(包括相似的特征和其它性质)推导出目标域的相应知识,从而实现 学习。类比学习系统可以使一个已有的计算机应用系统转变为适应于新的领域,来完成原先没有设计的相类似的功能。类比学习需要比上述三种学习方式更多的推 理。它一般要求先从知识源(源域)中检索出可用的知识,再将其转换成新的形式,用到新的状况(目标域)中去。类比学习在人类科学技术发展史上起着重要作 用,许多科学发现就是通过类比得到的。例如著名的卢瑟福类比就是通过将原子结构(目标域)同太阳系(源域)作类比,揭示了原子结构的奥秘。 5)基于解释的学习(Explanation-based learning, EBL)。

  学生根据教师提供的目标概念、该概念的一个例子、领域理论及可操作准则,首先构造一个解释来说明为什该例子满足目标概念,然后将解释推广为目标 概念的一个满足可操作准则的充分条件。EBL已被广泛应用于知识库求精和改善系统的性能。著名的EBL系统有迪乔恩(G.DeJong)的 GENESIS, 米切尔(T.Mitchell)的LEXII和LEAP, 以及明顿(S.Minton)等的PRODIGY。 6)归纳学习(Learning from induction)。

  归纳学习是由教师或环境提供某概念的一些实例或反例,让学生通过归纳推理得出该概念的一般描述。这种学习的推理工作量远多于示教学习和演绎学 习,因为环境并不提供一般性概念描述(如公理)。从某种程度上说,归纳学习的推

  篇二:机器学习的方法

  浅谈机器学习方法

  【摘 要】本文以什么是机器学习、机器学习的发展历史和机器学习的主要策略这一线索,对机器学习进行系统性的描述。接着,着重介绍了流形学习、李群机器学习和核机器学习三种新型的机器学习方法,为更好的研究机器学习提供了新的思路。

  【关键词】机器学习;人工智能;李群机器学习;核机器学习;流形学习

  Brief Remarks on Machine Learning Methods Zhen Panhao Abstract:First of all,machine learning is described systematically on the concept of machine learning,the history and main strategies of machine learning. Then,three new machine learningmethods of manifold learning,Lie Group machine learning and nuclear machine learning are referred emphatically to provide anew way of thinking for better research on machine learning. Keywords:machine learning;artificial intelligence;Lie group machine learning;kernel machine learning;manifold learning 0 引言

  计算机视觉是指用计算机实现人的视觉功能,希望能根据感知到的图像( 视频) 对实际的目标和场景内容做出有意义的判断如何能正确识别目标和行为非常关键,其中一个最基本的和最核心的问题是对图像的有效表达 如果所选的表达特征能够有效地反映目标和行为的本质,那么对于理解图像就会取得事半功倍的效果 正因为如此,关于机器学习的发展历史 特征的构建和选取一直得到广泛关注 近些年来人们已构建出许多特征,并且得到了广泛的应用,例如等等 设计特征是一种利用人类的智慧和先验知识,并且将这些知识应用到目标和行为识别技术中的很好的方式 但是,如果能通过无监督的方式让机器自动地从样本中学习到表征这些样本的更加本质的特征则会使得人们更好地用计算机来实现人的视觉功能,因此也是近些年人们关注的一个热点方向 深度学习( deeplearning) 的目的就是通过逐层的构建一个多层的网络来使得机器能自动地学习到反映隐含在数据内部的关系,从而使得学习到的特征更具有推广性和表达力本文旨在向读者介绍深度学习的原理及它在目标和行为识别中的最新动态,希望吸引更多的研究者进行讨论,并在这一新兴的具有潜力的视觉领域做出更好的成果 首先对深度学习的动机历史以及应用进行了概括说明; 主要介绍了基于限制玻尔 兹曼机的深度学习架构和基于自编码器的深度学习架构,以及深度学习

  近些年的进展,主要讨论了去噪自编码器( denoisingautoencoder),卷积限制玻尔兹曼机,三元因子玻尔兹曼机( 3-way factorizedBoltzmannmachine),以及神经自回归分布估计器( NADE) 等一些新的深度学习单元; 对目前深度学习在计算机视觉中的一些应用以及取得的成果进 行介绍; 最后,对深度学习与神经网络的关系,深度学习的本质等问题加以讨论,提出目前深度学习理论方面需要解决的主要问题

  1机器学习的发展历程

  机器学习的发展大致可以分为四个阶段.

  第一阶段:20世纪50年代中叶至60年代中叶这个时期是机器学习研究的热烈时代 研究对象是没有知识的学习,目标是各自组织和适应系统此阶段有两个代表,一是1957年Rosenblatt提出了感知机算法,这是第一个具有重要学术意义的机器学习的算法 二是50年代末,Samuel编写了跳棋程序,利用启发式搜索技术,可以从经验和棋谱中进行学习,不断调整棋盘评价函数,提高棋艺.

  第二阶段:20世纪60年代中叶至70年代中叶,机器学习的冷静时期本阶段是模拟人类的学习过程,采用逻辑结构或图结构作为内部描述 代表有:1969年Minsky与Papert出版的对机器学习研究有深远影响的著作<感知机>一书.

  第三阶段:20世纪70年代中叶至80年代中叶,称为复兴时期在这个时期,人们从学习单一概念延伸至学习的多个概念,探索不同的学习策略和各种学习方法在此阶段中,研究

  者已经将机器学习系统与现实应用相结合,完成相应的学习过程,取得了很大的成功1980年,在美国召开的第一届机器学习国际研讨会,标志着机器学习在全世界范围内的全面兴起.

  第四阶段:1986年至今 由于作为机器学习科学基础之一的神经科学研究的重新兴起,机器学习也进一步受到了人们的重视另一方面,对实验研究和应用研究得到前所未有的重视.

  2.1 机械学习

  机械学习是一种最基本的学习策略,把环境提供的信息简单存储起来,不经过任何推理,“死记硬背”式的学习。适合于一些环境相对稳定,输入输出模式相对固定的系统中,例如医生给病人看病。

  2.2 传授学习

  传授学习又叫做指导式学习或示教学习。传授学习的学习过程可以简单地描述如下:(1)请求:先向指导者请求提出建议;(2)解释:接受建议并将其转化为内部表示形式;(3)操作化:将解释后的建议转化为具体的知识;(4)归并:将得到的新知识归并到知识库中;(5)评价:对新知识进行评价,常用方法有,检查新知识与知识库里的知识是否矛盾,或者使 用新知识执行某些任务,观察其执行情况。

  2.3 演绎学习

  演绎学习以演绎推理为基础。演绎推理是一种有一般到个别的推理方法,其核心是三段论。例如,1动物都会死亡;2狗是一种动物;3狗会死亡。只要对给定的知识进行演绎的保真推理,就能得出一个正确的新结论,然后把有价值的结论存储起来。

  2.4 归纳学习

  归纳学习以归纳推理为基础。从某个概念的一系列正例和反例中归纳出一个一般的概念描述。归纳学习可分为有导师学习和无导师学习。有导师学习,又称示例学习。给学习系统提供正例和反例,学习系统通过归纳算法求解出一个总的概念描述。无导师学习,又称观察与发现学习。通过由环境提供的观察来进行学习,而且这些观察是未经过知道者分类的例子。

  2.5 类比学习

  类比学习是一种利用相似性来认识新事物的学习方式,其基础是类比推理。可以看作是演绎学习和归纳学习的组合学习形式。

  学习过程:

  (1)联想搜索匹配:提取特征值,搜索和它相似的已知事物;

  (2)检验相似程度:判断相似程度,相似程度达到一定阈值,则说明匹配成功;

  (3)修正变换求解:即类比映射,把对已知事物的有关知识进行适当的调整或变换,以求出新事物的解;

  (4)更新知识库:求出新事物的解以后,将新事物及其解并入知识库。

  3 机器学习方法

  3.1 流形学习

  现实世界中的数据,例如语音信号、数字图像或功能性磁共振图像等,通常都是高维数据,为了正确地了解这些数据,我们就需要对其进行降维,降维的目的就是要找出隐藏在高维数据中的低维结构。流形学习是一种新的数据降维方法,能揭示数据的内在变化规律,其目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个有效的低维表示。20xx年以来,流形学习在包括数据挖掘、机器学习、计算机视觉等多个研究领域得到了广泛的

  应用。

  3.2 李群机器学习

  李群机器学习(Lie Group Machine Learning,LML)作为机器学习领域的一种新的学习方法,一方面继承流形学习的优点,另一方面借用李群的思想,形成了具有创新特色的学习范式.自20xx年提出至今,已引起加拿大、爱尔兰、芬兰、意大利、美国等国内外同行的广泛关注。李群结构是目前学术界公认的对学习问题研究很有用的一套理论工具。从数据分析的角度来说,用机器学习进行数据分析(数据挖掘),其目的就是揭示这些数据具有的规律,从而帮助用户提供解释的依据。李群一方面具有好的数学结构,另一方面物理学家广泛使用李群方法来处理物理学中复杂数据的启发。因此,引进李群理论对机器学习是一种可以探索的新思路。

  3.3 核机器学习

  20世纪90年代初随着统计学习理论的完善和线性超平面函数集容量控制方法的发现,提出了著名的支撑矢量机方法(SVMs)。随后,以支撑矢量机为核心算法的核机器(KM)方法和Fisher判断分析(FDA)方法得到了机器学习、模式识别、网络搜索引擎技术、计算机视觉等等领域的广泛关注。核机器方法以统计学习理论为基础,巧妙利用了Mercer核技巧,使其获得了良好的推广能力、强大的非线性处理能力、灵活的相似性测度定义和简洁的模型表示,是目前在特征提取、模式识别、数据发掘领域公认的具有最佳性能的方法之一。

  4.1基于限制玻尔兹曼机的深度学习架构

  玻尔兹曼机( Boltzmannmachine)本质上是一种能量模型 能量模型是指对于参数空间( configurationspace) 中每一种情况均有一个标量形式的能量与之对应 能量函数就是从参数空间到能量的映射函数,人们希望通过学习使得能量函数有符合要求的性质 从结构上来说,玻尔兹曼机是双层无向全连通图,如图3所示 为了方便起见,这里仅讨论观测变量和隐变量均是0 1变量的情况

  玻尔兹曼机的能量函数为E( x,h) =-b'x-c'h-h'Wx-x'Ux-h'Vh ( 1)式中,x表示可见层,h表示隐层,b {0,1}K,c{0,1}D分别表示可见层和隐层单元的偏置( offset) , KD分别表示可见层和隐层单元的数目 WUV分别表示观测层和隐层之间,观测层变量之间,隐层变量之间的连接权重矩阵在实际中,由于计算样本概率密度时归一化因子的存在,需要使用马尔可夫蒙特卡洛方法( MCMC)来对玻尔兹曼机进行优化 但是MCMC方法收敛速度很慢,因此人们提出限制玻尔兹曼机和对比散度方法来解决这一问题.

  4.2限制玻尔兹曼机

  限制玻尔兹曼机是对全连通的玻尔兹曼机进行简化,其限制条件是在给定可见层或者隐层中的其中一层后,另一层的单元彼此独立,即式( 1) 中U和V矩阵中的元素均等于0 层间单元独立的条件是构成高效的训练限制玻尔兹曼机的方法的条件之 一,而RBM也因此成为深度置信网络( DBN)的构成单元 限制玻尔兹曼机的图模型如图4所示 可见,层内单元之间没有连接关系,层间单元是全连接关系

  将式( 1) 中层间连接矩阵U,V置零,得到限制玻尔兹曼机的能量函数E( x,h) =-b'x-c'h-h'Wx 由于限制玻尔兹曼机取消了层内单元之间的连接,所以可以将其条件概率分布进行分解,这样就简化了模型优化过程中的运算 但是在其优化过程中仍然需要基于MCMC方法的吉布斯采样,训练过程仍然十分漫长,因此人们提出对比散度方法来加快模型优化. 对比散度( contrastivedivergence) 是Hinton在2006年提出来的快速地训练限制玻尔兹曼机的方法,该方法在实践中得到广泛的应用 对比散度主要是将对数似然函数梯度的求解进行了两个近似:

  (1) 使用从条件分布中得到的样本来近似替代计算梯度时的平均求和这是因为在进行随机梯度下降法进行参数优化时已经有平均的效果,而如果每次计算都进行均值求和则这些效果会相互抵消,而且会造成很大的计算时间的浪费

  (2) 在进行吉布斯采样( Gibbs sampling) 时只采用一步,即仅仅进行一次吉布斯采样这种一次吉布斯采样方法会使得采样得到的样本分布与真实分布存在一定的误差 但是实践发现,如果仅作一次迭代的话,就已经能得到令人满意的结果将限制玻尔兹曼机逐层叠加,就构成了深度置信网络( DBN) 在深度置信网络中底层的输出作为上一层的输入,每层是一个限制

  玻尔兹曼机,使用对比散度的方法单独训练 为了达到更好的识别效果,往往还要对深度置信网络每层的参数进行微调使用限制玻尔兹曼机构建成深度网络,在一些公开的数据集上取得了非常好的效果.

  5机器学习系统的模型及其特征

  5.1 机器学习系统的模型

  (1) 外部环境是以某种形式表达的信息或知识的集合,是知识和信息的来源,执行的对象和任务 外部环境像系统提高信息的质量是影响学习系统设计的首要因素。(2)学习是将外部环境提供的信息,加工成为有效信息的过程,它也是学习系统的核心,包括采集信息接受监督指导学习推理修改知识库等其他功能。(3)知识库是影响学习系统设计的第二大因素,根据知识的不同,选择不同的表达方式,兼顾表达能力强易于推理易于修改知识库和知识表示易于扩展等几方面,均是知识库在表达上需要符合的要求。(4)执行是利用知识库完成某种任务,并进行识别论证决策判定,将获得的信息进行反馈,以修正和完善下一步的学习。

  5.2 机器学习系统的重要特征

  机器学习系统通常具有如下重要特征:(1)目的性系统知道学习什么,学习的行为具有高度的目的性。(2)结构性系统能修改和完善知识结构和组织形式。(3)有效性系统学习到的知识具有适应和符合实践的能力,能够对系统性能的改善起到正面的作用。(4)开放性系统在与环境进行信息交互的过程中,能使自身不断进化。

  6.机器学习策略

  对于环境提供信息,机器要运用一定的'学习策略转换为知识,并存储在知识库中,为下一步的执行作保证根据策略使用推理的多少和难易程度,学习策略可以分为四类: 1机械学习

  这种学习策略,无需任何推理过程或计算转换过程,可以直接将环境提供的信息进行存储该学习系统主要考虑三个方面:第一:存储组织的形式利于检索在采用机械学习的系统中,主要采用的是索引存储的方式,在这种情况下,只有检索一个项目比重新分析计算更加快捷,这种学习策略才具有一定的意义 采用适当的存储组织形式,最大限度地提高检索效率,缩短检索时间,是机械学习要解决的重大问题第二:环境稳定存储信息适用性高因为系统不需要对信息做过多的加工,学习部分没有推理的过程,这对于环境的依赖程度就大大提高要求环境具有高度的稳定性系统的学习是通过事先编好的程序获得,是建立在这次获得的知识适用于下次的情况的假设上的,如果环境变化的过于频繁,每次存的知识都不能适用,这种策略也就失去其意义第三:权衡存储和计算之间的关系学习的目的是改进系统的效率,如果检索比重新计算来的慢,那么就降低了系统的执行力 机械学习也就失去了意义。

  2归纳学习

  归纳推理是由环境提供足够多的实例或反例,应用归纳的方法,得出一般性的规律或对于概念的一般性的描述这是一个从个别到一般的过程归纳学习可以获得新的概念,创立新的规则,发现新的理论 其原理是在大量观察的基础上通过假设形成一个科学理论 按其有无教师的指导,可以分为示例学习及观察与发现学习示例学习,又称为概念获取 确定概念的一。

  篇三:机器学习

  机器学习

  机器学习就是通过对人类学习过程和特点的研究,简历学习理论和方法,以改进机器的行为和性能,提高机器解决问题的能力。通俗地说,机器学习就是研究如何用机器来模拟人类的学习活动,以使机器能够更好的帮助人类。而机器学习,就是要解决知识的自动获取问 题。

  机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一 个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。例如,它们遇到错误时不能自我校正;不会通过经验改善自身的性能;不会自动获取和发现所需要 的知识。它们的推理仅限于演绎而缺少归纳,因此至多只能够证明已存在事实、定理,而不能发现新的定理、定律和规则等。随着人工智能的深入发展,这些局限性 表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中尤其典型的是专家系统中的知识获取瓶颈问题,人们一直在努力试图采用机器学习的方法加以克服。

  机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。 学习是人类具有的一种重要智能行为,但究竟什么是学习,长期以来却众说纷纭。社会学家、逻辑学家和心理学家都各有其不同的看法。至今,还没有统一的“机 器学习”定义, 尽管如此,为了便于进行讨论和估计学科的进展,有必要对机器学习给出定义,即使这种定义是不完 全的和不充分的。顾名思义, 机器学习是研究如何使用机器来模拟人类学习活动的一门学科。稍为严格的提法是:机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。这里所 说的“机器”,指的就是计算机;现在是电子计算机,以后还可能是中子计算机、光子计算机或神经计算机等等

  机器能否象人类一样能具有学习能力呢?1959年美国的塞缪尔(Samuel)设计了一个跳棋 程序,这个程序具有学习能力,它可以在不断的对弈中改善自己的棋艺。4年后,这个程序战胜了设计者本人。又过了3年,这个程序战胜了美国一个保持8年之久 的常胜不败的冠军。这个程序向人们展示了机器学习的能力,提出了许多令人深思的社会问题与哲学问题。 机器的能力是否能超过人的,很多持否定意见的人的一个主要论据是:机器是人造的,其性能和动作 完全是由设计者规定的,因此无论如何其能力也不会超过设计者本人。这种意见对不具备学习能力的机器来说的确是对的,可是对具备学习能力的机器就值得考虑 了,因为这种机器的能力在应用中不断地提高,过一段时间之后,设计者本人也不知它的能力到了何种水平。

  机器学习是人工智能研究较为年轻的分支,它的发展过程大体上可分为4个时期。

  第一阶段是在50年代中叶到60年代中叶,属于探索时期。

  第二阶段是在60年代中叶至70年代中叶,被称为机器学习的发展时期。

  第三阶段是从70年代中叶至80年代中叶,称为繁荣时期。

  机器学习进入新阶段的重要表现在下列诸方面:

  (1) 机器学习已成为新的边缘学科并在高校形成一门课程。它综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学形成机器学习理论基础。

  (2) 结合各种学习方法,取长补短的多种形式的集成学习系统研究正在兴起。特别是连接学习符号学习的耦合可以更好地解决连续性信号处理中知识与技能的获取与求精问题而受到重视。

  (3) 机器学习与人工智能各种基础问题的统一性观点正在形成。例如学习与问题求解结合进行、知识表达便于学习的观点产生了通用智能系统SOAR的组块学习。类比学习与问题求解结合的基于案例方法已成为经验学习的重要方向。

  (4) 各种学习方法的应用范围不断扩大,一部分已形成商品。归纳学习的知识获取工具已在诊断分类型专家系统中广泛使用。连接学习在声图文识别中占优势。分析学习已用于设计综合型专家系统。遗传算法与强化学习在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划中发挥作用。

  学习是一项复杂的智能活动,学习过程与推理过程是紧密相连的,按照学习中使用推理的多少,机器学习所采用的策略大体上可分为4种——机械学习、通过传授学习、类比学习和通过事例学习。学习中所用的推理越多,系统的能力越强。

  环境向系统的学习部分提供某些信息,学习部分利用这些信息修改知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库 完成任务,同时把获得的信息反馈给学习部分。在具体的应用中,环境,知识库和执行部分决定了具体的工作内容,学习部分所需要解决的问题完全由上述3部分确 定。下面我们分别叙述这3部分对设计学习系统的影响。 影响学习系统设计的最重要的因素是环境向系统提供的信息。或者更具体地说是信息的质量。知识库 里存放的是指导执行部分动作的一般原则,但环境向学习系统提供的信息却是各种各样的。如果信息的质量比较高,与一般原则的差别比较小,则学习部分比较容易 处理。如果向学习系统提供的是杂乱无章的指导执行具体动作的具体信息,则学习系统需要在获得足够数据之后,删除不必要的细节,进行总结推广,形成指导动作 的一般原则,放入知识库,这样学习部分的任务就比较繁重,设计起来也较为困难。 因为学习系统获得的信息往往是不完全的,所以学习系统所进行的推理并不完全是可靠的,它总结出来的规则可能正确,也可能不正确。这要通过执行效果加以检验。正确的规则能使系统的效能提高,应予保留;不正确的规则应予修改或从数据库中删除。

  知识库是影响学习系统设计的第二个因素。知识的表示有多种形式,比如特征向量、一阶逻辑语句、产生式规则、语义网络和框架等等。这些表示方式各有其特点,在选择表示方式时要兼顾以下4个方面:

  (1)表达能力强。

  (2)易于推理。

  (3)容易修改知识库。

  (4)知识表示易于扩展。

  对于知识库最后需要说明的一个问题是学习系统不能在全然没有任何知识的情况下凭空获取知识,每一个学习系统都要求具有某些知识理解环境提供的信息,分析比较,做出假设,检验并修改这些假设。因此,更确切地说,学习系统是对现有知识的扩展和改进。 执行部分是整个学习系统的核心,因为执行部分的动作就是学习部分力求改进的动作。同执行部分有关的问题有3个:复杂性、反馈和透明性。

  学习策略是指学习过程中系统所采用的推理策略。一个学习系统总是由学习和环境两部分组成。由环境(如书本或教师)提供信息,学习部分则实现信息转换,用 能够理解的形式记忆下来,并从中获取有用的信息。在学习过程中,学生(学习部分)使用的推理越少,他对教师(环境)的依赖就越大,教师的负担也就越重。学 习策略的分类标准就是根据学生实现信息转换所需的推理多少和难易程度来分类的,依从简单到复杂,从少到多的次序分为以下几种基本类型:

  1)机械学习

  学习者无需任何推理或其它的知识转换,直接吸取环境所提供的信息。如塞缪尔的跳棋

  程序,纽厄尔 和西蒙的LT系统。这类学习系统主要考虑的是如何索引存贮的知识并加以利用。系统的学习方法是直接通过事先编好、构造好的程序来学习,学习者不作任何工 作,或者是通过直接接收既定的事实和数据进行学习,对输入信息不作任何的推理。

  2)示教学习

  学生从环境(教师或其它信息源如教科书等)获取信息,把知识转换成内部可使用的表示形式,并将 新的知识和原有知识有机地结合为一体。所以要求学生有一定程度的推理能力,但环境仍要做大量的工作。教师以某种形式提出和组织知识,以使学生拥有的知识可 以不断地增加。这种学习方法和人类社会的学校教学方式相似,学习的任务就是建立一个系统,使它能接受教导和建议,并有效地存贮和应用学到的知识。目前,不 少专家系统在建立知识库时使用这种方法去实现知识获取。示教学习的一个典型应用例是FOO程序。

  3)演绎学习

  学生所用的推理形式为演绎推理。推理从公理出发,经过逻辑变换推导出结论。这种推理是"保真" 变换和特化(specialization)的过程,使学生在推理过程中可以获取有用的知识。这种学习方法包含宏操作(macro-operation) 学习、知识编辑和组块(Chunking)技术。演绎推理的逆过程是归纳推理。

  4)类比学习

  类比学习是获取新概念或新技巧的方法,它把类似这些新概念或新技巧的已知知识转换为适于新情况的形式。类比学习的第一步是从记忆中找到类似的概念或技巧,第二步是把它们转换为新形式以便用于新情况。例如人类的一种学习方式是先由老师教学生解例题(先例),再给学生留习题。学生寻找在例题和习题间的对应关系,利用解决例题的知识去解决习题中的问题。学生经过一般化归纳推出原理,以便以后使用。这种类比学习方式是人类常用的。问题求解基本过程:

  1.比较新状态与目标状态。

  2.选择可以减小这个差异的操作。

  3.如果前提满足就使用这个操作,否则保存新状态,并用中间结局分析解决子问题,以便实现未满足的前提。

  4.在解决子问题后,再取出保存的状态,继续处理原问题。转换类比学习主要有两步:

  (5)基于解释学习

  解释学习起源于经验学习的研究。50年代未,对神经元的模拟中发明了用一种符号来标记另一些符号的存储结构模型,这是早期的存储块(chunks)概念。在象棋大师的头脑中就保存着在各种情况下对弈经验的存储块。80年代初,Newell和Rosenbloom认为,通过获取任务环境中关于模型问题的知识,可以改进系统的性能,chunks可以作为对人类行为进行模拟的模型基础。通过观察问题求解过程,获取经验chunks,用其代替各个子目标中的复杂过程,可以明显提高系统求解的速度。由此奠定了经验学习的基础。Mitchell等人把基于解释的学习过程定义为两个步骤:

  (1) 通过求解一个例子来产生解释结构;

  (2) 对该解释结构进行一般化,获取一般的控制规则。

  人工智能一直处于计算机技术的前沿,其研究和发展在很大程度上决定着计算机技术乃至整个社会的发展。而机器学习作为人工智能中极其重要的一环,正在迅猛的发展着,它使得计算机能够模拟人的学习行为,自动地通过学习获取知识和技能,不断改善性能,实现自我完善。

  信息化的飞速发展给人工智能提出了更高的要求。人工智能发展的曲折性还将继续,但其潜能却是无限的。也许不远的将来,人们的生活方式将由于人工智能的发展而经历一场“革命”。 参考资料:

  《人工智能导论》 机械工业出版社,鲍军鹏、张选平等编著。

【机器的学习方法三篇】相关文章:

机器购买合同04-23

机器转让合同04-22

各科的学习方法11-01

学习方法的指导11-01

高中的学习方法10-29

学习方法的作文09-04

政治的学习方法12-08

拼音的学习方法11-29

学习方法的谚语02-04

高考的学习方法12-04