什么是机器学习?|我试图以一种易于理解的方式对其进行解释[深度学习的差异]

Eto(一家使用机器学习进行合同开发的公司的销售和工程师)@ as00812145叫做。

自从最近深度学习和机器学习被召唤以来已经有很长的时间了,但是什么才是机器学习呢?
我认为很难全面了解使用什么机器学习来创建服务。

对于那些想要创建这样的蓬松图像并想要具体固化的人,这次我们将从机器学习的概述到实际的数字用法进行说明。

什么是机器学习?

简介首先,什么是机器学习?我会解释的。
机器学习是一种基于大量数据查找模式和特征并具有自动区分或预测它们的机制的技术。

机器学习的共同思想是创建一种机制(称为鉴别器),该机制可在输入数据时预测结果。
并且由于输入数据应具有一定的规律性(分布等),因此有一种想法,可以使用现有数据来训练和近似规律性以发现规律性。
就像图中一样,将蓝点视为我们知道的数据,而我们真正想要掌握的规律性就是红色曲线。

您可以看到,这些蓝点的数量越大,越接近红色曲线。

实际上,我不知道这么简单的形式,但是就像一个数学公式一样,为了找到或近似一个总是给出答案的方程式,我让数据的物理量说些什么并进行搜索。对。

机会学习类别

既然您已经知道了机器学习的一般概念,那么我将解释您拥有哪种预测方法。
我想用一个粗略的关系图来解释。

从现在开始,我们将区分器称为一种判断机器学习所产生的东西的机制。绝对不是AI或人工智能。
它们被称为区分器,以避免误解,因为根据定义的开头,它们可能具有不同的含义和不同的人员。

基本上,您手头就有数据,并根据要使用的方式,选择要创建的鉴别器的类型和创建方法。
然后,该鉴别器的结果用于解决实际问题。
这次,我将不涉及如何生成鉴别器。有太多类型,可能会造成混淆,因此,如果有机会,我想分别解释一下。
因此,从现在开始,我将仅说明鉴别器的类型。

和老师一起

与老师一起,在预测数据之前,预先给出数据,并基于该数据进行学习以预测和分类数据。
由于这种方法,如果根据目的有足够数量的数据,则可以轻松完成学习,并且由于它是专门用于特定目的的,因此可以相对容易地引入学习。
现在,机器学习使用的大多数服务都是监督学习。

分类

为了分类,将标签预先贴在手边的数据上,并以是否与标签相对应的形式确定数据。
例如,如果要确定图片中的人是否在笑。
照片中有两种状态(标签):“笑”和“不笑”。
我们使用机器学习来确定应用到哪个状态。

返回

回归是通过像在学校学习到的函数一样通过数值观察来确定的。
例如,考虑使用机器学习对一年的需求进行预测。这次,让我们具体预测一下在一般商店中购买商品的需求量。在这种情况下,我们将用具体的数值来预测,例如一个月中有多少。
与以前的分类不同,回归用于对未来的事物进行数字预测。

没有老师

与以前的老师不同,我用它来了解数据具有什么样的模式和特征,而不是从手头的数据到我确定的目的进行分析。
因此,与其单独使用它,不如以将其带入监督学习的形式来使用它。

聚类

聚类是一种根据手头数据的信息确定粗聚类(质量)的方法。
但是,就像我之前所做的那样,仅集群在实际工作中并不是很有用。
由于使用聚类来了解数据的特征,因此在难以确定正确或错误答案时(例如,在搜索代理商时,很难确定谁是代理商)。
对数据进行粗略分类,并从中识别出特征以构成教师数据的特征。

神经网络深度学习

我还将简要介绍一下导致当前AI繁荣的深度学习及其基础的神经网络。
神经网络是一种通过对人脑的细胞(神经元)建模而创建的判别方法。
接收一个输入,确定它是否满足条件,如果满足,则将值传输到下一个神经元(触发)
如果不符合,则什么也不做。这样,被点燃的信息最后输出,并根据结果确定。
而且,神经网络本身可以用于前面提到的分类和回归。

深度学习是这些多层机制的加深。

深度学习本身的高层已经存在了一段时间,但是如果层数太多,它们在实践中将无法正常运行。
最近,当我使用DropOut时,这是一种随机停止向下一神经元传输的方法,不仅由于某种原因它可以正常工作,而且还可以在图像和声音等领域使用机器学习来实际使用。它已经可以组装并连接到当前的AI臂架,已经成为一种精度水平。
顺便说一下,DropOut之所以变得实用的原因尚未被学术团体弄清楚。
也许由于这样的实用技术,深度学习的领域通常是像数据技术那样具有数据科学家的皮肤感觉而创建的。

概要

如果仅是机器学习,则神经网络和深度学习往往会引起人们的注意,
它们只是方法或过程的一部分,而不是本质。
为了在实践中正确地处理它,除了深度学习以外,哪种解决方案也很重要,因此有可能了解机器学习的概况以及深度学习的位置。我希望你有。

撰写本文的人

assa

我是京都的工程师。记住assa或eh。 我的主要业务是在网上玩我的业余爱好。有什么好的