如何向普通人解释机器学习、数据挖掘

 如何向普通人解释机器学习、数据挖掘

随着数据科学在人工智能发展中大放异彩,数据挖掘、机器学习进入了越来越多人的视野。而对于很多人来说,诸如机器学习之类的名次听起来是神乎其技,但其真正的内涵却不为一般人所知。

特别是对于从事数据科学领域的人来说,如何向外行人解释自己所从事的工作几乎是一个超级难题。那么到底什么是机器学习,如何用通俗易懂的语言来解释?我们通过以下几重境界来解释。

一、专业理论型

百科定义+专业术语,让人听起来不明觉厉,实则一脸懵逼

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。

机器学习从本质上来说是一种学习结构, 整个结构包括环境、知识库和执行三个部分。 在整个过程中,环境向系统提供信息,系统利用这些信息修改知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分,从而继续改进知识库。

在具体的应用中,环境、知识和执行部分决定了具体的工作内容,学习部分所需要解决的问题完全由上述三部分确定。 简单来说,机器学习就是计算机利用已有的数据,得出了某种模型,并利用此模型预测未来的一种方法, 这与人脑的思考方式非常类似。

如何向普通人解释机器学习、数据挖掘

二、以小见大型

以某种机器学习具体的案例来说明,让人恍然大悟

一开始我们先来看一个人为设计的场景。假设一个房间里神奇地漂浮着无数个小球。我们想搞清楚这些小球停留的位置是否存在着一种特定的结构。比方说,小球是不是更易集中在某一特定区域?是不是故意避开某些点位?它们是均匀分布于整个空间吗?

但是房间一片漆黑,我们什么也看不见。于是我们找来了一部带闪光灯的照相机,想把漂浮在整个房间的小球都拍下来。照片犹如下图一样:

如何向普通人解释机器学习、数据挖掘

就算小球的位置之间确实存在某种联系,从这张照片上我们也看不出个所以然。看上去小球就像是均匀分布的一样。所以我们尝试着换了下位置,从新的角度拍下了第二张照片。

如何向普通人解释机器学习、数据挖掘

照片上的小球看起来还是随机分布的,没有任何规律。让我们换个高点的角度试试看。

如何向普通人解释机器学习、数据挖掘

呃,还是看不出有什么规律来。那我们最后再换个低点的角度试一次。

如何向普通人解释机器学习、数据挖掘

啊哈,这次有点意思了:看起来小球集中分布在靠近屋顶和地面的两个区域,中间这段没有一个小球。因此,为了发现这个规律,我们在拍照时就必须找到一个“好”的角度。如果角度不对,那我们永远都不可能找出任何规律。

在上面这个例子中,我们想说的其实是三维数据点。每个小球的位置都可以由3个数字来表示,每个数字分别代表它在XYZ三条轴上的位置。在实际的电脑运算中,数据点的位置会由更多的数字组合来表示。

比如医院病人的病历可能会包含500组数字,包括他的生日年月日、身高、体重、血压、最近一次的看病记录、胆固醇指标等等。我们会想要搞清楚不同病人的数据点之间是否存在某种规律,如心脏病人的数据点是否会集中分布?如果数据点确实会集中分布,当我们发现新入院病人的数据点也出现同样的趋势时,我们就可以推断这位病人很可能犯心脏病。当然,实际操作起来肯定不会如此简单。

用户喜欢...

电源管理集成电路(PMIC)如何减少这些挑战的影响

在设计具有现场可编程门阵列(FPGA)的系统时,系统设计人员可以获得三个好处:可重编程性,性能可扩展性和快速上市时间。但是,设计师也必须克服挑战。在这篇文章中,我将讨论电源管...


为了提高效率 - 如何将双向功率流集成到UPS设计中(第2部分)

在本系列的第1部分中,我讨论了如何将双向功率流集成到不间断电源(UPS)设计中。在第二部分中,我将更详细地介绍用于UPS和电池备份应用的2kW,48V至400V, 93%效率,隔离双向DC / DC转换器参...


为了提高效率 - 如何将双向功率流集成到UPS设计中(第1部分)

随着对更紧凑,更小和更高效的电力系统的日益重视,对双向转换器的兴趣日益增加。能够双向功率流的双向DC / DC转换器可以将传统上用于电池充电和备份操作所需的两个DC / DC转换器组合成一...


如何为高性能、低侧电流传感设计电路板?

在我以前的 博客帖子 我讨论了低侧电流传感如何帮助控制电机,然后给出了设计低侧电流传感电路的三个步骤,以适用于成本敏感的应用。在这篇文章中,我将讨论如何使用正确的印刷电路板...


如何设计-130-dB超低失真数据采集系统

数据采集​​系统(DAS)是工业,医疗和电信应用的标准测量和分析仪器,包括医学成像,音频和振动分析以及模拟和数字调制系统的测试。在大多数情况下,采集和数字化信号通过快速傅里叶...


自主汽车传感器:处理器算法如何获得输入

尽管鉴于最近特斯拉级别S的死亡,有关自主汽车消亡的非澳门美高梅娱乐城性媒体报道,我想在本文中介绍传感器电子设备,结合更好和更精细的软件算法,最终将实现在未来十年内,一辆安全,完全自主...


如何设计电感式触摸金属按钮面板

人机界面(HMI)正在经历地震变化,现在有一种新方法可用于设计按钮面板。在创建金属触摸(ToM)按钮时,电感式传感澳门美高梅娱乐城正成为首选方法。主要原因是它可以降低成本,同时更加可靠,因为...


如何为RF应用选择,使用和维护同轴连接器

无线电频率(RF)电路在有线和无线通信中正在激增,包括用于物联网(IoT)的Wi-Fi和各种无线澳门美高梅娱乐城。这些高频信号需要在系统,电路组件和子组件之间进行分配,而损耗或寄生辐射损耗最小。...


如何快速实施符合Qi标准的无线充电系统

对于移动设备,充电过程仍然是最后的束缚。尽管诸如无线充电联盟(WPC)Qi规范等标准有助于支持更高的充电功率水平,但开发人员在设计电路,印刷电路板和固件时仍面临多重挑战,以全面...


如何快速将NFC功能添加到任何应用程序

为了满足对近场通信(NFC)能力日益增长的需求,开发人员被要求快速创建优化设计。传统方法的发展速度缓慢,因为设计人员面临诸如RF电路优化,NFC协议管理,功耗以及最小设计占用等挑战...


降低机器人风险:如何设计安全的工业环境

工业自动化(IA)的增加,特别是工业机器人的使用,正在增加人类操作员与其他移动设备或移动机器之间的意外交互的机会。设计师有责任采取适当且经常重叠的安全预防措施,以避免从生产...


如何设计可靠,准确的存在感应

随着消费和工业系统变得更智能,更具交互性和更自主,他们需要能够感知对象,用户或路过者的存在。尽管基本的在场感知澳门美高梅娱乐城和澳门美高梅娱乐城已经很成熟,但设计人员面临着更精确,高效,经济高效...


无论环境如何,都可获得高精度,多通道温度测量

尽管温度测量是许多应用的常见要求,但开发人员在确保高度准确的结果方面面临严峻的挑战。克服这些挑战通常会导致设计复杂和设计周期延长,但新设备正在降低复杂性。 本文简要讨论与...


智能制造商如何将工业4.0原则提高到质量

质量很重要。许多制造商会告诉你,质量差,影响到最高和最低。他们会告诉你,质量差的后果正在崛起,社交媒体可能会使质量问题对OEM品牌造成破坏。他们也会告诉你,他们正在努力应对。...


数字双胞胎如何在物联网支持的环境中推动创新

动态数字表示或数字双胞胎正在迅速改变行业设计,构建和操作其澳门美高梅娱乐在线和流程的方式。Gartner预测,到2021年,一半的大型工业公司将使用数字双子机,从而使这些机构的有效性得到10%的提高。...


如何建立一个可扩展的DIY iBeacon

在阅读Eddystone发布后,我对物理网络的概念感到非常兴奋。从200多个通知走出商场的想法在一定程度上蕴藏着我的热情,但是使用iBeacons做广告和销售以外的事情是一个非常有趣的机会。 我有一...


博聚网