进行机器学习和数据科学常犯的错误
进行机器学习和数据科学常犯的错误 作者:Jekaterina Kokatjuhha 原文链接: https://www.kdnuggets.com/2018/12/common-mistakes-data-science.html版权声明:……
如何从头开始构建数据科学项目
> 使用柏林租赁价格分析的实例,包括如何从网络中提取数据并进行清理,获得更深入的见解,以及使用外部API特性等等。 有许多关于数据科学和机器学习的在线课程将指导您完成理论,并为您提供一些代码示例和对非常干净数据的分析。 然而,为了开始实践数……
机器学习项目清单
> 为了进一步完善我们的内部模型,本文将概述AurélienGéron的机器学习项目清单,参见他的畅销书“动手学习Scikit-Learn&TensorFlow”。 我发现编写和比较特定过程的各种解释的活动,以实现自己对所述过程的解释是有价……
掌握机器学习中数据准备的六个步骤
> 为了分析和机器学习计划准备数据,团队可以加速机器学习和数据科学项目,以提供身临其境的客户体验,通过下面六个关键步骤来加速和自动化数据到洞察管道。 当今组织继续寻找快速,准确地准备数据的方法,以解决他们的数据挑战并实现机器学习(ML)。……
支持向量机是什么?我为什么要使用它?
>支持向量机已经成为一种非常流行的算法。在本文中,我试图对其工作原理给出一个简单的解释,并给出几个使用Python scikit库的示例。 支持向量机是什么? 支持向量机是一种有监督的机器学习算法,可以用于分类或回归问题。它使用一种称为核技……
逻辑回归——详细概述
逻辑回归在20世纪早期被用于生物科学。它后来被用于许多社会科学应用。因变量(目标)为分类变量时采用Logistic回归。 例如, 预测电子邮件是垃圾邮件(1)还是(0) 肿瘤是否恶性(1)(0) 考虑一个场景,我们需要对电子邮件是否为……
机器学习的不同类型
有监督的和无监督的主要是由许多机器学习工程师和数据极客使用。 强化学习对于解决问题非常强大且复杂。 有监督学习 从[上期文章](http://shujuren.org/article/787.html "上期文章")我们知道,机器学习以数……
机器学习介绍
在我们理解机器学习之前,让我们先来谈谈为什么需要机器学习,以及我们为什么要关心它? 如果我让你写一个两个数字相加的程序,你可能会写它,但是如果我让你用同一个程序做乘法呢? 它还可以工作吗? 绝对不能够了。那个程序只做加法。 另一个例子是如……
GraphLab机器学习框架
> GraphLab是用c++编写的一种新的机器学习并行框架。它是一个开源项目,设计时考虑了真实世界数据的规模、多样性和复杂性。 1 GraphLab安装 首先,进入GraphLab官网。 https://turi.com/ 申请一个学术用……
Keras深度学习介绍
> 在本文中,我们将使用[Keras](https://keras.io/ "Keras")构建一个简单的神经网络。我们假设您对机器学习包(如[scikit-learn](http://scikit-learn.org/stable/ "s……
从头开始编写任何机器学习算法的6个步骤:感知器案例研究
> 从头开始编写机器学习算法是一种非常有益的学习体验。 我们在此过程中强调了6个步骤。 有些算法比其他算法更复杂,所以从一些简单的算法开始,从一些非常简单的算法开始,比如单层感知器。 我将以感知器为例,带您经历以下6步过程,从头开始编写算……
随机森林算法
你好,你在本文中,可以看到这些内容: 随机森林是什么? 随机森林如何工作? 随机森林的优势 随机森林的应用 随机森林是什么? 随机森林是一种非参数的集成学习方法,森林里面的每一棵决策树是通过重采样训练数据集而生成的。与单一树对比,随机……
初学者机器学习教程
数据科学家 在本教程中,我只向您解释您需要成为一名数据科学家,而不是更多或更少。 数据科学家需要具备以下技能: 基本工具:像python,R或SQL。 你不需要知道一切。 你只需要学习如何使用python 基本统计:像平均值,中位数或标准……
机器学习:决策树
一棵树在现实生活中有许多类比,并且结果表明它广泛地影响机器学习,包括分类和回归。 在决策分析中,决策树可用于在视觉上和明确地表示决策和作出决策。 顾名思义,它是使用树状的决策模型。 虽然它是数据挖掘中常用的工具以用于推导达到特定目标的策略,……
深度学习的能与不能
2018(第九届)清洁发展国际融资论坛上,北京交通大学人工智能研究院常务副院长、教授于剑先生从专业角度回顾了人工智能的发展历程,并介绍了深度学习的适用范围和所面临的问题。他指出,深度学习是机器学习领域最引人注目的研究方向,但没有任何一种算法……
数据跨界 2018-08-29