圈子


关注微信公众号
关注微信公众号
原创 银行信贷数据集探索性数据分析
本文为了迭代一个探索性数据分析的通用模式,首先使用银行信贷数据进行探索性数据分析,希望能够得到一个通用的强大探索性解决方案。 数据导入 数据是来自klaR的GermanCredit数据. library(pacman) p_load(tidyverse,klaR) data(GermanCredit) GermanC……


原创 Centos7服务器上安装R和Rstudio
> 为了增加计算力来处理和整合更多和更杂的数据集,运维同事给我们分配了服务器。服务器是用Centos7的Linux系统,为了完成数据科学任务,我们需要在服务器上面搭建R平台。 通过阅读本文,你可以获得: 服务器上面安装R和RStudio 服务器上面安装常用R包 1 准备工作 在CentOS 7上,R可以基于epel……


转载 目标函数的经典优化算法介绍
> 本文使用通俗的语言和形象的图示,介绍了随机梯度下降算法和它的三种经典变体,并提供了完整的实现代码。 目标函数是衡量预测值和实际值的相似程度的指标。通常,我们希望得到使代价尽可能小的参数集,而这意味着你的算法性能不错。函数的最小可能代价被称为最小值。有时一个代价函数可以有多个局部极小值。幸运的是,在参数空间的维数非常……


转载 AI成新金融核心竞争力,得技术者得“天下”
“AI+”时代的到来 在过去几年,时代的关键词从“互联网+”过渡到了“AI+”,“AI+教育”,“AI+医疗”,“AI+安防”,AI正在大踏步走进我们生活的各个领域,而金融业,无疑是人工智能运用最为深入的领域。一方面人工智能的应用大大降低了人力成本,提升了工作效率,正如创新工场董事长兼首席执行官李开复所说“15年内,人……


转载 AI是将使健康转型真正全球化的一种方式
或许,人工智能在健康领域的革命最吸引人的地方在于,这些进步正在全球范围内发生,而不只是在我们往往与尖端创新联系在一起的富裕国家。以我国为例,中国在2017年概述了到2030年成为人工智能全球领导者的计划,并已经取得了巨大进展。肺癌是中国最常见的癌症,中国寿险公司平安(Ping An)开发的人工智能今年打破了CT扫描中检……


转载 人工智能撬动零售变革
人工智能的快速发展将有助于赋能新零售商,有效重构零售行业“人、货、场”等要素,提升各环节效率,最终提升消费者购物体验,推动零售行业迎来第五次变革。 近年来,在数据、算法、技术等方面已具备较深积累的互联网巨头纷纷布局零售行业,带来了新零售、新模式等加速落地,有望重塑零售行业竞争格局,我们认为人工智能对零售行业的意义不仅体……


转载 大数据:驱动未来教育的新引擎
今年4月,教育部正式发布《教育信息化2.0行动计划》,全面开启以大数据为重要载体的教育信息化发展升级新征程。从国内外教育形势来看,这项工程已经不再仅仅是“可做或不做”“可多做或少做”的选择题,而是“必须做”且“必须做好”的必答题。在这样的大背景下,如果不去主动迎接挑战,勇敢迎上时代风口,势必会被新技术浪潮所淘汰。 大……


转载 人工智能驱动下的通信业变革
>数据、算力和算法分别是人工智能的三大核心要素。近年来,三大要素的不断发展,推动人工智能进入发展黄金期。 首先是数据的爆发式增长,尤其是物联网带来的海量数据。据预测,到2020年全球数据总量将达到40ZB,我国数据量将达到8.6ZB。海量的数据为机器学习提供了丰富训练素材。 其次是算法方面,2006年深度学习技术的出……


原创 关于 Rstudio 1.2 新功能介绍
RStudio公司与2018年10月2号发布了preview release RStudio 1.2版 IDE。 目前官网里还是提供1.1版下载。如果想下载1.2版的请到下载地址: (Rstudio 1.2) 5.更容易生成PPT Rstudio 1.2 内置新版的 Pandoc 使得 Rmarkdown更容易生成……


翻译 R的整洁交叉验证教程
介绍 这篇文章将使用{tidymodels}软件包集合中的几个软件包,即{recipes},{rsample}和{parsnip}以整洁的方式来训练随机森林。 我还将使用{mlrMBO}来调整随机森林的超参数。 设置 让我们加载所需要的包: library("tidyverse") library(……


翻译 6个技巧,让你的可视化看起来更专业
当我开始使用R时,像任何初学者一样,我想要一个真正能够工作的代码和一个最低限度可理解的图像,并且很长一段时间这是我的主要目标,但是一旦这一点完成后,我意识到我的可视化看起来很糟糕,特别是在比较和审查其他博客和网站之后,我开始搜索如何改进我的可视化。 下面,创建一个简单且专业的图像的一些技巧,以吸引读者的注意力。 1 创……


翻译 支持向量机是什么?我为什么要使用它?
>支持向量机已经成为一种非常流行的算法。在本文中,我试图对其工作原理给出一个简单的解释,并给出几个使用Python scikit库的示例。 支持向量机是什么? 支持向量机是一种有监督的机器学习算法,可以用于分类或回归问题。它使用一种称为核技巧的技术来转换数据,然后根据这些转换在可能的输出之间找到一个最佳边界。简单地说,……


翻译 逻辑回归——详细概述
逻辑回归在20世纪早期被用于生物科学。它后来被用于许多社会科学应用。因变量(目标)为分类变量时采用Logistic回归。 例如, 预测电子邮件是垃圾邮件(1)还是(0) 肿瘤是否恶性(1)(0) 考虑一个场景,我们需要对电子邮件是否为垃圾邮件进行分类。如果我们用线性回归来解决这个问题,就需要设置一个阈值,根据这个……


翻译 机器学习的不同类型
有监督的和无监督的主要是由许多机器学习工程师和数据极客使用。 强化学习对于解决问题非常强大且复杂。 有监督学习 从[上期文章](/article/787.html "上期文章")我们知道,机器学习以数据为输入,我们称这个数据为训练数据。 训练数据包括输入和标签(目标)。 什么是输……


翻译 机器学习介绍
在我们理解机器学习之前,让我们先来谈谈为什么需要机器学习,以及我们为什么要关心它? 如果我让你写一个两个数字相加的程序,你可能会写它,但是如果我让你用同一个程序做乘法呢? 它还可以工作吗? 绝对不能够了。那个程序只做加法。 另一个例子是如果我告诉你为下面的块写逻辑,你会写多少程序? 你需要为每个块写一个单独的程序/……


原创 制造业的机器学习:优势,挑战和机会
论文: 《Machine learning in manufacturing: advantages, challenges,and applications》的阅读笔记。 论文下载链接: https://pan.baidu.com/s/1GfQX-JBXZ7HolVlA5QFX7w 本论文是机器学习在制造业领域的一……