先把数据挖掘,机器自学,人工智慧等那些基本概念弄清楚,就晓得大数据挖掘是甚么了,和从哪已经开始扬名立万了。
数据挖掘,机器自学,广度自学,人工智慧的亲密关系我画了这那哥
我来说明下这那哥。
所有人控制技术的再次出现都是为的是化解现实生活难题,而现实生活难题分成单纯难题和繁杂难题。单纯难题,须要单纯预测,他们采用数据挖掘。繁杂难题,须要繁杂预测,他们采用机器自学。
1、甚么是单纯难题?
比如公司领导想晓得每周的销售情况,这种就是单纯难题。单纯难题可以用数据挖掘来处理,通过预测数据来预测出有用的信息。
最单纯的,你用 excel 预测一家淘宝店铺的销售数据,每周公司会让你出一份周报一份发现了最近几个月销量下降,然后根据预测产生销量下降的原因是甚么,找到原因后制定对应的策略来提高销量。
他们来看一个真实的案例。全球最大的旅行房屋租赁社区 Airbnb 曾在 2011 年纠结于新用户增长的缓慢,有一天,他们的数据挖掘团队发现房源照片的精美程度,跟房源的预定人数成很大的正相关。
于是,他们提出一种假设,即「附有专业摄影照片的房源要更抢手,因此房主肯定会愿意申请 Airbnb 提供的此项服务」。
他们迅速上线了一个提供专业摄影照片服务的版本,然后跟原版本做 A/B Test,发现同一个房源,采用专业摄影服务的比不采用的多了 2-3 倍的订单量。
2011 年后期,Airbnb 雇用了 20 名专业摄影师,以帮助平台上的房主拍摄房屋照片,几乎在同一时间段,Airbnb 的订单量曲线有了一个陡峭的增长。
2、甚么是繁杂难题?
比如他们天天采用的淘宝,它会根据你的历史购物习惯(数据),来给推荐你可能感兴趣的商品。淘宝是如何做到的呢?对于这种繁杂难题,淘宝背后采用的就是机器自学。
我再举个例子,今日头条是如何靠机器自学逆袭成为新闻客户端老大的。
2010 年前后,门户时代崛起的网易、搜狐、腾讯三巨头向移动端转型,几乎垄断了当时的新闻客户端市场。而仅仅 2 年后,今日头条,采用「机器自学」这把屠龙刀向用户个人性化推荐用户感兴趣的新闻,一举打破巨头垄断,成为新闻客户端老大。虽然,后来腾讯和网易为的是对抗头条,推出了类似的产品的天天快报和网易号,但因起步晚和算法不成熟,都失败了。
下面图片是我在知乎一个难题下回答的传播预测报告
在这份报告中,像点赞数、评论数、收藏数、总阅读量这样的预测就是单纯预测。像「你可能感兴趣的人」这样的预测,就是繁杂预测,须要通过机器自学算法来找到,类似于豆瓣上给你推荐感兴趣的电影、淘宝上给你推荐感兴趣的商品。
3、甚么是广度自学?
机器自学分很多方法(算法),不同的方法化解不同的难题。广度自学是机器自学中的一个分支方法。
广度自学在图像,语音等富媒体的分类和识别上取得了非常好的效果,所以各大研究机构和公司都投入了大量的人力做相关的研究和开发。我说个例子,你肯定听说过。那就是 2016 年谷歌旗下 DeepMind 公司开发的阿尔法围棋(AlphaGo)战胜人类顶尖围棋选手。阿尔法围棋的主要工作原理就是「广度自学」。
4、甚么是人工智慧?
人工智慧,它的范围很广,广义上的人工智慧泛指通过计算机(机器)实现人的头脑思维,使机器像人一样去决策。
机器自学是实现人工智慧的一种控制技术。所以我把人工智,机器自学,广度自学放到不同的圆圈里,他们三者是包含的亲密关系:
现在,你已经清楚了数据挖掘、机器自学、广度自学那些基本概念的亲密关系了。当他们从化解现实生活难题的角度来看,很多基本概念会清楚。处理不同的难题,采用不同的方法。
5、数据挖掘与人工智慧的亲密关系?