登陆注册
57953100000025

第25章 >10 机器学习 小故事们,话不多说,直接哔哔

喵喵喵?

小故事:“机器学习”名字的由来

1952年,阿瑟·萨缪尔(Arthur Samuel, 1901- 1990)在IBM公司研制了一个西洋跳棋程序,这个程序具有自学习能力,可通过对大量棋局的分析逐渐辨识出当前局面下的“好棋”和“坏棋”,从而不断提高弈棋水平,并很快就下赢了萨缪尔自己.

1956年,萨缪尔应约翰●麦卡锡(John McCarthy,“人工智能之父”,1971年图灵奖得主)之邀,在标志着人工智能学科诞生的达特茅斯会议上介绍这项工作.

萨缪尔发明了“机器学习”这个词,将其定义为“不显式编程地赋予计算机能力的研究领域”.

他的文章“Some studies in machine learning using the game of checkers”1959年在IBM Journal正式发表后,爱德华●费根鲍姆(Edward Feigenbaum,“知识工程之父”, 1994年图灵奖得主)为编写其巨著Computers and Thought,在1961年邀请萨缪尔提供一个该程序最好的对弈实例.

于是,萨缪尔借机向康涅狄格州的跳棋冠军、当时全美排名第四的棋手发起了挑战,结果萨缪尔程序获胜,在当时引起轰动.

事实上,萨缪尔跳棋程序不仅在人工智能领域产生了重大影响,还影响到整个计算机科学的发展,早期计算机科学研究认为,计算机不可能完成事先没有显式编程好的任务,而萨缪尔跳棋程序否证了这个假设.另外,这个程序是最早在计算机上执行非数值计算任务的程序之一,其逻辑指令设计思想极大地影响了IBM计算机的指令集,并很快被其他计算机的设计者采用。

【我们软件工程的老师在哔哔的时候也提到过查找、查询、搜索、挖掘、大数据、机器学习、深度学习等其实都是一个问题,那就是在一个范围内寻找(答案),因为范围不同,所以给了不同的名字。】

…………

小故事: t检验、啤酒、“学生”与威廉●戈瑟特

1899年,由于爱尔兰都柏林的吉尼斯啤酒厂热衷于聘用剑桥、牛津的优秀毕业生,学化学的牛津毕业生威廉·戈瑟特(William Gosset, 1876 1937)到该厂就职,希望将他的生物化学知识用于啤酒生产过程.

为降低啤酒质量监控的成本,戈瑟特发明了t检验法,1908年在Biometrika发

表.为防止泄漏商业机密,戈瑟特发表文章时用了笔名“学生”,于是该方法被称为“学生氏t检验”(Student's t-test).

吉尼斯啤酒厂是一家很有远见的企业,为保持技术人员的高水准,该厂像高校一样给予技术人员“学术假”,1906--1907年戈瑟特得以到“统计学之父”卡尔·皮尔逊(Karl Pearson, 1857- 1936)教授在伦敦大学学院(University College London,简称UCL)的实验室访问学习.

因此,很难说t检验法是戈瑟特在啤酒厂还是在UCL访学期间提出的,但“学生”与戈瑟特之间的联系是被UCL的统计学家们发现的,尤其因为皮尔逊教授恰是Biometrika的主编.

【戈瑟特先生在皮尔逊先生那里学习,又在皮尔逊先生的杂志那里发表,皮尔逊先生肯定知根知底,之所以以‘学生’为笔名,大概就是说皮尔逊是戈瑟特的皮老师呗!顺便一说,那个吉尼斯啤酒厂在1954年开始出版《吉尼斯世界纪录大全》。是个很牛批的啤酒厂哦!】

…………

小故事:关于“最小二乘法”

1801年,意大利天文学家皮亚齐发现了1号小行星“谷神星”,但在跟踪观测了40天后,因谷神星转至太阳系的背后,皮亚齐失去了谷神星的位置.

许多天文学家试图重新找到谷神星,但都徒劳无获.这引起了伟大的德国数学家高斯(1777- 1855)的注意,他发明了一种方法,根据皮亚齐的观测数据计算出了谷神星的轨道,后来德国天文学家奥伯斯在高斯预言的时间和星空领域重新找到了谷神星.1809年,高斯在他的著作《天体运动论》中发表了这种方法,即最小二乘法.

1805年,在椭圆积分、数论和几何方面都有重大贡献的法国大数学家勒让德(1752 1833)发表了《计算彗星轨道的新方法》,其附录中描述了最小二乘法,勒让德是法国18--19世纪数学界的三驾马车之一,早已是法国科学院院士.但勒让德的书中没有涉及最小二乘法的误差分析,高斯1809年的著作中包括了这方面的内容,这对最小二乘法用于数理统计、乃至今天的机器学习有极为重要的意义,由于高斯的这一重大贡献,以及他声称自己1799年就已开始使用这个方法,因此很多人将最小二乘法的发明优先权归之为高斯.当时这两位大数学家发生了著名的优先权之争,此后有许多数学史家专门进行研究,但至今也没弄清到底是谁最先发明了最小二乘法.

【不管是谁先发明的最小二乘法,这两位先生都是数学界的大佬。不过我们可能对高斯更熟悉一些,毕竟他在书中出现的挺多,我是指数学书。】

…………

小故事:决策树与罗斯●昆兰

说起决策树学习,就必然要谈到澳大利亚计算机科学家罗斯·昆兰(J. Ross Quinlan, 1943 ).

最初的决策树算法是心理学家兼计算机科学家E. B.Hunt 1962年在研究人类的概念学习过程时提出的CLS(Concept Learning System),这个算法确立了决策树“分而治之”的学习策略.

罗斯·昆兰在Hunt的指导下于1968年在美国华盛顿大学获得计算机博士学位,然后到悉尼大学任教1978 年他在学术假时到斯坦福大学访问,选修了图灵的助手D. Michie开设的一门研究生课程.

课上有一个大作业,要求写程序来学习出完备正确的规则,以判断国际象棋残局中一方是否会在两步棋后被将死.昆兰写了一个类似于CLS的程序来完成作业,其中最重要的改进是引入了信息增益准则.后来他把这个工作整理出来在1979年发表,这就是ID3算法.

1986年Machine Learning 杂志创刊,昆兰应邀在创刊号上重新发表了ID3算法,掀起了决策树研究的热潮.短短几年间众多决策树算法问世,ID4、ID5等名字迅速被其他研究者提出的算法占用,昆兰只好将自己的ID3后继算法命名为C4.0,在此基础上进一步提出了著名的C4.5.有趣的是,昆兰自称C4.5仅是对C4.0做了些小改进,因此将它命名为“第4.5代分类器”,而将后续的商业化版本称为C5.0.

【C4.5在WEKA中的实现称为J4.8。别问我什么意思,俺也不知道,但是大佬们是真滴牛批。】

…………

小故事:神经网络的几起几落

二十世纪四十年代MP神经元模型、Hebb学习律出现后,五十年代出现了以感知机、Adaline为代表的一系列成果,这是神经网络发展的第一个高潮期.

不幸的是,MIT计算机科学研究的莫基人马文.闵斯基(MarvinMinsky, 1927 2016)与Seymour Papert在1969年出版了《感知机》一书,书中指出,单层神经网络无法解决非线性问题,而多层网络的训练算法尚看不到希望.

这个论断直接使神经网络研究进入了“冰河期”,美国和苏联均停止了对神经网络研究的资助,全球该领域研究人员纷纷转行,仅剩极少数人坚持下来。哈佛大学的Paul Werbos在1974年发明BP算法时,正值神经网络冰河期,因此未受到应有的重视.

1983年,加州理工学院的物理学家John Hopfield利用神经网络,在旅行商问题这个NP完全问题的求解上获得当时最好结果,引起了轰动.稍后,UCSD的David Rumelhart与James McClland领导的PDP小组出版了《并行分布处理:认知微结构的探索》一书,Rumelhart等人重新发明了BP算法,由于当时正处于Hopield带来的兴奋之中,BP算法迅速走红.这掀起了神经网络的第二次高潮。

二十世纪九十年代中期,随着统计学习理论和支持向量机的兴起,神经网络学习的理论性质不够清楚、试错性强、在使用中充斥大量“窍门”(trick)的弱点更为明显,于是神经网络研究又进入低谷,NIPS会议甚至多年不接受以神经网络为主题的论文.

2010年前后,随着计算能力的迅猛提升和大数据的涌现,神经网络研究在“深度学习”的名义下又重断崛起,先是在ImageNet 等若干竞赛上以大优势夺冠,此后谷歌、百度、脸书等公司纷纷投入巨资进行研发,神经网络迎来了第三次高潮。

【NIPS有点势利?算了,今天就到这里】

参考文献:

周志华.机器学习.北京:清华大学出版社

同类推荐
  • 亲爱的受益人

    亲爱的受益人

    多年初恋再次相遇,他就像是微光拯救桑十一于黑暗之中。却不知,原来这场相遇背后隐藏着设计,所谓的婚姻不过是为了获取利益。一开始,裘安生接近桑十一,只是为了那张高额保险单,可后来,他发现自己真的爱上了桑十一。当真相被揭穿,他是悬崖勒马迷途知返,还是一意孤行执迷不悟?
  • 大爷大娘

    大爷大娘

    国家在不断富强,人民在不断努力,各行各业的人在为中国贡献力量,这是人民的力量
  • 十年尘封有你

    十年尘封有你

    追寻青葱岁月,再现当时你我,华年恍如一梦,问君能忆几何
  • 枫落之后你依旧孤独

    枫落之后你依旧孤独

    她能否成为你的精神支柱,你又能否带给她想要的快乐
  • 我和我生命的延续

    我和我生命的延续

    二十岁的女孩梅花身患抑郁症,在走投无路绝望之际,由于平行时空的错乱漏洞,过去的自己梅小妹(不到十岁的梅花)和未来的自己梅姨(四十岁的梅花)同时出现在二十岁的梅花身边阻止她轻生。三位梅花从互相看不顺眼到彼此接纳一路陪伴,在梅姨的怂恿下梅花开始了复仇之路,包括对渣男前男友、盗取梅花作品的女主编、欺负梅花的研究生女同学和偏心的男导师,以及冷漠到只知道对梅花打骂要钱的父亲等人的报复,期间遇到了真心爱梅花的男人穆枫,到后来梅花逐渐意识到这样报复过后自己一点都不快乐,甚至很内疚,这种方式解决不了真正的问题。直到一次时空穿越事故,梅花意外的回到了梅小妹和梅姨刚出现的时刻,所有的一切竟然都重新来过,唯独爱人穆枫突然消失在这个时空。这次的重新来过让梅花阻止了梅姨的一次次报复行动,梅花彻底放下了对所有人的成见,并和身边所有伤害过她的人都和解了,梅花看到了每个人背后的故事,同时也看到了梅姨孤独中年心生怨恨的遭遇,也看到了梅小妹对童年心理阴影的恐惧,梅花渐渐明白梅姨和梅小妹出现在自己身边的原因都是源于自己内心对过去和未来的心结。
热门推荐
  • 神魔入侵战

    神魔入侵战

    一个因为科技发在给人类带来变化的时代,科技开启了通往另一个世界的大门,但带来的并不是富饶的世界,而是一个因为神秘交战而毁灭的世界,人类需要在连个种族之间存活,依靠的是另外一个世界的科技,以及其他世界的残骸。(本书世界观平行世界,与现实无关,如有雷同,我是不是可以说是巧合?)
  • 草鞋上的三国

    草鞋上的三国

    三国争霸,始于足下。穿越三国成了刘备,还没来得及作弊改善生活,就发现自己错过了桃园三结义!难道只能靠卖草鞋发家致富了吗?好不容易重新结拜,却只能给张飞这莽汉当三弟,有燕人翼德这么样一个老大,团灭指日可待啊!生活就是这样,充满了意外,可就算没有系统,没有金手指,我们也要坚强面对啊!就这么决定了,用草鞋逆袭三国!
  • 权门贵嫁

    权门贵嫁

    朱元一朝重生,从百病缠身郁郁而终的变成了未嫁的少女。如何从烂饭粒蚊子血变成朱砂痣白月光,这条路任重道远。好在她有一身医术护体。可是号称包治百病之后,她发现事情渐渐有些不对了----某人挑眉问她:“我的相思病什么时候帮我治?”-----老书《名门闺战》《春闺密事》已完结,欢迎大家开宰
  • 爱你之心藏不住

    爱你之心藏不住

    日久会生情,从十五岁开始,季苏林就发现一件事,自己喜欢淮安。?可喜欢又能够怎么办呢??人家又不喜欢自己。?于是季苏林便学会了默默付出。?默默成长,默默喜欢已经成为了季苏林的常态。?俱乐部刚刚成立的时候,季苏林对淮安说:“愿你最后还是我。”?表面上的季苏林是季不羁,淮安面前的季苏林是季温柔,她把淮安照顾的很好。?众人周知淮安喜欢贺晗凡,却不知季苏林爱淮安极深,不敢说出口,只好默默承受。?在淮安被欺负时第一个冲向前,在淮安被黑的时候第一个支持她,在淮安哭的时候在旁边安慰……?当偷偷不再偷偷,当光明来临,一切等待都是值得的。?在世界电子竞技大赛上,LA战队勇夺冠军,奖杯当做鲜花,季苏林终于抱得美人归。?爱一个人就是要对她倾尽所有,我不会给你产生烦恼,但我也不会因此而放弃你。男主有原型是参照阿水不过是打吃鸡的还有那些比赛都是有参照的会在作者有话说里一一列出
  • 守得云开见初月

    守得云开见初月

    安玥,前朝遗孤,从小被送至幽瞑山拜师学艺,然而却错付真心,惹来杀身之祸。重活一世,她已不顾儿女情长,一心只想复国,可身旁总有人无时无刻粘着她。言初,北越四皇子,一场和亲让二人相遇。言初:“娘子,你的重生只为遇到我。”安玥白他一眼:“我生君未生,你怎可确定会遇到我?”言初轻声说:“轮回几世只为寻你。”或许,这就是命中注定。
  • 从洪荒到蛮荒开始发育

    从洪荒到蛮荒开始发育

    在盘古大神开辟的无限多维宇宙洪荒之中,重生之后的主角,成为了一名最顶级的先天水神,可在他出世之后,遭到了佛门菩萨级高手对于自己的追杀。在借助了自己的半生至宝“幻界万水宝录”的帮助下重伤逃遁,撕开宇宙晶壁进入了混沌虚空之中。逃脱后的主角来到了蛮荒世界之中,开始了自己的发育之旅。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 以梦为马的少年

    以梦为马的少年

    从那时起,年轻轻轻的他第一次体会到一个道理:只要坚持去做自己想做的事,就一定会做成功!然而他拍的第一部影片票房惨淡,他也差点因此而破产。让人意想不到的是,在6个月之后,他的电影在东京电影节获得了最佳导演提名,虽然仅仅是提名,但这已经充分肯定了他的努力。刹那间,他的眼泪夺眶而出。
  • 大脚板鸭子

    大脚板鸭子

    《大脚板鸭子》是著名儿童文学作家冰波的作品集,本书收录了冰波童话21篇。大脚板鸭子因为大脚板而四处惹祸,因此十分烦恼。大脚板鸭子因帮助别人做好事,而小有名气,许多动物都来找大脚板鸭子帮忙。一个偶然的机会,大脚板鸭子参加了表演团,成为精彩的表演员,四处表演,大脚板鸭子觉得太累了,准备回到家乡,过平静幸福的生活,回家途中还救了因追蝴蝶而坠落悬崖的小鸡。其中,《孤独的小螃蟹》入选部编小学语文课本教材二年级上册。讲的是小螃蟹和小青蟹的故事,小青蟹出走了,小螃蟹因为救跌落的乌龟而失去一只大钳子。一天,小螃蟹做了一个开火车的梦,梦见自己开着火车去见小青蟹。小青蟹还会回来吗?小螃蟹能开上火车吗?
  • 赛车少女遇上冷医生

    赛车少女遇上冷医生

    当赛车少女遇上“心机”医生,会发生什么火花呢?在父母威逼之下,一夜之间,竟然和他……共处一室。。。