- 2017/3/8 9:42:37
- 类型:原创
- 来源:电脑报
- 报纸编辑:电脑报
- 作者:
ImageNet缔造者:拼命三郎李飞飞
李飞飞
创建ImageNet的斯坦福大学AI实验室主任李飞飞(Fei Fei Lee), 则是与深度学习密不可分的另一硅谷华人传奇。
李飞飞1976年出生于北京,16岁随父母去了美国。刚到美国日子非常艰难,父亲给别人修照相机,妈妈当收银员,而她一边上学一边去中国餐厅打工。在这样的情况下,自称拼命三郎的李飞飞考上普林斯顿大学物理系,获得全额奖学金。
1999年大学毕业后,她放弃华尔街10万美元年薪,选择去西藏研究藏医一年。然后,获得全新人生感悟的她,去了加州理工学院电子工程系读AI专业博士,
她进校时正是AI低潮期。母亲此时不幸中风还患上癌症,学习、科研与生活多副重担压在她身上。 “如果重新来一次,我不认为自己还能挺过来” 她事后对人这样说。
但是,华人女子李飞飞无比强大的内心支撑她度过艰难。然后,她创造了一项项学术奇迹。从加州理工学院到斯坦福大学,她发表超过100篇AI学术论文,33 岁获得了斯坦福大学终身教授职位,又成为该校著名的AI实验室主任。
真正使李飞飞名扬世界的,是她创建的ImageNet。我们在第三回已经看到,正是由于这个图像大数据平台,深度学习走向辉煌。
从2007年开始,ImageNet下载了近10亿张图片。这是一个无比庞大的数据集,要对这些数据进行标注,工作非常繁浩。李飞飞巧妙地在亚马逊网站土耳其机器人(Mechanical Turk)平台上,用互联网众包模式来标注这些图片。高峰期时,ImageNet是亚马逊土耳其机器人平台上最大雇主之一,来自167个国家的近5万人,用众包方式协同工作,筛选、排序、标注了近10亿张照片。
李飞飞回忆说,现在回头去看,用大数据来训练计算机算法的做法重要意义显而易见。在这段旅途中,她觉得自己非常孤独,研究经费方面也一直遇到麻烦。
2009年,ImageNet终于诞生了。这是有1500万张经过标注图片、含22000类物品的数据库,仅仅是猫,就有超过62000只、长相姿势各异的不同品种家猫和野猫。无论在质量上还是数量上,这都是一个规模空前的数据库。只有在互联网时代,深度学习这样的卓越创造,才能因大数据而升华。
大数据威力很快显示出来了,ImageNet大数据集开源,成为检验各种AI算法的最权威平台,也成为评价AI 科研机构和科技公司AI 实力的最好竞技场,自然成为全球科技界和媒体关注的焦点。
颇有意思的是,深度学习与ImageNet也互相成全,互为造星者。2012年的ImageNet图像识别竞赛中,让计算机学习1000万张图片,然后用15万张图片进行测试,检验各种算法的识别准确率(实际上是错误率),在这样的大数据竞赛环境中,深度学习大放异彩。最不跟风追求时尚的李飞飞,也成为世界闻名的硅谷科技明星。2016年11月,李飞飞加盟谷歌公司,负责谷歌云。这位总能面对挑战的女科学家,又走上自己的新旅程。
目睹大数据对深度学习成功的关键性作用,松尾丰这样感慨:如果互联网网页的出现能再提早15年,也许今天硅谷的王冠就应该戴在日本的头上。他仍然在为日本的五代机而惋惜,认为如果有互联网带来大数据这样的信息环境,五代机可能就成功了。这位日本专家的分析或许有偏颇,但也反映出大数据对于深度学习不可或缺。
好风凭借力,送我上青云。深度学习借助GPU和大数据两只有力的翅膀,直上云霄。
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sina.com 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号