我们的产品,并用他的名字为我们的搜索引擎命名。我想在他有生之年能作出一些成绩,让他看到我没有埋没他对我们的这份信任。” 宁子默向kaltix三人组添油加醋的将理查德·宾先生的故事讲了一番,一些偷梁换柱的东西也被他悄然加了进去。 这两年时间的历练,宁子默也逐渐学会如何去讲故事。只要不违背原则的情况下,为那些加入团队的未来拍档们去讲理想、讲未来、讲情怀几乎是必不可少的部分。 画饼听起来很虚无,但它在某些时刻却有着大用处。如果这个方法可以吸纳到高端人才,宁子默并不介意腹黑一些。 而且这条拐带大拿的路,宁子默决定一直走到黑了! “哇,酷~~~~~” kaltix三人组在宁子默铺开那位传奇老者的故事时,就听得很入神。 无论是他推崇自己的啤酒花, 还是和老师理查德·施特劳斯的不和, 还有最后他在心脏病领域的各种突破, 这些故事都让kaltix三人组眼中闪耀着一种叫做崇拜的东西。 顿了顿,宁子默才补充道,“这款搜索引擎叫做bing,如今它已经被开发完成,并使用爬虫对网络信息进行爬取。但是目前,我们的【bing】团队在搜索算法上碰到了问题。以至于我在搜索引擎的大数据划时代计划,碰到了阻碍。” “而这些阻碍,”将手指从自己转向kaltix三人,宁子默郑重道,“就是我托霍夫曼找到你们这些搜索专家的主要原因。” “大数据划时代计划?”赛普疑惑地沉吟着,末了他抬起头向宁子默问到,“听起来是一个很庞大的工程。” “是的,是一个很庞大的工程。因为目前对于不了解搜索价值的人而言,搜索引擎只是给人们带来结果的窗口。但真正去讨论搜索引擎的价值,最能体现他价值的地方一定是大数据划时代的搜索引擎时代。 想一想,曾经我们在进行数据分析与统计时仅仅局限于数据库,在数据库中对数据表进行统计分析。并且受数据量和计算能力的限制,我们只能对最重要的数据进行统计和分析。 搜索引擎跳出了这个限制,它可以成为存储着全世界几乎所有可访问的网页,数目可能超过万亿规模,全部存储起来大约需要数万块磁盘的大型数据库。 虽然这件事看起来峰语已经在做了,但峰语对于未来的规划,并没有我想象中那么清晰。 因为再往下发展下去,我想让bing可以把科技、文化、知识、资讯、新闻对应的文字、图片、视频等林林总总的东西进行统一存储管理,形成整个人类的大型数据库。 它记录人类文明过往的所有资料,为向未来的发展提供各种各样的支撑条件。把它打造成为人类的诺亚方舟那样,去造福全人类。 我可以简单举几个阶段性的例子,例如大数据的某一个先期阶段-大数据应用的数据仓库时代。 而bing可以跳出数据库的概念去进行sql操作,实现数据统计与分析。也就是说,人们将在bing上用更低廉的价格获得比以往多得多的数据存储与计算能力。 我们可以把运行日志、应用采集数据、数据库数据放到一起进行计算分析,获得以前无法得到的数据结果,而企业的数据仓库也随之呈指数级膨胀。 你们想想,在数据仓库时代只要有数据几乎就一定要进行统计分析。如果数据规模比较大,我们就会想到要用大数据技术。而技术的发展同时又促进了技术应用,这也为接下来大数据应用走进数据挖掘时代埋下伏笔。 而在大数据应用的数据挖掘时代必定凌驾于大数据应用的数据仓库时代基础之上。举个例子,很早以前商家就通过数据发现,买尿不湿的人通常也会买啤酒,于是精明的商家就把这两样商品放在一起,以促进销售。 啤酒和尿不湿的关系,你们可以有各种解读,但是如果不是通过数据挖掘,可能打破脑袋也想不出它们之间会有关系。 在商业环境中,如何解读这种关系并不重要,重要的是它们之间只要存在关联,就可以进行关联分析,最终目的是让用户尽可能看到想购买的商品。 除了商品和商品有关系,还可以利用人和人之间的关系推荐商品。如果两个人购买M.dD-NENG.coM