最新大数据心得心得体会 大数据心得体会大全【优秀8篇】

网友 分享 时间:

大数据技术为决策提供了强有力的支持,通过分析海量信息,揭示潜在趋势与规律,推动各行业的创新与发展,提升了效率与精准度。下面是阿拉网友收集整理的最新大数据心得心得体会 大数据心得体会大全【优秀8篇】优秀范例,欢迎阅读参考,喜欢就支持吧!

大数据心得心得体会【第一篇】

大数据在当今社会中的重要性日益凸显,作为一名从事招商工作多年的人,我深切体会到大数据在招商过程中的价值和作用。通过对大数据的分析和应用,招商工作变得更加精准、高效,提高了招商成功率。以下是我在招商工作中获得的一些心得和体会。

首先,大数据对招商的市场分析提供了强大的支持。在过去,我们通常通过一些传统的方法和手段来了解市场。然而,这种方式往往是片面和局限的。而有了大数据的加入,我们可以通过分析大量的数据来获取丰富的市场信息。比如,我们可以通过大数据分析找到有潜力的目标客户群体,了解他们的消费偏好,从而确定营销策略和产品定位。这种市场分析的精确性和可靠性远远超过了以往的经验主义,极大地提高了招商的成功率。

其次,大数据在招商过程中的目标定位上起到了至关重要的作用。在招商过程中,确定目标客户是非常重要的。通过大数据的分析,我们可以更好地了解目标客户的需求和喜好,从而有针对性地制定招商策略。例如,通过分析大数据我们可以得知,某地区的人口结构以年轻人为主,那么我们可以通过开设年轻人喜爱的餐厅或咖啡厅等业态来满足他们的需求。这样的目标定位方式更加具有针对性和效果,能够更好地满足市场需求,提供更好的招商机会。

此外,大数据在招商过程中的决策辅助上也发挥着非常重要的作用。招商工作中,往往需要面对各种各样的决策,如何做出最佳的决策对于招商的成功与否至关重要。在这方面,大数据的应用可以提供相关的数据支持和决策辅助。通过对大数据进行分析,我们可以了解市场的趋势和动向,可以对竞争对手进行分析和评估,也可以了解目标客户的需求和购买能力等。这些信息对于招商过程中的决策起到了重要的参考作用,可以帮助我们做出更加明智、准确的决策,提高招商的成功率。

最后,大数据还在招商过程中的营销和推广方面提供了更多的可能性。通过对大数据的分析,我们能够了解目标客户的消费习惯和购买意愿,从而可以制定更加有针对性的营销策略和推广方案。比如,通过大数据分析我们发现,某产品在特定的时间段或特定的地点容易受到目标客户的关注,在这个时间段或地点开展针对性的营销活动,将会取得更好的宣传效果和销售效果。而且,大数据的分析还可以帮助我们预测目标客户的需求和购买趋势,提前做好市场准备,满足和引导目标客户的消费需求。

总之,大数据对招商工作的价值和作用不可忽视。通过对大数据的分析和应用,招商工作变得更加精准、高效,提高了招商成功率。大数据为招商工作提供了强大的市场分析、目标定位、决策辅助和营销推广的支持,帮助我们更好地了解市场、满足客户需求,取得招商的成功。在未来的招商工作中,我们应该进一步深化对大数据的应用和理解,不断优化招商策略和方法,以更好地推动经济发展和市场繁荣。

大数据心得心得体会【第二篇】

大数据作为数据时代的产物正在深刻地影响着我们的生活和工作。无论是政府机构还是企业组织,都希望通过有效的大数据处理和分析,来提高决策效率和精度。而对于个人来说,大数据也能为我们提供更加便捷的服务和更加智能的生活方式。因此,如何正确地运用大数据,已经成为我们必须思考和解决的问题。在此背景下,我参加了一场以大数据为主题的考察活动,从中汲取了不少收获和启示。

第二段:考察活动的详细内容。

考察活动主要分为两个部分:一是利用大数据分析工具对现有的数据进行处理和分析,另一个部分是参观了几家大数据相关企业。在数据处理和分析环节,我们使用了常见的大数据分析工具,通过对一组数据进行分析,得出了该组数据的相关统计结果以及趋势预测;而在企业参观环节,我们了解了企业在大数据方面的应用案例以及技术上的一些创新和突破。

第三段:学到的知识和技能。

在参加这次考察活动中,我学到了不少有关大数据处理和分析的知识和技能。其中,大数据分析工具的使用是最直接和实用的。通过对数据的处理和分析,我们可以更加清晰地看到数据内部的规律和趋势,这为我们的决策提供了更加充分和准确的参考。另外,在企业参观中,我还了解到了很多关于如何将大数据技术应用于企业发展中的宝贵经验和建议。例如,如何在数据挖掘方面进行创新以及如何整合多种不同来源的数据,来获得更加全面和准确的信息等。

第四段:大数据应用的前景和挑战。

随着大数据技术的不断发展和普及,大数据的应用前景无疑是非常广阔的。例如,在医疗领域,通过大数据分析和挖掘,我们可以更加准确地诊断疾病以及预测疾病的发生可能性;在教育领域,大数据可以为学生提供个性化的教育服务和学习建议;在商业领域,大数据可以帮助企业精准定位需求和市场,从而提高产品和服务的质量,提升企业的竞争力。不过,大数据应用也面临着很多挑战,如数据隐私和安全、数据质量和可信性、数据治理和管理等问题,这些都需要我们不断地思考和解决。

第五段:结论。

通过这次大数据考察活动,我深刻认识到了大数据对我们生活和工作的重要性和影响。同时,我也了解到了如何运用大数据分析工具和将大数据应用到企业发展中的实际经验。总之,大数据的应用前景是无限的,我们应该积极拥抱并运用好这一技术,为我们的生产和生活创造更加美好的未来。

大数据心得心得体会【第三篇】

近年来,“大数据”这个概念突然火爆起来,成为业界人士舌尖上滚烫的话题。所谓“大数据”,是指数据规模巨大,大到难以用我们传统信息处理技术合理撷取、管理、处理、整理。“大数据”概念是“信息”概念的版,主要是对新媒体语境下信息爆炸情境的生动描述。

我们一直有这样的成见:信息是个好东西。对于人类社会而言,信息应该多多益善。这种想法是信息稀缺时代的产物。由于我们曾吃尽信息贫困和蒙昧的苦头,于是就拼命追逐信息、占有信息。我们甚至还固执地认为,占有的信息越多,就越好,越有力量。但是,在“大数据’时代,信息不再稀缺,这种成见就会受到冲击。信息的失速繁衍造成信息的严重过剩。当超载的信息逼近人们所能承受的极限值时,就会成为一种负担,我们会不堪重负。

信息的超速繁殖源自于信息技术的升级换代。以互联网为代表的新媒体技术打开了信息所罗门的瓶子,数字化的信息失速狂奔,使人类主宰信息的能力远远落在后面。美国互联网数据中心指出,互联网上的数据每两年翻一番,目前世界上的90%以上数据是近几年才产生的。,数字存储信息占全球数据量的四分之一,另外四分之三的信息都存储在报纸、胶片、黑胶唱片和盒式磁带这类媒介上。,只有7%是存储在报纸、书籍、图片等媒介上的模拟数据,其余都是数字数据。到,世界上存储的数据中,数字数据超过98%。面对数字数据的大量扩容,我们只能望洋兴叹。

“大数据”时代对人类社会的影响是全方位的。这种影响究竟有多大,我们现在还无法预料。哈佛大学定量社会学研究所主任盖瑞·金则以“一场革命”来形容大数据技术给学术、商业和政府管理等带来的变化,认为“大数据”时代会引爆一场“哥白尼式革命”:它改变的不仅仅是信息生产力,更是信息生产关系;不仅是知识生产和传播的内容,更是其生产与传播方式。

我们此前的知识生产是印刷时代的产物。它是15世纪古登堡时代的延续。印刷革命引爆了人类社会知识生产与传播的“哥白尼式革命”,它使得知识的生产和传播突破了精英、贵族的垄断,开启了知识传播的大众时代,同时,也确立了“机械复制时代”的知识生产与传播方式。与印刷时代相比,互联网新媒体开启的“大数据”时代,则是一场更为深广的革命。在“大数据”时代,信息的生产与传播往往是呈几何级数式增长、病毒式传播。以互联网为代表的媒介技术颠覆了印刷时代的知识生产与传播方式。新媒体遍地开花,打破了传统知识主体对知识生产与传播的垄断。新媒体技术改写了静态、单向、线性的知识生产格局,改变了自上而下的知识传播模式,将知识的生产与传播抛入空前的不确定之中。在“大数据”时代,我们的知识生产若再固守印刷时代的知识生产理念,沿袭此前的知识生产方式,就会被远远地甩在时代后面。

(节选自《文汇读书周报》,有删改)。

大数据心得心得体会【第四篇】

描述小组在完成平台安装时候遇到的问题以及如何解决这些问题的,要求截图加文字描述。

问题一:在决定选择网站绑定时,当时未找到网站绑定的地方。解决办法:之后小组讨论后,最终找到网站绑定的地方,点击后解决了这个问题。

问题二:当时未找到tcp/ip属性这一栏。

解决办法:当时未找到tcp/ip属性这一栏,通过老师的帮助和指导,顺利的点击找到了该属性途径,启用了这一属性,完成了这一步的安装步骤。

问题三:在数据库这一栏中,当时未找到“foodmartsaledw”这个文件。

问题四:在此处的sqlserver的导入和导出向导,这个过程非常的长。

解决办法:在此处的sqlserver的导入和导出向导,这个过程非常的长,当时一直延迟到了下课的时间,小组成员经讨论,怀疑是否是电脑不兼容或其他问题,后来经问老师,老师说此处的加载这样长的时间是正常的,直到下课后,我们将电脑一直开着到寝室直到软件安装完为止。

问题五:问题二:.不知道维度等概念,不知道怎么设置表间关系的数据源。关系方向不对。

解决办法:百度维度概念,设置好维度表和事实表之间的关系,关系有时候是反的——点击反向,最后成功得到设置好表间关系后的数据源视图。(如图所示)。

这个大图当时完全不知道怎么做,后来问的老师,老师边讲边帮我们操作完成的。

问题六:由于发生以下连接问题,无法将项目部署到“localhost”服务器:无法建立连接。请确保该服务器正在运行。若要验证或更新目标服务器的名称,请在解决方案资源管理器中右键单击相应的项目、选择“项目属性”、单击“部署”选项卡,然后输入服务器的名称。”因为我在配置数据源的时候就无法识别“localhost”,所以我就打开数据库属性页面:图1-图2图一:

图二:

解决办法:解决办法:图2步骤1:从图1到图2后,将目标下的“服务器”成自己的sqlserver服务器名称行sqlservermanagementstudio可以)步骤2:点确定后,选择“处理”,就可以成功部署了。

问题七:无法登陆界面如图:

解决方法:尝试了其他用户登陆,就好了。

(1)在几周的学习中,通过老师课堂上耐心细致的讲解,耐心的指导我们如何一步一步的安装软件,以及老师那些简单清晰明了的课件,是我了解了sql的基础知识,学会了如何创建数据库,以及一些基本的数据应用。陌生到熟悉的过程,从中经历了也体会到了很多感受,面临不同的知识组织,我们也遇到不同困难。

理大数据的规模。大数据进修学习内容模板:

linux安装,文件系统,系统性能分析hadoop学习原理。

大数据飞速发展时代,做一个合格的大数据开发工程师,只有不断完善自己,不断提高自己技术水平,这是一门神奇的课程。

2、在学习sql的过程中,让我们明白了原来自己的电脑可以成为一个数据库,也可以做很多意想不到的事。以及在学习的过程中让我的动手能力增强了,也让我更加懂得了原来电脑的世界是如此的博大精深,如此的神秘。通过这次的学习锻炼了我们的动手能力,上网查阅的能力。改善了我只会用电脑上网的尴尬处境,是电脑的用处更大。让我们的小组更加的团结,每个人对自己的分工更加的明确,也锻炼了我们的团结协作,互帮互助的能力。

3、如果再有机会进行平台搭建,会比这一次的安装更加顺手。而在导入数据库和报表等方面也可以避免再犯相同的错误,在安装lls时可以做的更好。相信报表分析也会做的更加简单明了有条理。

总结。

大数据时代是信息化社会发展必然趋势在大学的最后一学期里学习了这门课程是我们受益匪浅。让我们知道了大数据大量的存在于现代社会生活中随着新兴技术的发展与互联网底层技术的革新数据正在呈指数级增长所有数据的产生形式都是数字化。如何收集、管理和分析海量数据对于企业从事的一切商业活动都显得尤为重要。

大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代的发展才能在以后的工作生活中中获得更多的知识和经验。

三、

结语。

大数据心得心得体会【第五篇】

随着大数据时代的到来,大数据分析技术在各行各业都得以广泛应用。为了适应这个时代的需求,我产生了对大数据的浓厚兴趣,并决定投身于大数据学习之中。在大数据求学的过程中,我积累了丰富的知识和经验,并且获得了一些宝贵的心得体会。在此,我将分享我对大数据学习的理解和心得,希望能够对其他有兴趣于此领域的人有所帮助。

首先,我意识到大数据学习是一个全新的挑战和机遇。在学习过程中,我发现这个领域涉及的知识非常广泛,包括数据收集、处理、存储、分析等方方面面。考虑到大数据的规模和复杂性,我意识到单一的学科知识是不足以应对的。因此,我要不断地扩展自己的知识面,并且理解不同学科之间的联系和相互作用。通过不断地学习和实践,我发现大数据学习不仅需要应用数学、计算机科学等学科的知识,还需要具备良好的跨学科能力和创新思维。

其次,我学会了如何从大数据中发现有价值的信息。大数据时代,数据的规模和速度都呈爆炸式增长,但真正有价值的信息往往隐藏在大数据背后。在学习大数据分析的过程中,我学会了如何通过使用不同的数据分析工具和技术,从大数据中发现有意义的模式和规律。例如,通过数据挖掘技术,我可以从海量数据中找出隐藏的关联关系;通过机器学习算法,我可以构建预测模型,提供高精度的预测和决策支持。这些技术和工具不仅可以帮助企业发现新的商机,还可以为决策者提供科学依据,帮助其做出更准确的决策。

第三,在大数据学习的过程中,我认识到数据安全和隐私保护的重要性。大数据的快速发展和广泛应用给个人隐私带来了新的挑战。在大数据分析中,我们往往需要使用大量的个人数据来训练和验证模型。但如果这些数据不得体地被使用或泄露,将会对个人隐私造成严重的威胁。因此,我们必须始终牢记数据安全和隐私保护的原则,采取相应的技术和措施来保护个人数据的安全。同时,我们还要加强对数据使用的监管和规范,以确保数据在使用过程中得到合法和合理的处理。

第四,我发现学习大数据的过程是一个与他人合作和交流的过程。在大数据分析中,我们往往需要利用不同来源的数据、不同领域的知识和不同背景的专业人士进行合作。通过与他人的合作和交流,我们可以更好地理解和解决问题,同时也能够不断提高自己的能力和水平。因此,我们要具备良好的团队合作和沟通能力,能够与他人有效地合作、共同完成项目和达成目标。同时,我们还要学会倾听和尊重他人的意见和观点,尊重团队中每个成员的贡献,共同实现团队的目标。

最后,我深刻认识到学习大数据是一个持续不断的过程。在大数据领域,技术和知识的更新速度非常快,新的技术和工具不断涌现。因此,我们必须不断地学习和更新自己的知识和技能,跟上时代的步伐。除了不断地学习新的知识和技术,我们还需要关注行业的最新发展动态,了解市场的需求和趋势。只有不断学习和持续进步,才能在激烈的竞争中立于不败之地,并为未来的发展奠定良好的基础。

总之,大数据求学的过程是一次又一次的学习与挑战,我从中收获了很多宝贵的经验和体会。大数据学习需要我们不断地学习和实践,具备跨学科能力和创新思维,发现有价值的信息,关注数据安全和隐私保护,以及与他人合作和交流。在学习大数据的过程中,我们应该坚持学习的原则,不断提高自己的能力和水平,为未来的发展做好准备。只有如此,才能不断适应大数据时代的需求,为社会和企业提供更优质的数据分析服务。

大数据心得心得体会【第六篇】

这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。

《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。

下面来重点介绍《大数据时代》这本书的主要内容。

《大数据时代》开篇就讲了google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了20xx年美国的h1n1的爆发地与传播方向以及可能的潜在患者的事情。google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时google的预测与政府数据的相关性高达97%,这也就意味着google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。

接下来,维克多又通过了ibm追求高精确性的电脑翻译计划的失败与google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。

之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。

无论如何,大数据时代将会到来,不管我们接受还是不接受!

我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。

我喜欢这本书是因为它给我展现了一个新的世界。

大数据心得心得体会【第七篇】

读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。

“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。

近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。

当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!

《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。

可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!更何况还有两个更可怕的事情。

其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。

还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。

所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。

大数据心得心得体会【第八篇】

如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。

一读。

舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。

我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。“大数据的简单算法比小数据的复杂算法更有效。”更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。

世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出“不是因果关系,而是相关关系。”这一论断时,他在书中还说道:“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。

大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可“量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节“掌控”中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。

再读。

概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4v特点:数量(volume)、速度(velocity)、品种(variety)和真实性(veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”[ii]其实,概念的界定要看研究者从哪个角度来研究它而定。

科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”[iii]舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里谈到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”[iv]用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。

问题是研究的价值基点,“大数据”不是舍恩伯格研究的问题,而是研究对象,他研究的是数据处理和信息管理问题,同时也讨论信息安全和网络伦理问题,还引发哲学上的思考,哲学史上争论不休的世界可知论和不可知论转变为实证科学中的具体问题。可知性是绝对的,不可知性是相对的。“大数据”之所以为大是因它引发人类生活、工作和思维的大变革,从这个意义上来看,《大数据时代》的意义不仅在于它讨论了若干重大问题,而且对研究者开出了一个问题清单,从而引发更多人来探讨这些有趣的问题。

《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。换言之,《大数据时代》并不是一本讨论大数据所有问题的书。

《大数据时代》也是一本讨论互联网发展的书,从数字化到数据化,同时有浓厚的未来学色彩。当文字变成数据,我们进入了互联网;当方位变成数据,我们进入了物联网;当沟通变成数据,我们进入了下一代互联网。一切可量化,万物皆数据,正是当今互联网世界的真实写照。面对于这样的世界及世界的未来,在《大数据时代》出现最多的词是“思维”和“方法”,因此也可以把这本书视为思维科学应用研究的书。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。

三读。

今年国庆节前一天,中共中央政治局们来到中关村搞集体学习,调研、讲解、讨论创新驱动发展战略。包括、在内的七位全部出动来到中关村,这是历史上没有过的,百度、联想和小米的负责人,有了一次直面最高层汇报工作的机会。雷军和柳传志,讲解的都是本公司的各种情况,李彦宏则没有讲百度的广告业务发展得如何好,而是讲起了大数据。在讲解中,李彦宏认为大数据有两个重要价值,一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。这些价值也是目前党和国家领导人最为重视的,可见《大数据时代》既有理论价值也有现实意义。

当今大数据正在影响着新闻传媒业,大数据新闻、大数据营销、舆情分析、受众(用户)研究……数据分析师变身新闻编辑,大数据正改变新闻生产流程、大数据在创造传媒新业态。“不妨想象一下,随着数据的进一步增加,坐拥用户资源的新媒体们完全有能力通过数据挖掘,分析用户癖好,向电视台定制一部电视剧甚至向好莱坞定制一部电影。到那个时候,电视台一如那些家电厂商们,曾经产业链的上游‘王者’,将彻底成为一个产业链最低端的内容代工厂。”[v]然而,情形也远没有人们想象的那么乐观,李彦宏指出目前多数所谓的大数据公司其实还是空壳子,因为数据还没有完全开放。他认为必须在政府层面上推动才能真正实现大数据的开发与利用。我在讨论大数据时代的舆情监测与预警时说道:“经典自由主义传播学说对媒体的定位:秉持公正、客观立场的媒体被称为代表公众监督政府行为的‘看门狗’。其实,媒体既是公众利益也是国家利益的‘看门狗’。要看好门就要瞭望、洞察社情民意,传统媒体信息反馈渠道单一,视野、人力十分有限。而开放互动的新媒体平台却大有可为。作为公共信息发布平台的微博可以成为政府及时了解社情民意,从而选择正确治理路径的‘导盲犬’。”[vi]遗憾的是目前我国的数据平台还没有完全开放,真正的大数据时代还没有到来。

与国内不少教科书写法的专著相比,国外的书写得更有趣,尤其是大学者写的,不仅视野开阔,而且能够深入浅出。《大数据时代》不到22万字,却有上百个学术和商业的实例,丰富翔实的例子让读者感到通俗易懂,深奥的理论看起来也不费劲。这恐怕与舍恩伯格既是学者也是专家,既有理论又有实践有关。反观我们些学者故弄玄虚而示高明,实际上是把读者拒之门外。我觉得优秀的科学家也应该是一个科普作家,优秀的学者也应该是一个不错的传播者。当然国外学术著作也有一个翻译问题,这本书译得还不错。此外,《大数据时代》还附有不少it界名流的推荐意见,虽是出版商的发行所为,对解读此书也不无益处。

除了《大数据时代》,舍恩伯格还有一本《删除》也值得一读。要研究大数据不能只读一本书,该书译者周涛教授还推荐了三部国内出版的大数据方面的专著:《证析》、《大数据》、《个性化:商业的未来》。相比《大数据时代》的宏大视野,这些书就大数据某一局部问题给出深刻的介绍和洞见。我也推荐读一读中国工程院李国杰院士和中科院计算所副总工程学旗合写的文章《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》。

虽说开卷有益,但是由于每个人的时间精力有限,对于一个研究者来说,不读什么书甚至比读什么书更重要。我认为书有三种:有用的书,主要是应用类的专业书;无用的书,主要是形而上的思想类;无字的书,人间百态,社会现实。可偏重但不应偏废。对于学生来讲这三类“书”都该读一些,对于研究者则要读哪些解决关键问题的书,《大数据时代》就是这样一部书。当然,并非第一个读者都是研究大数据的,但进入大数据时代,还有什么东西与数据完全没有关系呢?麦肯锡全球研究机构认为,未来十年里有12项对经济发展产生重大影响的技术,其中包括三项新媒体技术:移动互联网、物联网和云计算。这三项新媒体技术都与大数据密切相关,而这些新媒体新技术的发展都影响着当今的新闻传播业。阅读此书至少给我们研究新闻传播学带来一些启迪。我觉得一本书的价值不在于让你顶礼膜拜,而是引发广泛而深入的讨论。

“凡是过去,皆为序曲。”读完此书,我们对大数据的认识才刚刚开始。

39 3453632
");