网站建设>圈子>网络学堂>大数据时代 | 我们应该如何去创造一个“大数据”产品?

大数据时代 | 我们应该如何去创造一个“大数据”产品?

joymagic / 2015-09-22 / 深圳网站建设 / 技术分享

    如今,社交网站的流行,网购的普及以及各种传感器的广泛应用伴以数据储存成本的降低和分析处理的思想与算法发展,让我们产生了巨大的数据的同时更容易存储、分析和利用它们。这就是所谓的大数据时代。一款优秀的产品,必定是迎合时代潮流的。那么在“大数据时代“下,我们应该如何去创造一个”大数据“产品?如何采集并利用数据?以下五点是我在“大数据时代”下的产品思考。


    确定产品定位


    数据收集


    数据收集即自己去收集数据,成为数据拥有者,通过数据授权等方式利用数据。


    数据分析


    拥有出色的数据分析技术,从别人提供的数据那挖掘数据的价值。


    数据创新


    没有数据,也没有出色的技术。但是看到了数据之间的联系,预见到了数据存在的价值,成为这方面的先行者。


    转变产品思维


    很多时候,我们能获取约等于全局的数据量,但是我们很多时候还是用原先的数据处理方式。


    原先我们只能获取一部分数据,然后以这部分数据去估算。所以我们的数学模型对数据的精确性和随机性要求非常高,因为数据是这么的少,改变一点点就能带来结果上的巨大偏差。现在我们拥有了更多的数据,使用相对简单的算法,只需带入更多的数据就会拥有更精确的结果。


    数据不再是单一的,结构化的,而是混杂的。


    “小数据”时,我们会去给数据分类分级,去尽可能的结构化他们,我们能应付过来,但是如今,数据多种多样,很多时候你根本没有办法把他们分类分级。但我们可以利用这种混乱,比如给照片设定标签,开辟一个新的数据种类。 


    大数据时代推崇的是相关关系而不是因果关系。


    这也是大数据的核心:利用相关关系作出预测,而不去分析它的原因。我们只知道“是什么”,而不知道“为什么”。但是前者很明显更简单直接的解决了问题。但是这并不意味着“因果关系”不再重要,我们要抛弃它。比如沃尔玛通过数据分析发现,飓风来临的时候蛋挞销量特别好,那么我们就可以在飓风来临时,多做蛋挞并摆在显眼的位置以增加销量。但是我们并不知道为什么它们会相关。


    获取数据


    数字化同时数据化。


    数字化是数据化的基础,比如仅仅扫描一本书,让它能够在电子设备上阅读,这叫数字化。但是你还不能处理上面的文字,做一些分析,我们需要通过图片文字识别技术,来将扫描的书转化成可以提取分析的文本数据。只有数据化的数据才对我们的产品有价值。 

 

    从看似不可能的地方提取数据。


    因为数据存储成本的变低和数据价值的巨大,我们可以收集更多的数据存储起来以期日后能挖掘出价值。我们要开拓思维,从许多看似不可能的地方收集数据。比如,一家日本汽车服务商,创新的把传感器放到了汽车座椅上,经过记录与分析,我们可以判断司机的体型,习惯坐姿,受力等等数据,如果一个小偷坐上了汽车,传感器感受到了变化,就会让其输入启动密码以确认身份。


    提前设计扩展数据。


    数据在不断的再利用中才能发挥出其最大的价值,一开始就设计好数据的可扩展性能让这种再利用更容易,虽然这并不总是可能。谷歌街景车在收集信息之初,考虑到了自己未来的自动汽车计划。所以在采集的时候,记录下的街景和GPS定位信息将来不仅可以优化地图也能用于自动汽车的研发。

     

    利用数据废气。


    我们看看谷歌是怎么利用登录的验证码的:它将验证码变成一些常见的错误拼写单词,每次用户登录输入这些验证码的时候就要求其输入成正确的单词。这一举措让谷歌的拼写检查器得到了巨大的提高,而且还是免费的。


    数据利用


    直接利用:通过直接的方式利用。比如分区域统计你用户的身高,做成一张各省份平均身高表。


    数据再利用:利用之前的数据,往往能获取更多的信息。比如谷歌根据搜索记录分析,预测了各地流感发病情况,达到了相当高的准确率。


    数据重组:将不同领域的数据结合起来分析。比如将手机的使用情况和癌症发病率联系起来,丹麦的科学家发现两者之间并没有什么关系。


    开放数据:你的数据处理能力不强,那么可以选择公开或者授权数据,让别人用你的数据发掘出价值,并从中获益。


    法律与道德

产品对于用户数据的分析,难免会涉及到用户的隐私,数据利用的创新也会让数据涉及到用户未授权的用途,你没法去再征求所有用户同意。在法律不明确的情况下,我们利用这些数据去做些什么,会产生生什么样的后果,产品设计者必须要思考清楚,并负承担起相应的责任。