你的位置:高清免插件国产精品 > 精品福利 > >有多少公司做的是“伪数据分析”
热点资讯
精品福利

有多少公司做的是“伪数据分析”

发布日期:2021-10-25 18:08    点击次数:162

警惕“伪数据源”

第一个坑是我们在意识中还没有真正形成数据来自哪里的正确观念。我们可能认为数据很容易获得,或者只要我们愿意付钱,我们就可以获得数据。而一些黑技术、灰技术、工具和数据平台也在不断地倡导:有了我们,数据唾手可得!

但事实并非如此!而金钱和技术并不是获得真正有价值数据的充分条件。

多年后,我才体会到“无操作,无数据”的真谛。这并不是说所有的操作都需要数据(虽然你可以这样理解),而是恰恰相反,真正有价值的数据只有通过泥包和脚踏实地的操作才能获得。

想访问不同消费平台(微信、网站、app、小程序、CRM、电商)上的数据?没有技术可以直接帮你解决。你只能通过运营手段为技术准入创造条件——最起码你要让更多的消费者愿意注册登录,这不是光靠金钱和技术就能解决的。

想找出细分流量的来源?web端、app端、applet端都有成熟的技术解决方案,但问题是运营商还是需要手动标记,交给技术工具,让技术工具根据你的标记来抓取数据。虽然与技术有关,但必须由人来做。

想要得到用户细致入微的行为?依靠无埋点还是全埋点的方法?有风险。只有手动监控每个用户交互点的事件,并有真实的监控值,才能获得准确可靠的数据。这是一项不仅需要通过研究业务需求来完成的工作,还需要耐心和细心。事件监控和埋葬地点将在第2.6.4小节中详细介绍。

还有,人群的画像是机器自动给我们画的?没有细致的数据嵌入(事件监控)、煞费苦心地建立标签,没有基于实际业务情况的缜密规则,就不可能获得真实的用户画像。这样的人像数据不可能真的对手术有影响。

这并不是一项在工具上用漂亮的图形创建美妙的数据可视化的性感工作——尽管许多人认为这就是数据的工作方式。数据往往不起眼,仅仅收集数据就需要大量的时间、专业精神以及大量的技能和智慧。

注意数据和数据是不同的。

很多时候,看似属于你的数据可能会对你造成严重伤害。

数据有真有假,即使是真实的数据也大不相同,即使是你拥有的数据。数据之间的主要区别是质量、口径和背后的商业意义。

为了让这些具有不同形状和特征的数据真正对你有用,你必须进行数据清理。

数据清理是很少有服务提供商会主动提及并愿意收费的服务,因为这是一项极其耗时、耗费人力且“有风险”的工作。关键是客户数据背后的口径,以及这些数据背后的商业意义,是外部服务商短时间内无法理解的。

经历过的数据清理项目,至今记忆犹新。仅仅清理同一事物不同名称的重复数据就需要几天的时间。不是清理数据本身有多难,而是沟通不同名字背后发生的事情有多难。再加上看似相同的指标,可能含义不同,所以几乎要再检查一遍。还有,各种数据记录的随意性和不一致性,各系统间同名字段定义的不一致性,你看了真的要跺脚骂娘!其工作复杂、繁琐、无奈,其“脱发指数”在各类工作中名列前茅。

因此,我们可以看到,太多的数据系统架构和数据集成是在没有有效的数据清理的情况下完成的!

这时,数据本身,泥土和沙子,庇护邪恶的人和做法,和可靠性是骇人听闻的!这样的系统,表面上却设置了外包装,而不管包裹里面是什么样的灾难!

这样的数据和系统质量差是最好的结果,而不是被利用。如果真的用这些数据来做决策,会比没有数据就依赖经验更糟糕。

当我理解了数据岛,我意识到数据岛的存在是有原因的。这并不代表我觉得数据岛好,但如果不经过真实可靠的数据清理,你在各个系统中似乎有的数据就会被拿出来揉捏在一起,你会发现根本用不上,或者根本用不上,甚至不如过去的数据岛!

这是令人心碎的现实。所以我一直建议你不要一口吃掉一个大胖子。改进本地数据和应用非常非常困难。

因为中国企业少,又有“数据治理”的说法,只有“痛定思痛”后才会恍然大悟,代价是又增加了一个耗资巨大的未完成项目。

本文没有具体介绍数据治理,但我提醒各位读者,数据治理非常重要,网上有很多值得一读的数据治理资料。

概念不是最重要的,所以我们要小心错误的概念。

“伪数据主义者”的另一个特点是,他们痴迷于性感的概念,而忽略了朴实无华的规则和真实的分析。他们做了很多充满“性感”概念的鸡汤放在你面前,然后说,干了这碗汤,一切都会搞定!

要是这么简单就好了!

与其他技术、数据本身、数据应用方法不同,华丽的转身不要太多,花哨的概念也不要太多。但是,因为数据本身就透露着神秘感,所以更容易用点缀来包装。

一个很有意思的例子——用一个更有诗意更有魔力的名词“北极星指数”来表达核心指数,确实增添了不少遐想,看起来也是水到渠成,但仔细一想,它和关键指数或者核心指数的区别有多大呢?

比如,我们可以被性感的称谓“北极星指数”迷住,但我们没有看到任何可以作为规则的方法论——包装一个概念并不难,但撕开包装的方法论并真正落地是非常困难的。显然,一个关键指标只能在商业中产生,即使它不是数字世界的指标。业务是变化的、流动的,所以关键指标是随着业务的变化而变化的,这是我们要适应的必然的业务演进逻辑。至少,工具没有办法直接揭示更深层次的业务逻辑,尤其是从运营角度的逻辑。不,我不是否认“北极星指数”本身,但注意不要认为它是我们运营所追求的数据核心。

我很难判断成长是否应该像“黑客”一样追求犀利的效果。思维模式强调持续试用,流量和产品联合优化,更合理的用户运营模式,这些都是非常可取的。然而,增长不太可能通过一些简单的调整来实现,也不可能像真正的计算机黑客那样纯粹通过技术来实现。作为一个“老保守主义者”,我始终坚持,只有商业模式和产品可靠,在实际操作中两手沾满泥巴,才能创造真正的、可持续的增长。而且,随着流量红利的耗尽,产品本身比以往任何时候都更重要——或者换句话说,如今留给迷恋性感概念和标题的空越来越小,“能不能玩”是唯一的评价指标。

我想,在“数据主义者”创造了这么多抬高预期的高大上的东西之后,如果把这些预期拍在地下砸了,会不会把数据消费者和他们对数据的希望一起砸了,真的是得不偿失。

然后,在数据源层面,数据也被用作越来越高的皇帝的新衣。

比如,坚定地告诉你:“我们可以得到(或拥有)BAT【从业者对BAT比较熟悉,BAT代表百度、阿里、腾讯,但今天BAT团队可能需要扩充,还应该加上字节跳动、JD.COM、美团。不过,包括谁并不重要,关键是它指的是当今极其强势的寡头们的数据。”

嗯,确实可以得到BAT数据,但是几乎每一个做BAT相关投放的广告主都可以得到很多BAT数据,比如自己的广告展示点击量,阿里数据库里的数据,或者DMP给你生成的营销效果报告。

这个数据不是另一个数据,数据的概念和类型太多了。你从BAT得到了哪些具体数据?真的是淘宝用户设备ID吗【这里提到的设备ID是指手机等用户终端设备的硬件ID,用来识别每个个体用户。在2.4.1中将详细介绍。]以及他们的行为和交易数据?

什么,这些数据都有吗?但数据是以“包”的形式呈现的?什么尺寸的包?上亿,这么多?!而且可以用来做广告?还可以把阿里的数据放到腾讯?

这些话都是模棱两可的话。你可以说合理或者不可能,但当你真正购买这些数据时,你可能会发现它们根本没有被使用。尤其是在如今的媒体中,这堵墙被广泛美化,个人信息保护变得更加严格。

今天的数据生态与过去完全不同,用户的数据有太多的保质期。拥有外部数据和拥有新鲜数据是两个概念。今天的主题是,一方面,企业向内看,保持对自己用户/客户的实时数据捕捉;另一方面,他们通过应用外部数据或与外部数据连接来扩展其数据能力。

成本问题

无论是数据还是运营,钱都要花。储蓄没有错,但不应该过度。

您不能将SaaS的资金用于私有部署,也不能将标准套件的资金用于定制开发。所有你愿意做的承诺都是别有用心的。毕竟你想拿的所有优势都是偷偷标着价格的,甚至不是价格,而是价格,而且总是来得很快。

另外,不要指望供应商为你做所有的工作。即使付出很高的代价,也要明白有很多工作需要自己去做。毕竟数据是你自己的数据,数据背后的业务是你自己的业务。我之前说过,运营细节、需求分析、数据清理都不是供应商能完成的。不是他们不帮你,而是以你给定的代价,他们根本帮不了你。更重要的是,你永远是最了解情况的人。

所有前期想偷懒省事的人,后期都会给你不断的打雷闪电。

如果成本有限,就从小处着手,有所进步,有所落地。一个小小的混凝土建筑肯定比用纸壳建造的宫殿更可靠。

坚持正确的数据理念。

虽然大多数企业都认同数据是最有价值的资产之一,但请注意,除非我们能很好地利用数据,否则数据本身是没有意义的。有什么好用?机械地应用数据和模型不是一个好的用途;鼓吹概念,却故意忽略或矮化那些“不够性感”但真实可靠的工具和方法,不好用;强调技术和工具可以解决问题,特别是强调机器智能的力量却忽视了人在其中的作用,没有很好地利用它;数据只是一种愿景,不结合业务和场景去阅读数据并不是一个好的用途。

请注意“数据本身是有原罪的”,因为数据既不是答案,也不是结果,往往不代表真相。它可以被操纵、捏造、误读、曲解和粉饰。当我们怀着良好的意愿处理它时,很可能会得到相反的结果。因此,我们不能无条件地信任它。就像核能的发展一样,你必须首先相信它是一个“魔鬼”,然后才能把它变成一个“天使”。

数据是我们的工具(根本不是唯一的工具),是我们的手段,是我们要经历的过程,但它绝对不是结果,也绝对不是答案本身。数据不会让事情变得更容易,除非我们能真正理解如何与它相处,这比没有数据造成的情况还要糟糕。我们也应该警惕这样一个事实,数据已经成为一堆不断的垃圾,成为纸上的口号,成为掩盖现实的遮羞布。

要警惕在没有真正的业务理解和业务场景的情况下,让数据穿透附件的倾向,并为此建立一系列指标、工具和模型。比如,任何企业在一定时期内采用什么KPI来指导自己的经营方向,是绝对没有公式的。它绝不是某个工具用一个“醒目”的算法做出来的,也不能只靠数据本身的增减来判断,必须从业务需求中不断拆解业务与效率的对应关系才能实现。在这个过程中,数据不是主角,数据本身不会产生洞察。最终形成的KPI不是数据推演的结果,而是业务推演的结果。

数据总是会让我们变得更机械,缩小视野。因此,我们必须非常小心,更加努力地探索数据在真实业务环境和场景中的真正价值,以满足不断变化的业务。

企业数据成熟度模型。

任何企业的数据营销和运营背后,都有数据能力的支撑,数据运营能力实际上是三个层面共同作用、共同驱动的结果。

这三层分别是:组织层(从企业组织和文化的角度进行数据能力建设)、治理层(从资源管理和资产管理的角度进行数据能力建设)、应用层(从数据实际应用的角度进行数据能力建设)。

这三个层次中,组织层最基础,治理层最关键,应用层最有价值。

企业数据能力的三层结构。

下表显示了每个维度及其对应的七个级别的数据能力特征。现在你可能还不能完全理解这张表,里面有很多专有名词,里面的表达方式可能你还不熟悉。不过没关系,看完这本书,回头看这张表就能明白其中的意思了。

企业数据营销和运营成熟度。

企业数据运营能力的建设,从内部数据的简单整合开始。比如广告的效果需要衡量,这就不可避免地需要打开广告端和效果端的数据。

初步整合后,企业内部的数据容量很快就会遇到瓶颈。例如,为运营提供关键支持的更深层次的数据需求变得迫切,包括消费者行为分析、用户画像、转型优化等方面的数据。大多数企业无法自行获取这些数据,必须嵌入外部技术解决方案和工具。因此,将外部能力嵌入为4级标志着企业开始进入更高层次的数据成熟度。

在嵌入外部能力获取更多待驱动数据的同时,也将产生新的需求:企业需要在消费者(个人或群体)维度上,打通企业的内外部数据资源,为更细致、更深入的运营提供支撑。因此,企业需要进入更高的数据成熟度阶段,即与外部数据能力的全面内部集成和协作(第5级和第6级)。

最终,当企业拥有足够的高质量结构化数据,并具备处理和应用非结构化数据的能力时,企业将达到最具标志性的智能化阶段(Level 7)。

当然,企业互联网营销数据的成熟度模型,并不意味着所有企业都要爬上这棵“技术树”。根据不同的格式和企业目标,任何企业都可能停留在足以确保高效业务发展的水平。比如,只依赖单一数字渠道或数字触点的市场部门是存在的,在这种模式下可能处于或略高于3级,已经足够“舒服”了。同样,在受众广泛的快速消费品行业(如普通饮料),如果有些企业不“进取”,愿意停留在2级,短期内肯定不会“拖累”业务。事实上,虽然我们认为DMP和CDP是攀上这颗“技术树”更高位置的标志,但完全没有必要所有企业都采用它。

转自@鸟哥笔记。

上一篇:有多少从小玩到大的青梅竹马最后在一起了-
下一篇:有多少城市可以称为传销之都