大数据世界,第 1 部分:定义

Read this post in other languages:
English, 한국어

本文是有关大数据的系列博文中的第一部分。 我们希望借助本文向您介绍 JetBrains 如何看待大数据,进而使您了解我们如何为其创建产品.

目录:

大数据世界可能看似高深莫测,被各种难懂的词汇蒙上了一层神秘的面纱。 是时候解开面纱并看清大数据的真实面目了。

什么是大数据?

正如有时会被过度夸大的每个术语一样,“大数据”一词已因含义过于广泛而变得晦涩难懂。 我将使用我认为最准确的三项定义予以解释:

超出节点内存容量的数据

这取决于每个硬件,因此我们无法对何谓“大数据”定义一项通用的静态值。 仍记得我那古老的 Intel 80386 CPU – 它只有 16 MB 内存,意味着任何超过 8 MB 的数据都可以被归类为“大数据”。

100 MB 的数据就当下而言可谓甚小,但在过去却算得上巨大,并且需要复杂的算法进行处理。

如今,大数据的大小呈绝对大幅上升趋势发展,但仍需要复杂的处理方法、分布式计算和特殊的存储格式。

在 3V 层面上扩展数据

3V 是指数据量 (Volume)、处理速度 (Velocity) 和多样性 (Variety)。 在 3V 层面上扩展是指,当数据量、处理速度或多样性提高诸如十倍时,您不必重新构造存储、作业和流程。

很难说“十倍”在多样性层面而言意味着什么,但是数据在形式和速度方面往往会频繁且迅速地发生变化。

您可能已经猜到了,这种定义主要是由软件决定的。

做出可靠商业决策所需的充足数据

不要忘记,数据无论大小,都是推动商业发展的首要元素。 考虑到这一点,以商业应用角度定义“大数据”将非常实用。

成功的企业往往是由数据驱动的,并且通常专注于提升业务的可靠性、可预测性和一致性。 但要达成这些目标,诸如中世纪商人所掌握的数据量将远远达不到现代企业所需的数据量需求。 如果没有庞大的数据量,就无法实现以用户为中心、为每个人提供个性化服务的现代商业模式。

例如,大多数大型电子商务公司都掌握了以市场营销为基础获得的巨大点击流(用户生成的事件流),这种数据可供预测哪些商品将比其他商品更受欢迎。

用户

既然我们了解了什么是“大数据”,那么让我们尝试弄清楚谁是数据使用者。

内部使用者主要分为三类:

  1. 管理层
  2. 市场营销
  3. 分析师

管理层需要通过报告来了解公司状况、改进现有计划以及创建新计划。

产品经理希望通过实验来改进其产品,并需要数据来分析实验结果并提出新的想法。

市场营销部门需要数据来分析诸如 COA(采购成本)、LTV(生命周期总价值)等市场营销指标。 他们还需要数据来建立成功的营销公司。

结论

以上内容就是我们对于什么是大数据以及谁是大数据所生成结果的使用者的理解。

在 JetBrains,我们针对大数据的主要项目包括:

在下一篇博文中,我们将定义哪些类型的专业人员会使用数据,以及他们需要具备哪些资格。

如果您想阅读更多类似的博文,请不要忘记订阅我们的博客。 请在此处评论区或在我们的微博、微信上与我们分享您的想法。

Discover more