2018 年数据科学调查结果

发布于 Lei

2018年数据科学调查结果

数据分析、机器学习和 AI 迅速普及,在科技新闻中越来越受到关注。

数据科学世界的现状如何,这个行业的发展如何?

数据科学家主要参与什么类型的活动?

使用了什么编程语言和工具?

为了回答这些问题和很多其他重要问题,去年春天 JetBrains 进行了一次数据科学调查,收集了1600多名来自美国、欧洲、日本和中国的数据科学家的回复。我们非常兴奋地与您分享我们的一些令人难以置信的发现,以及您可以用来得出自己结论的原始调查数据!

您是否知道 Python 现在已经是在数据分析师和工程师中最流行的语言?

 您是否还知道大多数人认为 Python 在未来5年中仍会是数据科学的主要编程语言?

在调查信息图中了解有关这些和其他见解的更多信息:

查看2018年数据科学调查结果

重要发现

  • 数据处理、数据可视化和基本统计是数据科学家参与的三大活动。

  • Python 是数据分析的主要编程语言,大多数用户不愿意迁移到其他语言。

  • 大多数受访者认为,Python 在未来5年内仍将名列前茅。
    为数7%的受访者是非专业数据科学家,他们希望在不久的将来采用 Kotlin。

  • 排名前三的数据工具是 Apache Spark、Apache Hadoop 和 Apache Hive。

  • Jupyter Notebook 是数据科学从业者的首选代码编辑工具,随后是 PyCharm 和 RStudio。

  • 在使用深度学习库的人中,近80%的人使用 TensorFlow。

  • 78%的受访者使用本地计算机进行计算。

  • AWS 是最受数据科学家欢迎的云服务供应商。

  • 81%的数据科学家为非 IT 行业分析数据。

  • 从完整报告中获得更多见解

调查方法

我们通过 Facebook、LinkedIn 和 Twitter 上的定向广告分发调查问卷。我们筛选掉对第一个问题的回答是“我不涉及数据分析”的受访者。

 我们从美国、日本和中国这三国的每个国家收集到400套完整有效的回复,并且用配额从欧洲国家另外获得了400个回复。

重要说明:因为该调查由 JetBrains 组织和推动,而且某些 JetBrains 用户也许更愿意参与,所以可能存在某些不可避免的偏见。

想挖掘原始调查数据从而得出自己的结论吗?

因为要避免使报告变得过于庞大,所以我们无法在其中包含所有可能的结果。如果您有任何问题未得到回答,请发送给我们,我们将为您挖掘数据寻找答案。

或者,如果您想自己深入研究数据,我们也会共享原始调查数据,任何人都可以借此得出自己的结论和其他发现。

如果您希望打印这些数据或将其作为文件阅读,我们也提供PDF版信息图。我们希望调查结果能帮助我们大家更深入地了解数据科学社区的现状,把握大局并且得到一些迫切问题的答案。

我们非常有兴趣了解您的发现!

请在微博或其他社交媒体上分享,提及 @JetBrains中国,并附上#datasciencesurvey 标签。我们也非常乐意接受与本次调查相关的任何建议和反馈,以便下次做得更好。

最后,我们想对参加本次调查的人士致以万分感谢!

JetBrains
The Drive to Develop