GoLand

The IDE for professional development in Go

下载

Tutorials

Go 语言在机器学习中有未来吗？

Sue

Read this post in other languages:

English
Français

本文由外部贡献者撰写。

Sooter Saalu

Sooter Saalu 是一位数据专家，在职业生涯中担任过数据分析师、数据科学家和数据工程师。他具有临床心理学教育背景，致力于为技术和非技术受众撰写引人入胜的数据故事。

GitHub

Go 是一种开源编程语言，最初由 Google 设计，用于优化系统级服务的构建和使用、在大型代码库上轻松工作，以及利用多核联网机器。 Go 于 2009 年推出，作为一种静态类型和编译型编程语言，深受 C 语言的影响，注重简单性、安全性和并发性。

Go 最主要用于创建大规模应用程序，例如 Docker 和 Kubernetes。此外，由于低延迟、高效的跨平台性能和易扩缩性，Go 被 Netflix、PayPal 和 Uber 等公司广泛使用。不过，尽管 Go 有很多优点，但它在机器学习 (ML) 中并不常用。

本文将探索在 ML 中积极使用 Go 所要面对的挑战，以及 Go 可以在 ML 领域立足的途径。

将 Go 用于机器学习的主要挑战

Go 是一种强大高效的编程语言，速度快、性能高，能够满足 AI 解决方案的 CPU 密集型、高计算量计算需求。它比 Python 更快，并具有易用、高效和并发等诸多优势，在某些情况下优于 ML 中使用的其他语言。

Go 有潜力创建稳健且可扩缩的 ML 应用，甚至性能也比某些竞品更为优越，但它在 ML 中仍然是一个被忽视的选择。 Go 在 ML 中的低采用率主要归因于它面临的一些重大挑战，而 ML 领域的旧编程语言已经解决了这些挑战。 Go 面临的挑战包括缺少高级库、没有 CUDA 的原生绑定，以及统计和呈现功能不够完善。

缺少高级库

作为一门相对较新的语言，相较于已经存在了数十年且拥有完善 ML 生态系统和库的其他语言，Go 的工具和库要少得多。因此，Go 可用于 ML 任务的高质量库和工具更少。

这意味着，想为 ML 使用 Go 的开发者必须花费更多时间构建自定义解决方案，或者与并非专为 Go 设计的现有库和框架集成。

多年来，Go 库已经获得多项显著改进：GoLearn 提供了 scikit-learn 样式的拟合与预测功能，以及测试拆分和交叉验证效用函数，GoMind 提供了神经网络功能，类似于 TensorFlow 的计算图计算 ML 学习库 Gorgonia 提供了缩放功能。

但总体而言，这些库的深度仍逊于以 Python 为中心并且经过了数十年发展的库。并且，在某些功能上，Go 也会体现出显著差距，例如自然语言处理 (NLP) 任务，特别是与 spaCy 和 NLTK 相比。

没有 CUDA 的原生绑定

统一计算设备架构 (CUDA) 是 NVIDIA 为图形处理单元 (GPU) 编程开发的并行计算平台和编程模型。它让开发者可以利用 NVIDIA GPU 的高性能计算能力加快各种应用，例如，ML、科学计算、图像和视频处理等。

以 GPU 的大规模并行性加快可并行化的计算是 CUDA 的主要优点。然而，Go 不像 Python 那样具有与 CUDA 的原生绑定。

要在 Go 代码中使用 CUDA，首先需要导入并利用 C 函数来创建 CUDA 绑定。公平地说，C 代码通过 cgo 命令嵌入 Go，从而可以创建调用 C 代码的 Go 软件包。但是，只有熟练掌握 C 语言才能依赖 C 代码和 cgo 进行高效的编码和调试。这会产生巨大的开销，同时也会产生特定于 C 语言的问题，例如内存安全情况和安全漏洞。

也有第三方代码软件包带有用于 CUDA 的 Go 绑定的效用函数，例如 cuda。

实验约束

从本质上讲，Go 并不特别适合实验。 Go 代码是一种编译型语言，会转化为可由 CPU 直接执行的机器码，而不是在运行时由运行时环境解释。这项特性有助于提高 Go 的速度和效率，但是，如果不先编译，就无法编写和执行 Go 代码。因此，相对于 Python 和 R 等解释型语言，在 Go 中相对难以尝试不同的想法和测试不同的问题解决办法。

Go 不像其他语言那样抽象自底层硬件。这对于需要低级优化或严格控制硬件资源的任务来说可能是一个优势，但也可能使 Go 代码更加冗长，需要更多的前期设置和配置，而 Python 在某些情况下相对而言更灵活、更易用。考虑到 scikit-learn 和 TensorFlow 等库和框架的深度，以及在一个软件包中为特征提取、聚类和降维等任务提供更简单解决方案的可用性，Go 并不是 ML 实验的最理想选择。

Go 这样的编译型语言通常是高性能任务的更优选，例如服务器端编程和实时应用程序优化。

数学和统计功能不足

如前所述，Go 缺乏 Python 等业界重量级选手的深度。它只有少量专注于统计、微积分和矩阵操作的专属库和软件包，不足以满足 ML 和人工智能开发的需求。

这不一定对所有人来说都是劣势，有些开发者乐于为 ML 算法或数学逻辑主动编写代码。不过，这也表示 Go 在相同数据操作、分析和预测算法上的易用性仍要低于 Python。

总体而言，Python、R 和 Julia 推出最早，在 ML 社区中地位稳固。 Go 要想成为可行的替代方案，还有很长一段路要走，特别是这些现有编程语言也在持续发展，使其 ML 和 AI 功能更优秀、更简单、更有效。

Go 中的高级库

Go 中的 Gonum、Gorgonia 和 GoLearn 等高级库为构建和训练神经网络、执行数值计算和其他 ML 任务提供了工具。

然而，它们的功能并不如 Python 库选项中的功能丰富。 TensorFlow、scikit-learn 和 spaCy 等 Python 库和框架是为满足 ML 开发者的需求而创建和迭代开发，在 ML 行业中很受欢迎。它们提供了适合自然语言处理、图像嵌入向量、神经网络和其他 ML 要素需要的功能。

相同的功能在 Go 中也可以实现，并且，得益于 Go 相比其他编程语言的优势（例如联网、并发和数据处理），它们可能会更强大、更高效。

不过，创建这些功能目前只能在 Go 社区中产生用处，因为 Go 在 ML 社区中并不像 Python 或 R 等语言那样流行。与更早的对应功能相比，其贡献者数量也存在巨大差距，导致库和工具的生态系统相对较小，使得寻找某些问题的既有解决方案更加困难。

情况是否正在发生变化？

Go 的人气越来越高，社区也在不断发展。目前，据 StackShare 统计，已有 2,751 家公司使用 Go，其中包括 Uber、Twitch、Shopify 和 Slack。此外，根据 2021 Stack Overflow 开发者调查，大约 9.55% 的开发者使用 Go，是第 14 位最流行的编程语言。

虽然这对 Go 社区来说是个好消息，但它并没有真正转化到 ML 领域。 Go 最出名的能力在于创建可扩缩服务器和大型软件系统、编写并发程序以及启动快速轻量级微服务。就连 Go 官方网站也没有将 ML 列为其典型用例。

这表明 Go 目前正在远离 ML 领域，也在 ML 社区中缺乏立足点。

未来用例

Go 在 ML 方面还没有值得注意的亮点。不过，考虑到语言的优势，与其将 Go 视为开发 ML 模型的语言，不如将其看作为 ML 模型服务的语言。

Go 可用于构建 ML 模型服务器，允许模型被其他应用程序或系统访问和使用。这对于在生产中部署 ML 模型或构建可供其他开发者或用户访问的 ML API 非常有用。它可用于构建 ML 应用，例如由 ML 驱动的推荐引擎或自然语言处理工具。它还可用于为这些类型的应用构建后端基础架构或面向用户的界面。

对于 Go 社区来说，创建更多工具包和框架来实现更快、更高效的服务器端 ML，可能会在 ML 领域为更多实验有效开放代码库。

结论

本文探索了 Go 在机器学习方面的潜在优势、目前阻碍 Go 在这一领域得到广泛使用的挑战、改进的途径，以及 Go 的潜在未来用例。

本博文英文原作者:

比较 database/sql、GORM、sqlx 和 sqlc

Discover more

本文由外部贡献者撰写。 Rexford A. Nyarko Rexford Nyarko 是一名解决方案架构师，具有软件与网络系统、云环境、服务器管理和多种数据库技术背景。 Rexford 特别喜欢向非技术人员解释技术概念。 LinkedIn Twitter Go 以其简单易用、性能和完整的标准库而闻名。 Go 的库开箱即支持大量常见操作，许多其他语言需要第三方库来执行或根本不支持。这些操作位于处理并发、网络、I/O 和文本处理等功能的各种软件包中。 database/sql 是一个标准库软件包，负责与数据库（主要是 SQL 关系数据库）的连接和交互。它为类 SQL…

本文由外部贡献者撰写。 Damaso Sanoja Damaso Sanoja 热衷于帮助他人通过数据驱动型决策达成目标。这促使他撰写了大量文章，内容覆盖最流行的关系数据库、客户关系管理系统、企业资源规划系统、主数据管理工具，以及最近用于机器学习和 AI 项目的数据仓库系统。这份对数据管理的执着可以归结于他的第一台电脑是没有软盘的 Commodore 64。 GitHub database/sql 软件包是一个标准库，提供与 SQL 数据库交互的接口。该软件包使应用程序能够查询和更新数据库，并提供可用于各种 SQL 数据库的可移植接口。 database…

本文由外部贡献者撰写。 Aniket Bhattacharyea 热爱计算机和软件的数学研究生。网站操作系统是计算机系统的心脏和灵魂。操作系统管理计算机的硬件和软件资源，并为用户提供与计算机交互的手段。传统上，C 语言和汇编等语言因其低开销和“接近机器”的特性而被用于编写操作系统。但是，越发流行的 Go 等高级语言新引入了一些特性，可以使操作系统等复杂软件更易开发。例如，类型安全、错误处理和并发等特性有利于操作系统编写。因此，Go 这样的高级语言应该会成为操作系统开发的自然选择。所以，为什么不是呢？在本文中，您将了解为什么 C 语言这样的语言在操作系统开发…

本文由外部贡献者撰写。 Hrittik Roy Hrittik 是一位作者和软件工程师，专门研究云原生生态系统。他曾参与过许多大型项目，在云计算的技术和商业方面都有经验。他经常在会议上发言，并写过许多关于软件开发和分布式系统的文章。在他的空闲时间，他喜欢散步。 LinkedIn Twitter 试图为所有可能的用户与您软件的交互手动创建测试用例即使不是不可能的，也仍令人望而却步。模糊测试，或称 "Fuzzing"，是一种自动化的软件测试，可以帮助发现潜在的错误和安全漏洞。该测试涉及将随机数据（或 “Fuzz”）注入被测软件中。这种测试框架可以帮助发…

GoLand

Go 语言在机器学习中有未来吗？

Sooter Saalu

将 Go 用于机器学习的主要挑战

缺少高级库

没有 CUDA 的原生绑定

实验约束

数学和统计功能不足

Go 中的高级库

情况是否正在发生变化？

未来用例

结论

Discover more

比较 database/sql、GORM、sqlx 和 sqlc

database/sql 软件包使用入门

为什么不用 Go 编写操作系统？

了解 Go 中的模糊测试

GoLand

Go 语言在机器学习中有未来吗？

Sooter Saalu

将 Go 用于机器学习的主要挑战

缺少高级库

没有 CUDA 的原生绑定

实验约束

数学和统计功能不足

Go 中的高级库

情况是否正在发生变化？

未来用例

结论

Subscribe to GoLang Blog updates

Discover more

比较 database/sql、GORM、sqlx 和 sqlc

database/sql 软件包使用入门

为什么不用 Go 编写操作系统？

了解 Go 中的模糊测试