近年来,我们的许多应用程序都由我们能够收集和处理的大量数据驱动。 有人可能会说我们正处于数据时代。 处理如此大量数据的一个重要方面是异常值检测 – 这个过程使我们能够识别离群值、超出预期范围的数据并展现反常的行为。 在科学研究中,异常值数据点可能是技术问题的原因,在得出结论时可能需要舍弃,或者,也可能带来新的发现。
在这篇博文中,我们将分析为什么使用机器学习进行异常值检测很有帮助,并探索使用 Python 检测异常值的关键技术。 您将学习如何实现 OneClassSVM 和孤立森林等流行方法,查看直观呈现这些结果的示例并了解如何将它们应用于实际问题。
异常值检测在哪里使用?
异常值检测也是现代…