如果您有关注过去一年中 Python DataFrame 的进展,那么您一定听说过 Polars,专为处理大型数据集而设计的强大 DataFrame 库。
在 DataSpell 中试用 Polars
与 Spark、Dask 和 Ray 等处理大型数据集的其他库有所不同,Polars 在单台机器上使用,也因此引起许多与 pandas 的比较。 事实上,Polars 在许多重要方面都与 pandas 存在差异,包括数据处理方式以及最佳应用。 下文将探讨这两种 DataFrame 库的技术细节区别,并分析其各自优点和局限。
如果您想听 Polars 的缔造者 Ritchie Vink 亲口讲述…