和记平台官网机械(江苏)有限公司
售前:0510-87061341
售后:0510-87076718
技术:0510-87076708
邮箱:bk@163.com
微信公众号二维码
微信公众号


合集详解 RAPIDS cuDF 若何赋能 AI 加快数据科学

  跟着 AI 正帮帮各行各业鞭策立异和提高效率,正因如斯,数据科学家们面对着日益增加的工做负载需求,火急需求寻找高效趁手的东西以应对挑和。

  通过以下博客领会更多关于 RAPIDS cuDF 的最新消息,解锁正在 AI 使用取处理方案中加快数据阐发摸索的立异灵感。

  RAPIDS cuDF 驱动的 Polars GPU 引擎现已发布公测版,为各行各业的数据科学家和工程师供给了一种合用于中等规模数据处置的强大东西。能够正在不发生分布式系统开销的环境下,Polars GPU 引擎间接内置正在 Polars API 中,使所有用户都能轻松拜候。

  对于面向数据阐发工做的 DataFrame 软件库,除了 Pandas,目前还有一颗冉冉上升的开源新星——Polars。比拟于次要依赖单线程施行的 Pandas,Polars 正在处置大数据集时的速度凡是比其快 5 到 10 倍。

  借帮 RAPIDS cuDF,数据科学家现正在能够正在他们首选的代码库上全速运转数据处置。此外,跟着数据集规模不竭增加,处置工做占用更多内存,正在 NVIDIA RTX 的 AI 工做坐和 PC 上的运转也实现了显著的速度提拔。比拟于基于保守 CPU 的处理方案,正在工做坐中共同利用 cuDF 和 NVIDIA RTX 5880 Ada 架构 GPU,能够将机能提拔多达 100 倍。

  Pandas 是 Python 生态系统中最风行的 DataFrame 法式库,但它的速度会跟着 CPU 上数据量的添加而变慢。现正在只需一条号令,用户就能够正在无需更改代码的环境下,利用 cuDF 将加快计较引入到其 Pandas 工做流中。按照数据集大小为 5 GB 的阐发基准测试成果,处置时间缩短到本来的 150 分之一。

  点击阅读《解密 AI 若何加快数据科学工做流》领会更多相关消息,预见 RTX AI 将若何为将来的工程师创制无限可能。

  现正在 RAPIDS cuDF 可认为 950 万 Pandas 用户带来 GPU 加快,而无需他们更改代码,按照数据集大小为 5 GB 的阐发基准测试成果,处置时间缩短到本来的 1/150。而由 RAPIDS cuDF 驱动的全新 GPU 引擎曾经可将 NVIDIA GPU 上的 Polars 工做流速度最高提速 13 倍,这意味着仅正在一台机械上数据科学家就能实现正在数秒内处置数亿行数据。

  点击阅读《RAPIDS cuDF 驱动的 Polars GPU 引擎发布公测版》领会更多将 NVIDIA 加快计较引入 Polars 显著提拔加快机能的细致引见。

  虽然 Pandas 和 Polars 正在数据处置范畴各有所长,可是处置超大数据集不只需要极致阐扬 CPU 的能力,也需要 GPU 阐扬感化。正在这一布景下,NVIDIA 发布了 RAPIDS cuDF 库,用于加载、毗连、聚合、过滤和以其他体例操做数据,充实操纵了 GPU 大规模并行处置能力的劣势。

  RAPIDS 是一套开源的 GPU 加快 Python 法式库,旨正在改良数据科学和阐发工做流。RAPIDS cuDF 是一个 GPU DataFrame 法式库,其供给了一个雷同 Pandas 的 API,用于加载、过滤和操做数据。cuDF 的晚期版本只合用于 GPU 开辟工做流程。而 NVIDIA 也正在持续对这一使用进行更新。

  Pandas 是一个矫捷而强大的 Python 数据阐发和处置库,成为了数据科学家的首选。然而,跟着数据集大小的增加,Pandas 正在纯 CPU 系统中的处置速度和效率方面就会碰到坚苦。

  • 发布于 : 2025-03-06 12:20


0510-87061341 (售前)
0510-87076718 (售后)
0510-87076732 (技术)

微信公众号

微信服务号