7*24 快讯

铠侠(Kioxia)在单台服务器上实现48亿规模高维向量搜索数据库,利用GPU实现7.8倍索引构建加速。

结合英伟达NVIDIA cuVS库与铠侠开源的AiSAQ技术,在极低DRAM占用下完成1024维向量索引。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

此外,铠侠还展示了通过英伟达NVIDIA cuVS利用GPU加速显著缩短索引构建时间。这两项成就标志着检索增强生成(RAG)搜索解决方案的重大进步。目前,支持超过48亿向量的更大规模部署开发工作正在进行中。

在处理1024维高维向量时,AiSAQ索引构建时间提升了高达20倍,端到端构建时间提升7.8倍。这20倍的提升意味着:构建索引的时间从使用CPU的28.4天大幅缩减至使用四颗NVIDIA Hopper GPU的1.4天;在端到端测试中,时间从31天缩短至4天。

“向量数据库是那些需要在海量非结构化数据集中实时理解意图、上下文和相似性的应用基石,”英伟达存储技术副总裁Jason Hardy表示,“通过利用NVIDIA cuVS库进行GPU加速索引,铠侠支持的高维向量数据库能够以史无前例的效率进行扩展和索引构建。”

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。