苹果发表论文，解决“在手机内存上运行大模型”

据媒体报道，近日，苹果发布了一篇论文，介绍了一种可以再超出可用DRAM容量的设备上运行LLM（大语言模型）的方法。通过大幅提高内存使用效率，这项新研究支持有限容量的设备运行内存2倍大小的LLM，GPU的推理速度可以提升数十倍。这意味着，该项突破性研究扩大了LLM适用性和可及性，苹果将生成式AI集成到iOS 18的计划或将加快推进。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。