您现在位置:民商网 >> 市场 >> 科技 >> 浏览文章

压缩算法为大语言模型“瘦身”

来源:新华网  刘霞 日期:2024/11/22 10:34:13

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。

(责任编辑:李耀五)

免责声明:

本站原创内容根据公开信息整理或转载,与立场无关,我们力求信息真实、准确,但文章、所示信息、提及内容仅供参考,无法保证该等信息的准确性和完整性、及时性、有效性等,不构成任何建议,据此操作风险自担。转载的属于第三方的信息,已标注作者及来源,并不代表赞成或反对等任何观点,亦不对其真实性负责。

2024年09期
期刊试读
2024年09期

郑重声明:民商网仅提供信息刊登转载功能,所载文章、数据仅供参考,用户需独立做出投资决策,风险自担,投资有风险,选择需谨慎

本站文章来源于网络,版权归原作者或者来源机构所有,如果有涉及任何版权方面的问题,请与及时与我们联系!

Copyright @ 2019 民商网 版权所有

京ICP备19049046号-1 | 京公网安备 11010502039284号