一、报告时间
2026年4月1日(星期三)10:00
二、报告地点
明德区才德楼A203
三、报告题目
HBLLM :基于小波增强的LLM高保真1比特量化技术
四、主讲人
江颖,中山大学教授,博士生导师,广东省计算科学重点实验室副主任。主持或参加包括国家自然科学基金项目、教育部项目、国家重点研发计划课题、广东省面上项目等多个项目与课题,面向高精度快速并行计算方法、大规模并行计算等领域关键问题开展研究。在NeruIPS、International Journal of Digital Earth、IEEE TMI、IEEE IoT、Knowl. Based Syst、J. Comput. Phys.、SIAM Numer. Anal.、Math.Comp.等计算机与数学顶级期刊/会议发表论文 50 余篇。
五、报告摘要
本次讲座将介绍面向大语言模型的高保真1-bit训练后量化方法HBLLM:通过小波变换分解权重频率,增强极低比特表示下的表达能力并提升量化精度;设计行内多参数分组、基于ℓ2范数的显著列选择两种结构感知策略,结合非显著权重频带内均值共享优化存储。实验证明,HBLLM在OPT、LLaMA等模型上表现优异,达到1-bit量化当前先进水平,为大模型极低比特量化及资源受限环境部署提供新思路与技术参考。