研究突破2026年4月6日Google推出TurboQuant演算法:記憶體管理突破減少6倍KV快取消耗,速度提升8倍Google公開全新TurboQuant演算法,在不犧牲準確度的前提下,KV快取記憶體消耗降低6倍,注意力機制計算速度提高8倍,為大型AI模型運算效率樹立新標竿。 #Google #TurboQuant #記憶體管理