微信号:扫一扫 联系我们
如何设计一条 prompt 让 LLM 陷入死循环?
为什么这么久了还是没有主流软件开发鸿蒙版?
如何看待广西举全区之力支持柳州化解债务?为什么最近地方债又重回公众视野?
多益网络输了餐费官司,准备近几年搬离广州,你怎么看?
这里推荐一个本地微调大模型的框架。
ZO2,一个仅用18G显存就能全参微调175B大模型的框架(当然也支持微调小一些的模型)。
更新:现在ZO2支持Qwen3啦,全参微调32B的版本只需要6GB显存。
Code: ***s://github***/liangyuwang/zo2 Paper: ***s://arxiv.org/abs/2503.12668。