为何本地大模型最高只能跑到50%CPU利用率?

我测试了几个不同的模型,为何本地大模型最高只能跑到50%CPU利用率?有没有办法可以解锁?我已经加到64核了,反应速度只有qwen:0.5b稍好,别的都慢。

1 个赞