LM Studio安装使用

从Ollama的使用痛点说起

从Ollama的使用痛点说起，在使用本地大语言模型（LLM）时，许多人首先接触到的是Ollama，我这边也是。它以简单的一行命令安装模型而闻名，深受开发者欢迎。然而，随着使用深入，Ollama的一些缺点逐渐显现，让不少用户开始寻找更好的替代方案。

Ollama的主要使用缺点

性能瓶颈明显：Ollama在推理速度上往往落后于底层引擎（如llama.cpp）。社区基准测试显示，相同模型下，Ollama的tokens/s（每秒生成token数）可能低30%-70%，响应延迟较高，尤其在处理复杂提示或长上下文时表现突出。
输出质量与稳定性不足：许多用户反馈本地模型输出不够准确、容易“幻觉”（hallucination），格式控制差，需要额外脚本清理结果。
资源管理和功能局限：模型管理、GPU利用率优化、跨设备调度等方面不够完善。
模型使用不便：由于其目录结构设计，使用第三方平台如huggingface上直接下载的模型，需要先导入后使用，而且由于第一条原因，对较新的模型支持较差，有的甚至不能运行。

正因这些痛点，我找到了另一款本地AI工具LM Studio。它同样提供优雅的图形界面、强大的模型发现与管理功能，同时支持高效的本地推理，不运行模型时基本不会占用系统资源，成为许多用户的首选替代方案。

LM Studio是一款免费的本地大语言模型运行平台，支持Windows、macOS和Linux。它允许用户轻松发现、下载并运行来自Hugging Face等平台的各种开源模型（如Llama、Qwen、Gemma、DeepSeek、Mistral等），并提供聊天界面、API服务器和参数调节工具。

核心优势：

系统要求
- Windows：x64/ARM64，支持NVIDIA/AMD/Intel GPU
- macOS：Apple Silicon（M1及以上）
- Linux：x64系统
- 内存建议：至少16GB（推荐32GB+），GPU显存根据模型大小
下载与安装

方式一：官网图形化安装（推荐）
1. 访问官网下载页面：https://lmstudio.ai/download
2. 根据你的操作系统选择对应版本（Windows、macOS或Linux）
3. 下载安装包（Windows为.exe，macOS为.dmg等）
4. 运行安装程序，按照向导完成安装（Windows可选择安装路径，默认即可）

方式二：命令行安装（快速）

Mac / Linux：

curl -fsSL https://lmstudio.ai/install.sh | bash

Windows（PowerShell）：

irm https://lmstudio.ai/install.ps1 | iex

安装完成后，启动LM Studio应用。

3. 初次使用配置

1. 打开LM Studio，会看到欢迎界面。
2. 打开左侧工具栏最下方的“App Settings”：General中可以手动检测程序更新，设置程序语言，主要是在“Models Directory”修改大模型的保存目录（通过程序下载，或自己在模型网站上下载的模型放入此目录中即可）。打开“Model Defaults”，在“Default Context Length”中设置大模型加载启动时默认的上下文长度，程序默认8K，可根据自己显存、内存大小自己调大，我5080 16G显存+64G内存，设置128K运行Qwen 35B A3B以下模型可正常加载运行。
3. 关闭“App Settings”，打开左侧工作栏的“Developer”：在“Server Settings”中可以设置程序监听端口，开启本地网络监听使其它电脑可访问使用本地接口，设置模型TTL时间，自动卸载模型等。
4. 自下载的大模型，放入模型目录时按二级存放；例如我设置的模型目录是：“E:\AI-Models”，建立二层目录如“huihui-ai\qwen3.5-9B”,将下载的gguf大模型文件和mmproj视觉文件一起放入其中即可。

4. 使用

如果你也被Ollama的命令行局限、速度问题或界面不便困扰，LM Studio是一个极佳的选择。