Ollama

一键部署各种主流开源模型的工具

简介

Ollama 是一款开源的本地大模型部署工具，能够一键部署和运行各种主流开源大模型，是实现私有化 AI 能力的核心工具。

核心价值

1. 数据安全和隐私

数据不上传至云端
所有计算在本地完成
保障企业敏感数据安全
符合合规要求

2. 一键部署

简单的命令行工具
自动下载模型文件
自动配置运行环境
标准化的运行方式

3. 模型生态丰富

支持 Llama 系列
支持 Mistral 系列
支持 Qwen（通义千问）
支持各种开源模型

4. API 兼容

提供 OpenAI 兼容 API
现有代码几乎无需修改
无缝切换云端和本地
标准化接口

不同素材中的观点

来自 2026-04-29-yupi-ai-guide-programming-tech：

为什么需要本地部署：数据不上传至云端，保障安全性和隐私性
医疗、金融等对数据安全极为敏感的行业刚需
一键部署各种主流开源模型
现实痛点：部署不难，但算力很贵

来自 2026-04-29-deepseek-python-local-setup：

PyCharm + CodeGPT + Ollama 本地部署方案
本地运行开源模型，成本更低
完全可控，无数据泄露风险

来自 2026-05-17-pm-ai-knowledge-base-design-practice：

Ollama在这篇产品实践里承担的是“价值验证器”角色：先证明文档问答可行，再决定是否升级为云端产品
本地部署最大的优势仍然是数据可控和零云成本，但一旦用户需要手机访问、多人共享或免安装使用，Ollama 方案会被可用性和协作性短板限制
作者把 Ollama 与 Dify、本地 Qwen 模型组合成原型，说明它很适合MVP早期低成本试验，而不一定适合作为最终组织级知识库的交付形态

来自 2026-05-18-woshipm-ai-knowledge-management-design-practice：

这篇素材再次强化了 Ollama 的定位：它非常适合在个人电脑上快速验证“文档能否被对话式调用”，但不天然等于一个可交付给团队的知识产品
文章把本地知识库比作“桌上盆栽”——离不开工位、关机即不可用——这个比喻准确指出了Ollama方案在可达性上的根本限制
因而 Ollama 更像 AI 知识管理产品早期的原型工具或私有化试验工具，后续是否继续沿用，取决于是否要支持多端访问、协作和统一治理

来自 2026-05-21-woshipm-ai-knowledge-base-product-design：

这篇素材再次把 Ollama 放在”先验证语义检索价值、再决定是否产品化升级”的位置：它适合快速试验文档问答，但不适合作为面向团队交付的最终形态
文章将本地方案的限制具体化为三类门槛：离开电脑就不可访问、多人难以共享、每个成员都要重复搭建环境，说明 Ollama 的主要边界并不是模型能力，而是交付形态
在产品路径上，Ollama 与 Dify、本地 Qwen 的组合承担的是原型验证层职责，真正进入组织级知识管理后，系统会转向带 API、移动端与权限能力的云端架构

来自 2026-06-02-koc-ollama-codex-local-model：

Ollama v0.24.0 首次加入 Codex 桌面版原生支援，一个指令 ollama launch codex-app 即可将 Codex 从 OpenAI 云端切换到本地开源模型，实现完全免费、无额度限制的使用
推荐模型分两层：Ollama Cloud 订阅用户可选 kimi-k2.6（支援视觉）和 glm-5.1；本地免费方案提供 nemotron-3-super、gemma4:31b、qwen3.6 三款
这标志着 Ollama 从”本地模型部署工具”升级为”AI 桌面应用本地推理后端”——不仅服务编程 IDE，还能为 Codex 这样的 AI 任务执行工具提供推理引擎。切回 OpenAI 只需 --restore 参数
本地模型推理速度明显慢于云端模型，取決于硬件等级，但功能完整性不受影响

实用信息

官方资源

官网：https://ollama.com/
GitHub：Ollama 官方仓库
模型库：Ollama Model Library

快速开始

安装

# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh
 
# Windows
下载安装包安装

运行模型

# 拉取并运行模型
ollama run deepseek-coder
ollama run qwen:7b
ollama run llama2

Codex 桌面版接入（v0.24.0+）

# 启动 Codex 本地模式（进入模型选择菜单）
ollama launch codex-app
 
# 指定模型直接启动
ollama launch codex-app --model qwen3.6
 
# 切回 OpenAI 模型
ollama launch codex-app --restore

API 调用

# 启动服务后调用
curl http://localhost:11434/api/generate -d '{
  "model": "deepseek-coder",
  "prompt": "写一个 Hello World"
}'

硬件要求

模型大小	最低显存	推荐显存
7B	8GB	16GB
13B	16GB	32GB
34B	32GB	64GB
70B	64GB	128GB

适用场景

企业内部敏感数据处理
医疗、金融等合规要求高的行业
离线环境 AI 能力
成本敏感的大规模部署
研发环境快速迭代
Codex 桌面版免费本地推理（v0.24.0+）

个人知识库

探索

Ollama

Ollama

简介

核心价值

1. 数据安全和隐私

2. 一键部署

3. 模型生态丰富

4. API 兼容

不同素材中的观点

实用信息

官方资源

快速开始

安装

运行模型

Codex 桌面版接入（v0.24.0+）

API 调用

硬件要求

适用场景

现实痛点

算力成本

性能权衡

相关页面

关系图谱

快速导航

目录

反向链接