Ollama+LobeChat：在个人电脑上打造无限制、高颜值、免费的专属大模型助手！

笔者在ChatGPT初期就开始关注和使用大模型，在日常工作生活中也折腾了不少小玩具，使用的大模型主要是Openai的GPT系列和谷歌的Gemini-Pro以及一些国内厂商的模型。客观说，Openai的模型遥遥领先，而国内那帮的模型只能说挡性十足。但随着Openai开始大规模封禁不支持区域的账号后，笔者的两个账号也未能幸免，只能靠Gemini-Pro苦苦支撑，虽然可以将就着用，但总觉得别别扭扭。

看起来是开启一段新的AI之旅了。没错，笔者找到了一个更能打的方案：Ollama+LobeChat，完全基于个人PC平台，本地部署开源大模型，配合GUI客户端，体验值直接拉满！

🎭 Ollama&LobeChat简介

Ollama是一个开源的大模型托管和服务平台，可以在Windows、macOS、Linux或Docker中安装，并提供便利的模型下载、推理等功能，简直把大模型的落地做到了0基础即可入手的地步。项目的Logo就是下面的这只可爱的小羊驼。

说起来LobeChat是与NextChat几乎同期起步的大模型客户端项目，二者也先后从开源走向商业化（除了开源，官方也提供商业服务），不过笔者个人感受下来，LobeChat在整体质感和功能特性方面更受一筹。UI上做的非常精细现代，功能上支持语音合成、多模态、插件，可以轻松多对接OpenAI/Gemini/Claude/Ollama等十数个平台。

🦀 Ollama安装和使用

Ollama非常容易安装，可在文末获取下载链接，下载安装下面的步骤开始安装和启动模型推理服务。

1️⃣ 安装

curl -fsSL https://ollama.com/install.sh | sh

docker run -d -v ./ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:latest

2️⃣ 下载大模型

安装完成后就可以下载大模型啦，笔者推荐llama3.1、gemma2、qwen2等大模型，更多模型可在下面的网站搜索：

https://ollama.com/library

请根据自己的电脑或NAS配置情况，选择合适的模型和体量，体量越大模型文件的体积也越大，对CPU和显存的要求也越高。比如笔者选择的gemma2:27b，体积就有16GB。
输入下面的命令即可开始下载:

ollama run gemma2:27b

下载完成后，Ollama会自动启动模型推理服务，我们可以直接在终端中进行测试，笔者的M1芯片，没想到速度非常快！

最后，因浏览器安全限制，你需要为 Ollama 进行跨域配置后方可正常使用，在终端中输入下面命令然后重启Ollama即可。

launchctl setenv OLLAMA_ORIGINS "*"

🦀 LobeChat安装和使用

1️⃣ 安装LobeChat

LobeChat需要使用Docker来安装，下面是Docker和Docker Compose的指令，二选一即可。

docker run -d -p 3210:3210 
  -e OPENAI_API_KEY=sk-xxxx 
  -e ACCESS_CODE=123456 
  --name lobe-chat 
  lobehub/lobe-chat:latest

指令说明：

默认映射端口为 3210, 请确保未被占用或手动更改端口映射
设置访问密码为123456，请自行修改
使用你的 OpenAI API Key 替换上述命令中的 sk-xxxx ，如果不用OpenAI可以随便写。

创建一个compose.yml文件，将下面的内容贴近去：

version: '3.8'
services:
  lobe-chat:
    image: lobehub/lobe-chat:latest
    container_name: lobe-chat
    restart: always
    ports:
      - '3210:3210'
    environment:
      OPENAI_API_KEY: sk-xxxx
      OPENAI_PROXY_URL: https://api-proxy.com/v1
      ACCESS_CODE: 123456

然后在compose.yml文件所在目录下执行下面命令启动容器：