快速启动自托管、可扩展、管理友好的LLM环境,使用One-Api分发和管理Key。
默认使用
ChatGLM3-6B模型,4bit量化,OpenAI格式的Api启动,使用GPU推理。
暂不支持AMD显卡和苹果M系列GPU。
带有Nvidai显卡(显存>=8GB),并且已经正确安装驱动的Windows、Linux环境。
或者使用CPU推理的Windows、Linux、MacOS环境。
如果提示没有
lfs命令,则需要安装git-lfs,Debian / Ubuntu系统可执行此命令安装sudo apt-get install git-lfs。
仓库根目录执行
git lfs install
进入模型目录
cd ./models/THUDM
下载模型
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git
复制.env.template到.env
cp .env.template .env
docker-compose up -d
打开One-Api http://ServerIP:3000/login
初始账号用户名为 root,密码为 123456,修改初始密码。
点击导航栏渠道,添加本地启动的ChatGML3到渠道。
可参考以下值填写:
类型:自定义渠道
Base URL:http://serverip:8000
名称:ChatGLM3-6B
分组:default
模型:gpt-3.5-turbo
模型重定向:-
密钥:none
填写完毕后点击提交
点击导航栏渠道按钮,点击新添加的渠道测试按钮,测试成功则代表本地ChatGLM3已启动成功。
至此,已经把本地ChatGLM3,添加到了One-Api。可以通过One-Api分发密钥,此密钥可直接用于兼容OpenAI API的ChatGPT程序。
完成以上部分之后,我们可以开始分发并使用密钥了。这里以ChatGPT Next Web为例。
点击创建新的令牌,选择参数,创建完毕后,复制令牌,选择 ChatGPT Next Web。
这里复制的格式如下,只需要Key部分sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04
https://chat.oneapi.pro/#/?settings={"key":"sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04","url":"http://localhost:3000"}
打开http://ServerIP:3001/,点击左下角设置,勾选自定义接口按钮,填写接口地址为One-Api地址http://ServerIP:3000,API_KEY一栏填写上一步拿到的Key sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04
至此,整个环境搭建完成。
One-Api:OpenAI 接口管理 & 分发系统;
ChatGLM3:开源双语对话语言模型;
ChatGPT-Next-Web:跨平台 ChatGPT 应用;



