Quick Start LLM

快速启动自托管、可扩展、管理友好的LLM环境，使用One-Api分发和管理Key。

目前支持的`LLM`

目前支持的推理工具

快速启动

默认使用ChatGLM3-6B模型，4bit量化，OpenAI格式的Api启动，使用GPU推理。

前提

暂不支持AMD显卡和苹果M系列GPU。

带有Nvidai显卡（显存>=8GB），并且已经正确安装驱动的Windows、Linux环境。

或者使用CPU推理的Windows、Linux、MacOS环境。

Docker

Docker-compsoe

下载模型

如果提示没有lfs命令，则需要安装git-lfs，Debian / Ubuntu系统可执行此命令安装sudo apt-get install git-lfs。

仓库根目录执行

git lfs install

进入模型目录

cd ./models/THUDM

下载模型

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

配置文件

复制.env.template到.env

cp .env.template .env

启动

docker-compose up -d

配置

打开One-Api http://ServerIP:3000/login

初始账号用户名为 root，密码为 123456，修改初始密码。

点击导航栏渠道，添加本地启动的ChatGML3到渠道。

可参考以下值填写：

类型：自定义渠道

Base URL：http://serverip:8000

名称：ChatGLM3-6B

分组：default

模型：gpt-3.5-turbo

模型重定向：-

密钥：none

填写完毕后点击提交

点击导航栏渠道按钮，点击新添加的渠道测试按钮，测试成功则代表本地ChatGLM3已启动成功。

至此，已经把本地ChatGLM3，添加到了One-Api。可以通过One-Api分发密钥，此密钥可直接用于兼容OpenAI API的ChatGPT程序。

分发密钥

完成以上部分之后，我们可以开始分发并使用密钥了。这里以ChatGPT Next Web为例。

点击创建新的令牌，选择参数，创建完毕后，复制令牌，选择 ChatGPT Next Web。

这里复制的格式如下，只需要Key部分sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04

https://chat.oneapi.pro/#/?settings={"key":"sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04","url":"http://localhost:3000"}

打开http://ServerIP:3001/，点击左下角设置，勾选自定义接口按钮，填写接口地址为One-Api地址http://ServerIP:3000，API_KEY一栏填写上一步拿到的Key sk-HTP3cKpFaA2p0HIc20EfFc0a412c4fF1812a4a420f343a04

演示

至此，整个环境搭建完成。

致谢

One-Api：OpenAI 接口管理 & 分发系统；

ChatGLM3：开源双语对话语言模型；

ChatGPT-Next-Web：跨平台 ChatGPT 应用；

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
img		img
.env.template		.env.template
.gitignore		.gitignore
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Quick Start LLM

目前支持的`LLM`

目前支持的推理工具

快速启动

前提

下载模型

配置文件

启动

配置

分发密钥

致谢

About

Uh oh!

Releases

Packages

qingfengfenga/quick-start-llm

Folders and files

Latest commit

History

Repository files navigation

Quick Start LLM

目前支持的LLM

目前支持的推理工具

快速启动

前提

下载模型

配置文件

启动

配置

分发密钥

致谢

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

目前支持的`LLM`

Packages