dify：接入 Xinference 部署的本地模型

推荐

冰蓝无敌 2024-03-19 17:40 2024/03/19 ©著作权读给你听

文章标签 dify 本地模型 Xinference 专栏分类人工智能 阅读数4731 评论数0 点赞数0 收藏数0

导读：接入 Xinference 部署的本地模型Xorbits inference 是一个强大且通用的分布式推理框架，旨在为大型语言模型、语音识别..

接入 Xinference 部署的本地模型

Xorbits inference 是一个强大且通用的分布式推理框架，旨在为大型语言模型、语音识别模型和多模态模型提供服务，甚至可以在笔记本电脑上使用。它支持多种与GGML兼容的模型,如 chatglm, baichuan, whisper, vicuna, orca 等。 Dify 支持以本地部署的方式接入 Xinference 部署的大型语言模型推理和 embedding 能力。

部署 Xinference

开始部署

部署 Xinference 有两种方式，分别为本地部署和分布式部署，以下以本地部署为例。

首先通过 PyPI 安装 Xinference：

$ pip install "xinference[all]"

本地部署方式启动 Xinference：

$ xinference-local2023-08-20 19:21:05,265 xinference 10148 INFO Xinference successfully started. Endpoint: http://127.0.0.1:99972023-08-20 19:21:05,266 xinference.core.supervisor 10148 INFO Worker 127.0.0.1:37822 has been added successfully2023-08-20 19:21:05,267 xinference.deploy.worker 10148 INFO Xinference worker successfully started.

Xinference 默认会在本地启动一个 worker，端点为：http://127.0.0.1:9997，端口默认为 9997。默认只可本机访问，可配置 -H 0.0.0.0，非本地客户端可任意访问。如需进一步修改 host 或 port，可查看 xinference 的帮助信息：xinference-local --help。

使用 Dify Docker 部署方式的需要注意网络配置，确保 Dify 容器可以访问到 Xinference 的端点，Dify 容器内部无法访问到 localhost，需要使用宿主机 IP 地址。

创建并部署模型

进入 http://127.0.0.1:9997 选择需要部署的模型和规格进行部署，如下图所示：

由于不同模型在不同硬件平台兼容性不同，请查看 Xinference 内置模型确定创建的模型是否支持当前硬件平台。

获取模型 UID

从上图所在页面获取对应模型的 ID，如：2c886330-8849-11ee-9518-43b0b8f40bea

模型部署完毕，在 Dify 中使用接入模型

在设置 > 模型供应商 > Xinference 中填入：

"保存" 后即可在应用中使用该模型。

模型名称：vicuna-v1.3

服务器 URL：http://<;Machine_IP>:9997 替换成您的机器 IP 地址

模型 UID：2c886330-8849-11ee-9518-43b0b8f40bea

Dify 同时支持将 Xinference embed 模型作为 Embedding 模型使用，只需在配置框中选择 Embeddings 类型即可。

安装的时候总是超时

pip install "xinference[all]" -i https://pypi.tuna.tsinghua.edu.cn/simple

只需要输入如下命令，就可以在服务上启动 Xinference 服务：

xinference-local -H 0.0.0.0

更多文章请关注《万象专栏》

转载请注明出处：https://www.wanxiangsucai.com/read/cv182678

话题推荐： #dify# #本地模型# #Xinference#

打赏
0 赞
收藏
评论
举报

下一篇：人工智能技术及其赋能的含义解析

发布评论

全部评论(0)

模板

HTML模板

织梦模板

帝国模板

discuz模板

PHPWind

Wordpress

源码

CMS源码

PHP源码

ASP源码

GO源码

python源码

整站源码

特效代码

幻灯片代码

菜单导航

客服代码

素材

图标

元素

背景

ppt

字体

动图

模板

模板

海报

插画

UI

网页

淘宝

图库

高清壁纸

手机壁纸

万象图床

dify：接入 Xinference 部署的本地模型

dify：接入 Xinference 部署的本地模型

相关文章