in 默认分类

PS:下面的内容会非常枯燥,没有耐心的肯定看不下去。因为我写的时候也是觉得很枯燥。。本文背景最近在测试模型稳定性时反复出现掉模型的现象,研究时发现模型稳定与各类参数相互作用。模型参数设置对于模型稳定至关重要。模型参数使用默认值或配置不合理时则会出现模型不稳定或者OOM直接将模型冲爆,导致掉模型...

in 默认分类

本文Dify升级和Open-WebUI升级。Dify 升级时需将主要文件进行备份。所有的升级操作均需谨慎!Dify 升级需备份的文件为:docker 文件夹中的:volumes文件夹、.env文件和docker-compose.yamlWindows Dify升级Dify本机环境:1)系统:w...

in 默认分类

xinference 介绍Xorbits Inference (Xinference) 是一款面向大模型的推理平台,支持大语言模型、向量模型、文生图模型等。 它底层基于Xoscar 提供的分布式能力,使得模型可以在集群上部署,上层提供了类OpenAI 的接口,用户可以在上面部署和调用开源大模型...

in 默认分类

项目介绍本次实验使用ubuntu 22.04版本从魔搭社区下载Qwen2-0.5B-Instruct-AWQ部署并运行。(此处必须使用ubuntu 22.04版本,因为下面所用CUDA 12.4.0最高支持版本为ubuntu 22.04)实验中所用机器硬件为:(1)显卡:英伟达RTX 2080...

in 默认分类

LDAP配置(如下图所示)主机:AD域控IP地址端口:389Application DN:CN=xxxx,CN=xx,DC=xxxxx,DC=xxxxx //域控中有管理员权限的账号Application DN 密码:xxxx密码 //上述账号密码邮箱属性:mail ...