Skip to content

Releases: kleinlee/MiniMates

V2.4

29 Dec 14:51
54880c9
Compare
Choose a tag to compare

1、重点接入云LLM和云TTS,V2版本会一直不限量免费供应。依然保留其他调用方式的接口。
2、大幅调整了UI结构,提升易用性,后续UI会稳定一段时间。
3、修复了一些已知错误。

V2.3 添加云端大模型接口

27 Nov 06:40
54880c9
Compare
Choose a tag to compare

V2.3 更新日志
1、增加了大模型API接口,以openai格式对接。
2、优化了人脸检测精度及人脸有所偏转时的建模处理。
3、优化了一些UI处理。
github下载链接:https://github.com/kleinlee/MiniMates/releases
百度网盘链接:https://pan.baidu.com/s/17rIu668erncps2fiU_cwXg?pwd=eyh9
夸克网盘链接:https://pan.quark.cn/s/83d98ca807e9

V2.2 自定义语音(需自己训练再部署)

21 Nov 16:12
54880c9
Compare
Choose a tag to compare

V2.2 更新日志
1、增加本地TTS切换选项,提供了三个模型,只支持VITS ONNX模型,在系统设置中进行设置。自己构建TTS请参照教程https://github.com/kleinlee/VITS_deploy
2、添加角色卡删除功能,并优化一些显示逻辑
3、新加入大模型参数调节功能,在系统设置中进行设置。
4、优化了启动加载速度。
github下载链接:https://github.com/kleinlee/MiniMates/releases
百度网盘链接:https://pan.baidu.com/s/17rIu668erncps2fiU_cwXg?pwd=eyh9 提取码:eyh9 

v2.1

16 Nov 03:42
54880c9
Compare
Choose a tag to compare

V2.1 更新日志
1、正式更改为3D渲染,速度无虞。heavy training,light infra是未来潮流。目前存在一些效果瑕疵未来会用gaussian splatting弥补。
2、现在人物默认显示在屏幕中央,此举为了避免多屏显示错乱。
3、优化了一些UI逻辑。

正式加入角色卡功能

06 Nov 09:15
54880c9
Compare
Choose a tag to compare

V2.0 更新日志
1、大幅优化UI设计,支持页面自由移动、页面大小可选。
2、增加角色卡,支持定制人设,支持十轮上下文对话
3、llm改为gpu计算,必须要有独立显卡支持
官方推荐聊天模型:Index_1_9B_Q4_K_M.gguf(规模合适、智力还行、限制不严、商业许可)

后续计划:
V2.1 渲染算力降低一倍,增加牙齿清晰度、调整人物位置、扩大面部渲染区域
V2.2 自由姿态表情支持,业内首发!根据人设在聊天时自动做出相应表情。
V2.3 支持接入LLM和TTS API,试验本地ASR。

修复一些已知问题,优化体验

26 Oct 06:26
2fdcf8f
Compare
Choose a tag to compare

1、合理化线程调度,避免卡顿。
2、输入框增加至200字。
3、重新加入牙齿部分的渲染。
4、增加了加载界面避免等待过长。
5、支持切换不同大模型,及切换不同GPU进行图像推理。
6、调整文字对话框布局,可任意拖动。

自定义形象

21 Oct 12:41
2fdcf8f
Compare
Choose a tag to compare

v1.1主要改动:
1、增加自定义形象功能,上传图片即可体验
2、使用本地VITS模型替换edgeTTS,5个更好音色,但资源占用加大,断句不佳
3、剔除了口型和语音间存在的0.15s延时
4、修复了说话时可能不断重复一些语句的问题
5、增加了画面渲染帧率选择,目前支持25、20、15、10FPS四种选项。
6、增加了简易日志系统

加入数字人功能

17 Oct 06:54
Compare
Choose a tag to compare

加入数字人功能,预设10个形象!
数字人上半身微动+头部自由控制,1.0暂时设定了固定的动作。
桌面透明形态,一键切换形象语音。
RTX3050及以上均可流畅运行。 更多设备的结果欢迎留言。

v0.1

24 Sep 08:00
Compare
Choose a tag to compare

部署你自己本地的AI伙伴!
支持llama.cpp框架下的所有模型!请安步骤下载模型并放置相应位置。
支持微软TTS,模拟实时语音,本版本只开放6个普通话语音。
代码在多平台通用,本版本为windows版本,MacOS版本即将到来,如果受欢迎当然也会有手机端。