基于整合包的推理经验 #21

Eikwang · 2024-09-14T07:54:22Z

多次测试后总结如下
总循环不能超过1000帧，也就是说素材不能超过500帧，超出后会失败报错。
素材尺寸最大1080p，最小480p（大头照），建议720P，人脸占比不能低于1/4画面宽度。
素材30帧，长度则为16.5s，生成33s循环样本，
素材25帧，长度则为20s，生成40s循环样本。
生成的样本会强制转换为25帧，故建议使用25帧的素材，有利于计算长度。
全身视频使用720102425fps的素材，嘴巴可以闭上了，不会咧开嘴露出牙齿，但是嘴部仍然不自然
口型不太自然，如果使用没有嘴部运动的素材，推理出来的人物嘴巴能闭上，但是说话的时候嘴部不自然，使用有说话的素材推理出来口型比较好，不说话就咧着牙。。。等待作者优化

Eikwang · 2024-09-14T08:04:26Z

还需要探索，如何让训练集口型更自然，特别是不说话的时候，现在做出了的人物不说话的时候嘴巴闭不上

Eikwang · 2024-09-14T13:22:03Z

最新测试：使用全身视频口型效果较差，面部占比越低效果越差，，面部占比达到画幅2/3以上口型效果就比较准确，1：1大头照模式可以循环1800帧长度（即900帧素材）

qiuzi · 2024-09-15T02:30:01Z

能提供下训练集结构和嘴唇分辨率尺寸吗？还有整合包的出处？

Eikwang · 2024-09-15T06:56:59Z

能提供下训练集结构和嘴唇分辨率尺寸吗？还有整合包的出处？

推理用的刘悦的整合包，训练集就是mp4视频、

LvHuaiSheng · 2024-09-15T06:58:36Z

能提供下训练集结构和嘴唇分辨率尺寸吗？还有整合包的出处？

推理用的刘悦的整合包，训练集就是mp4视频、

请问是用的项目里的train.py来训练的吗

qiuzi · 2024-09-15T09:55:03Z

能提供下训练集结构和嘴唇分辨率尺寸吗？还有整合包的出处？

推理用的刘悦的整合包，训练集就是mp4视频、

那个视频处理的叫推理预处理，训练不在web界面里呈现

Eikwang changed the title ~~基于整合包的样本训练经验~~ 基于整合包的推理经验 Sep 16, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

基于整合包的推理经验 #21

基于整合包的推理经验 #21

Eikwang commented Sep 14, 2024 •

edited

Loading

Eikwang commented Sep 14, 2024

Eikwang commented Sep 14, 2024

qiuzi commented Sep 15, 2024

Eikwang commented Sep 15, 2024

LvHuaiSheng commented Sep 15, 2024

qiuzi commented Sep 15, 2024

基于整合包的推理经验 #21

基于整合包的推理经验 #21

Comments

Eikwang commented Sep 14, 2024 • edited Loading

Eikwang commented Sep 14, 2024

Eikwang commented Sep 14, 2024

qiuzi commented Sep 15, 2024

Eikwang commented Sep 15, 2024

LvHuaiSheng commented Sep 15, 2024

qiuzi commented Sep 15, 2024

Eikwang commented Sep 14, 2024 •

edited

Loading