ideas

检索式方法

数据可否不使用平行语料，使用大量的非平行语料扩充
使用知识图谱做检索式主题控制，保证多轮对话的一致性，流畅性
使用知识图谱增强粗筛
直接使用知识图谱套模板对话系统(无监督生成/符合对话上下文的文本生成)
发现一个检索式系统的问题，检索式系统好像倾向于上下文主题的匹配程度，但是不考虑其他的方面，现有的检索式对话系统其实主要认为检索到的句子质量就一定好，但是不一定（比如，下面的句子仅仅是主题一致，但是并不流畅，不是一个好的回复，所以单纯使用bert通过负采样计算的并不是好的方法，可以参考IRGAN生成更高质量的负样本?甚至说用生成式增强检索式也是一个可以写论文的idea(Multiview的检索式对话模型))
```
Context: 你喜欢什么电影     # Coherence scores
Reference: 我喜欢爱情片     # 0.2245
Generated: 电影电影电影     # 0.1602
Generated: 你喜欢什么电影   # 0.0949
Generated: 爱情喜欢我电影   # 0.1945
```
从这个角度说，multiview其实就是一个改良的检索模型，适合发论文
不仅要从response抽负样本，还要把context作为负样本
Dialog Evaluation任务描述 Dialog Evaluation是一个自然语言处理中一个非常重要的问题，目的是评价候选句子是否是针对对话上下文的合适回复。目前Dialog Evaluation有如下三个主要的应用场景：对话自动评估，检索式对话，基于强化学习的对话。目前这三个子方向中对对话评估都只从一个单一的角度对对话进行评价，但是单一一个分数无法有效的涵盖所有的评估要点。
- 一致性Coherence: 判断下文是否是上文的回复，负采样训练
- 流畅性Fluency: 主要针对生成式对话系统，判断对话生成的句子的流畅性（单词级），采用负采样训练[重复，删除，替换，语言模型计算]
- 逻辑性Logicality: 判断句子的上下文逻辑是否连贯（句子级），负采样训练[句子重复，句子删除，句子打乱顺序]
检索式方法的粗筛，Q-A匹配比Q-Q匹配好很多
复现PloyEncoder和RocketQA(batch内的负采样方法掌握)，把triplenet的思路加到bi-encoder的检索式对话里面，提一种新的方法，试图建模层次信息，复用每一句话的embedding。或者也可以借鉴hierarchical transformer

生成式

GPT2(直接在 GPT2-chitchat 上开始 fine-tune?)
检索加强的GPT2
互助学习方式
使用知识图谱提供facts知识，连同检索结果一起加强生成过程
采样nbest个句子，通过Topic, fluency, appropriateness进行多样性打分最终来筛选一个合适的结果，这个打分的包不仅可以用来做线下评估，还可以用来作为GPT2生成模型的筛选模型，还可以作为奖励生成器(paper的idea)
- 主题相关性: 训练主题分类模型(文本5分类问题：电影，美食，音乐，数码电子，体育)
- 流畅度: 使用GPT2语言模型计算ppl和对应的safety公式
- 多样性: 使用distinct指标计算distinct-1/2(需要分词)
- 兼容性: 训练bert nli模型判断逻辑是否存在错误
- 一致性: 检索模型(Learning-based metric)判断是否和上下文语义一致
生成式一次生成多个句子，统一进行重排序
训练 GPT2 模型，用60 epoch和32 batch size挺好的，并且GPT2V2比GPT2好很多

评价指标

评价指标可以用来线下评测，并且也可以用来判断是否兜底，是非常有必要的
可以把检索式对话系统直接拿来做基于学习的评价指标，可能会用到数据增强等方法进一步提升效果
Multi-view的评价指标可以有如下的应用：自动评估响应的效果，reranker，强化学习的奖励生成器

Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ideas

ideas

README.md

检索式方法

生成式

评价指标

Schedule

Files

ideas

Directory actions

More options

Directory actions

More options

Latest commit

History

ideas

Folders and files

parent directory

README.md

检索式方法

生成式

评价指标

Schedule