AAAI 2021最「严」一届放榜:录取率仅21%,网易伏羲9篇论文入选
生成风格化的回应是构建智能且吸引人的对话系统的关键。然而,这一任务远未得到很好的探索。这是因为让神经网络在生成连贯的响应的同时呈现特定风格非常困难,特别是当目标风格只嵌入在无法直接用于训练对话模型的未配对文本中时。 本文提出了一种风格化的对话生成方法,可以捕捉嵌入在未配对文本中的风格特征。具体来说,我们的方法可以生成既符合上下文,又符合目标风格的对话回复。在本文中,我们首先引入了一个逆向对话模型来预测一条回复内容对应的输入。然后,我们用这个逆向模型来根据这些风格化的非配对文本生成风格化的伪对话对。我们使用这些伪对话对来联合训练风格化对话模型。为了增强decoder中的风格特征,我们提出了style routing方法。 在两个数据集上的自动和人工评估表明,我们的方法在产生连贯和风格密集的对话回复方面优于竞争基线。 9、生成一个演讲者:基于文字生成的、具有表情和韵律的的说话人脸视频算法框架 (Write-a-speaker: Text-based Emotional and Rhythmic Talking-head Generation) 关键词:虚拟人、图像生成、数字人、音视频同步、说话人脸、视频合成 本文首次提出了从文字生成说话人脸视频的算法框架,除了音视频同步的口型,还同时生成了与说话内容匹配的面部表情和与说话节奏匹配度韵律头动。 (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |