代码地址:https://github.com/ronghanghu/lcgn
VQA任务通常需要对给定任务上下文中对象之间的关系进行推理。例如,要回答盘子上的杯子是什么颜色??我们必须检查特定杯子的颜色,以满足盘子上的关系。最近的研究工作提出了各种复杂关系推理的方法,然而,它们的能力大多在推理结构上,对场景的理解不够深入。在本文中,我们提出了一个通用的语言条件图网络(LCGN)框架,建立视觉场景中对象的上下文表示以支持关系推理,其中每个节点代表一个对象,并通过文本输入的迭代消息传递来描述相关对象的感知表示。例如,调节与plate的on关系,对象mug收集来自对象plate的消息,以将其表示更新为mug on the plate,这可以很容易地被简单分类器用于答案预测。实验结果表明,LCGN方法能够有效地支持关系推理,并在多个VQA数据集上提高了性能。
代码地址:https://github.com/clovaai/overhaul-distillation
该论文提出了一种新的特征蒸馏方法,其中蒸馏损失在三方面发挥作用:teacher transform, student transform, distillation feature position。论文创新点在于:newly designed margin ReLU, 新的 distillation feature position, 和 partial L2 distance function。
在ImageNet中,该方法使用ResNet50实现了21.65%的 top-1 error,其优于教师网络ResNet152的性能。该方法在图像分类,对象检测和语义分割等任务上均取得了性能提升。
项目地址:https://people.cs.umass.edu/~zezhoucheng/gp-dip/ 代码地址:https://github.com/ZezhouCheng/GP-DIP
Deep Image Prior (CVPR2019)在图像增强、去噪等领域取了较好的效果。在这篇CVPR2019来自麻省大学的论文中,作者证明了Deep Image Prior是渐近地等同于平稳高斯过程,并推导相应的高斯核。 同时,作者使用使用随机梯度Langevin动力学进行后验推断,避免了早期停止迭代(这是Deep Image Prior的一个显著不足),并且能够显著改善去噪和inpainting的效果。