论文链接:https://arxiv.org/ftp/arxiv/papers/1904/1904.08056.pdf
本论文提出了两个网络,DNet(a detection network)和ENet(an encoder-decoder estimation network)。
主要贡献: 1.检测-估计网络(简称为“ DENet”),用于准确,高效地计算不同密度的人群。该结构改进了学习网络的多尺度表示,并可以生成高分辨率密度图。将我们的DENet结构应用于一些最新的人群计数网络时,所有估计的准确性都可以得到一定程度的提高,这证明了我们核心思想的适用性。
2.为了进一步提高不同规模的估算网络的通用性,我们提出了一种新颖的估算网络(“ ENet”),该网络使用改良的Xception架构作为编码器,并结合了扩展卷积和转置卷积作为其解码器。
3.我们提出了一个新的损失函数,用于联合训练两个网络。该函数结合了欧几里得损失和新提出的计数损失。欧几里得损失测量像素级别的估计误差,计数损失测量整个图像上人的计数误差。
The architecture of the DENet: 在DNet里: we adopt Mask R-CNN as our DNet in our work and we only retain large people segmented by DNet.
在ENet里: to create high-resolution and high-quality density maps.
we adopt a modified Xception as the FME to extract features. a set of dilated convolutions and transposed convolutions as DME:
损失函数: 欧几里得损失和计数损失: