
DETR和YOLO是两种目标检测方法。YOLO在实时目标检测和跟踪问题上拥有无与伦比的地位。同时,将Transformer模型引入对象检测领域的开创性工作DETR利用Transformer结构的自关注机制对每个对象进行编码,依靠其并行性,构建端到端的检测模型,避免了以前模型中各种类型的冗余操作,使对象检测问题更简单。
既然两者都有各自的优势,为什么检测机器人的视觉工程师通常使用YOLO算法?
YOLO发表的原始论文是实时目标检测的突破,它仍然是实际视觉应用中最常用的模型之一。它将检测过程从两到三个阶段(即R-CNN、快速R-CNN)转变为单阶段卷积阶段,在准确性和速度方面优于所有最先进的目标检测方法。随着时间的推移,原始论文中的模型架构发生了变化,增加了不同的手动设计来提高模型的准确性。
DETR(Detection TRansformer)是Facebook AI Research(FAIR)的研究人员于2020年推出的一种相对较新的目标检测算法。它基于Transformer架构,这是一个强大的序列到序列模型,已被用于各种自然语言处理任务。传统的目标检测器(即R-CNN和YOLO)很复杂,而DETR架构很简单,由三个主要组件组成:用于特征提取的CNN骨干网络(即ResNet)、Transformer编码器解码器和用于最终检测和预测的前馈神经网络(FFN)。主干处理输入图像并生成激活图。Transformer编码器减小了信道大小,并应用了多头自关注和前馈网络。Transformer解码器使用具有N个对象嵌入的并行解码,并使用对象查询独立的预测框坐标和类标签。
通过上述比较可以看出,YOLO在完成检测任务方面优于DETR,速度快,实时性好,精度高。这一优势对于检测机器人来说非常重要。
NavBot机器人开发团队根据实际情况开发了适用于各种场景的自主算法。基于卷积神经网络深度识别算法,选择目标点的准确率大于96%,使检测机器人在操作过程中能够实时上传检测数据,耗时短,识别能力强,也适用于旧设备。
NavBot机器人以技术创新为核心驱动力,其研发团队拥有数十年的行业经验,致力于智能检测机器人领域的不断创新和突破。公司成立了一支高效创新的技术团队,核心团队成员深入参与视觉智能分析、自然语言处理、定位和导航等领域。
经过多年的发展,我们的客户群覆盖了国家电网、中国能源集团公司、中国石油天然气股份有限公司、主要水务管理集团、中国农业银行和中国移动等大型企业。我们为一百多家合作伙伴提供了计算机房、配电室、变电站、煤炭运输走廊、地下走廊、油气化工厂站场等场景的智能检测解决方案,拥有丰富的行业实施经验。