更新时间:2021-09-30 04:25:21
计算机视觉已经取得了很大的进步,但在匹配人类感知精度方面仍然面临挑战。
Open Images是约900万张图像的协作版本,这些图像由图像级标签、对象边界框、对象分割遮罩和视觉关系进行注释。这个独特的大而多样的数据集旨在激发图像分析和理解的最新技术进步。
目标探测轨道
在这个挑战轨迹中,您将被要求预测对象实例周围的紧密边界框。
训练集包含170万张图像上500个类别的1220万个边界框。这些盒子主要由专业的注释人员手工绘制,以确保准确性和一致性。图像非常多样,通常包含具有多个对象的复杂场景(平均每个图像7个)。