更新时间:2021-10-17 02:54:04
布里斯托尔大学的计算机科学研究人员发布了EPIC-KITCHENS,这是在四个城市的32个厨房拍摄的。这些电影包括1150万张图片,40000个动作示例和500000个对象的注释。这个开创性的数据集将有助于机器学习和改善第一人称视角,从而改善机器人技术、医疗保健和增强现实。
EPIC-KITCHENS是有史以来最大的使用可穿戴摄像头的视频数据集,可用于学术研究社区,自动了解日常生活中物体的交互。它旨在推进第一人称视角的领域,从佩戴者的视角以及佩戴者的意图和互动来感知世界。可穿戴视觉被认为是超越手持(例如移动)计算机视觉的下一步。
计算机科学系高级讲师马頔达曼博士说:“由于缺乏大数据,第一人称视觉多年来一直受到阻碍。“EPIC-KITCHEN将允许训练数据密集型机器学习算法。从典型的对象检测到如何定位视频中的对象,再到行为分析和动作预期,它提供了一系列有趣的挑战。”