无论如何,谁愿意看到你的孩子玩 iPad 的整整两分钟?计算机科学博士生赵斌声称他甚至从未看过自己的录像。“我的手机上有很多视频,但现实情况是,我几乎从未回头看过这些视频,”他告诉《大众科学》 。“主要原因是视频本身可能长达五到十分钟。” 赵和他的导师、卡内基梅隆大学的 Eric P. Xing 想出了一个有趣的解决方案。他们创建了一种算法,可以识别视频中无聊的部分并将其剪辑掉。最终产品就像是一个小小的精彩片段。用户甚至可以指定他们想要的片段长度——比如 30 秒。更容易理解。“我们的动机是人们不想看原始视频,”赵说。 赵和星并不是第一批尝试自动识别视频中有趣或重要部分的计算机科学家。许多研究人员和公司正在努力开发软件,以便在监控视频中发现正在发生的异常活动。至少有一家公司表示,它出售一种可以做到这一点的系统,但研究仍在进行中。一个重要场景识别程序也可能是社交媒体公司的福音:想象一下,能够制作精简、简洁的视频与你的互联网朋友分享。 “我们的动机是人们不想看原始视频。”新算法的工作原理是创建一个“字典”来解释它在处理视频时看到的内容。然后,它会时不时地问自己:“我能用我的字典解释现在发生的事情吗?”如果答案是否定的,这表明视频中正在发生一些新的、令人兴奋的事情,所以算法会记录下来。算法不需要看完整个视频就可以开始整理精彩片段。这与赵和星使用的编码技术一起,有助于算法更快地运行。 赵立坚表示,他的新算法速度异常快,在选择摘录场景方面与人类相似。它可以在一到两个小时内处理一段一小时的视频,而科学文献中发表的类似算法则需要 10 到 20 个小时。为了测试算法是否像人一样选择“有趣”的场景,赵立坚和杏要求三个人观看视频,并从视频中选择要突出显示的片段。然后,计算机科学家检查了人类和算法的选择有多接近。在 20 个个人视频中,有 18 个视频的赵立坚和杏的算法做出了比他们测试的其他三个竞争算法更像人类的选择。两人还检查了五个安全类型的视频,例如人们进入地铁站等场景。他们发现他们的算法和另一个算法的表现优于其他算法。赵立坚本周将在电气和电子工程师协会主办的一次会议上展示他们的研究结果。 赵先生现在计划创办一家名为 PanOptus 的初创公司,将他的软件商业化。PanOptus 的 iPhone 应用程序和 API 正在开发中。 看一下 Xing 儿子的视频中算法的具体工作原理: |
<<: 哈雷戴维森推出了一款真正的 LiveWire,也被称为其首款电动摩托车
《X级禁闭》——深夜恐怖与解放的故事《禁闭区等级X》于2024年9月7日开播,是一部深夜短篇动画,因...
有可能。耶鲁大学进化生物学家理查德·普鲁姆说,树栖假说已经存在多年了。研究人员猜测,生活在树上的三叠...
《小魔女Doremi#》——讲述利用魔法的力量成长的少女们的故事《小魔女Doremi#》是一部由东映...
您一定不会错过近期快速崛起的生成式人工智能聊天机器人,越来越多的此类应用程序向用户敞开大门,并进入我...
从山区高处俯瞰的景色可能令人惊叹、壮观,但如果您弯腰驼背、气喘吁吁、恶心、头痛,那就不好了。高原反应...
炸猪排 DJ 阿吉太郎 - 炸猪排 DJ 阿吉太郎概述《炸猪排 DJ 上太郎》是一部改编自一飘和小山...
人们会认为,人类中最强壮的成员大多是顶尖运动员。如果你追求的是特别强壮的手臂,那么大学赛艇运动员(她...
每年,由洛杉矶车展策划并为其举办的设计挑战赛都会要求汽车行业最先进的设计实验室推测汽车持续发展的未来...
托托托的歌 - 大家的歌的魅力和历史《托托托的歌》是1966年2月在NHK教育电视台(现NHK E-...
《影湾》:一部描绘怪物与人类恐怖的独特动画《KAGEWANI》是2015年播出的电视动画,是一部描绘...
以下是萨姆·基恩所著《凯撒的最后一口气:解读我们周围空气的秘密》的摘录。 1852 年 12 月,查...
进出你家的信息流已经变得和电或水一样重要,如果奥巴马总统如愿以偿,它们将得到同样对待。今天,美国首席...
花与蝶 - 花蝶 - 诉求与评价1954年上映的动画短片《花与蝴蝶》以其独特的故事情节和丰富多彩的视...
遗憾的是,露天汽车电影院正在缓慢而痛苦地走向衰亡,但如果您拥有合适的设备,您可以在自家后院创造绝佳的...
加利福尼亚州帕萨迪纳——周日晚上,管理人员和工程师们列队走进礼堂,庆祝他们在另一个星球上完美着陆,他...