深入了解 TikTok 看似无所不知的算法

深入了解 TikTok 看似无所不知的算法

自 2016 年首次推出以来,TikTok 每月用户量已超过 10 亿。其成功的关键在于其令人上瘾的滚动和无休止的视频流,这些视频似乎就是专门针对你的。很长一段时间以来,人们一直在想,字节跳动旗下的这款微视频分享应用收集了哪些用户数据,以了解如何为这台内容机器提供内容。现在,我们离答案越来越近了。

周日, 《纽约时报》记者从 TikTok 北京工程团队获得了一份内部文件,该文件解释了点赞、评论、观看时间和分享如何输入到推荐算法中,然后该算法评估视频对特定用户的吸引力。此外, 《纽约时报》看到的一张截图暗示,内容审核团队可以看到你发送给朋友或私下上传的视频,这暗示了更深层次的个性化。

《纽约时报》写道,这种算法的简化分解“揭示了该应用的数学核心,也让我们深入了解了该公司对人性的理解——我们对无聊的倾向、对文化线索的敏感性——这有助于解释为什么这款应用如此难以放下”。但它也强调了算法如何将你引入有毒内容的陷阱,“可能导致自我伤害”。

这些新细节基于《华尔街日报》今年早些时候的一项调查,该调查使用了 100 个自动“机器人”账户来记录个人在 TikTok 上的体验从各种流行的主流视频到更有针对性、更符合个人兴趣的内容的转变。例如,《华尔街日报》将一个对政治感兴趣的机器人编程为最终向其投放了有关选举阴谋和 QAnon 的视频。TikTok 的一位发言人反驳了《华尔街日报》的报道称他们的实验“不能代表真实的用户行为,因为人类的兴趣多种多样。”

[相关:为什么 Spotify 的音乐推荐总是如此准确]

根据《纽约时报》看到的文件,基于用户活动对视频进行评级的公式通常考虑了点赞、评论、播放次数和观看视频的时间等因素。其中还有一个公式,可以计算出个人创作者对观众的吸引力。《纽约时报》报道称:“推荐系统会根据这个公式对所有视频进行评分,并向用户返回得分最高的视频。”

库存问题

最终目标是提供一系列内容,最大限度地延长用户在应用上花费的时间,并让他们不断回访。但 TikTok 工程师意识到,如果他们只向用户提供一种类型的视频,该用户会感到无聊并离开该应用。为了解决这个问题,他们提出了两项​​算法补充,即向用户展示更多来自他们认为你喜欢的创作者的视频,并对具有相同标签的视频设置每日限制。他们还考虑在“为你推荐”标签中提供多样化推荐,将你可能喜欢的内容与你平时可能不会看到的内容穿插在一起。

“基本的想法是,他们希望页面能吸引眼球。你希望人们使用你的产品,”纽约大学社交媒体与政治研究中心联席主任乔舒亚·塔克 (Joshua Tucker) 说道。

“我认为 TikTok 的独到之处在于,它有一个界面,你可以直接联系你的粉丝,或者你可以说,TikTok,给我看看你认为我想看的内容,”塔克说。通过这种方式,TikTok 解决了塔克所说的“库存问题”,这个问题困扰着 Facebook 和最初的 Twitter 等平台。机器学习现在允许应用程序处理大量数据并推断个人偏好,而不是向每个用户提供相同的基本内容选项。除了你的偏好之外,平台还希望了解你的互动可能会如何根据你的网络发生变化。例如,你会因为你的朋友在看内容而查看它吗?

[相关:社交媒体确实让我们在道德上更加愤怒]

Facebook 的局限性在于,除了广告之外,它只会显示你关注的朋友和页面的帖子。而长期以来,Twitter 只显示你关注的用户的推文。“如果你注意到 Twitter 上最新的内容,即这些‘主题’,就会发现它们正在解决库存问题,”塔克说。“它为你提供了一种获得更多库存的方式,这意味着他们可以尝试更多的东西来了解你喜欢什么。TikTok 从一开始就通过‘为你推荐’做到了这一点。”

TikTok 的人工内容版主负责处理计算机算法难以分类的有争议的内容。根据 Netzpolitik 获得的一份泄露文件,他们可以删除内容、限制观看视频的人,并阻止视频被推荐或进入推送。随着 TikTok 审核系统日益自动化,如果创作者认为他们的视频被错误删除,他们可以向人工内容版主上诉。

TikTok 对您的了解有多少?

塔克认为,TikTok 之所以能如此迅速地了解你的品味,或许是因为他们拥有更多关于你可能喜欢什么的数据。

去年 6 月,TikTok 罕见地披露了其推荐算法的工作原理。该公司在一篇博客文章中写道,系统会权衡用户互动(点赞、评论或关注帐户)、视频信息(字幕、声音和主题标签)以及帐户设置(语言偏好、位置)相关的数据,以计算用户的兴趣。

[相关: YouTube 为何隐藏视频上的不喜欢内容]

尽管 TikTok 声称使用点赞、评论和分享作为衡量你对特定内容参与度的指标,但《华尔街日报》发现,该应用分析的最重要的元素是视频的观看时长——你是立即点击离开、暂停还是重新观看。数据科学家 Guillaume Chaslot 在回顾他们的实验时告诉《华尔街日报》,该算法可以看到你的反应,并能快速找出“你容易受到攻击的内容,这会让你点击,让你观看,但这并不意味着你真的喜欢它,也不意味着它就是你最喜欢的内容”。《华尔街日报》称,随着用户的信息流越来越小众,他们更有可能遇到审核人员审查较少的有害内容。成为一个问题,因为 TikTok 的用户群往往比 Facebook 或 Youtube 等其他社交媒体平台更年轻。

持续审查

自从 Facebook 举报人 Frances Haugen 在国会作证称,这些网站将参与度置于安全性之上,可能会放大危险的错误信息,此后网站的推荐算法就受到了越来越多的关注。立法者对此作出了回应,讨论了可能的监管变化,要求采用这些算法的平台对推荐内容可能带来的危害负责。

在研究 YouTube 的推荐算法时,塔克一直想知道,到底是算法引导你观看特定内容,还是人们的个人选择决定了结果。“无论如何,如果这些平台上的内容有助于美化儿童自杀,那么无论你通过什么方式看到,这些内容都不应该出现在那里,”塔克说。

[相关:国会正在为大型科技公司出手——原因及方式]

TikTok 表示,它一直非常谨慎地删除违反其规定的内容(包括自残内容)。该公司过去曾表示,它使用计算机和人工相结合的方式审查其内容。但错误还是会发生,有时视频会被错误标记,或者漏掉过滤器。

9 月,TikTok 在一份新闻稿中表示,该公司将推出新的“健康指南”,为通过该平台分享个人经历的用户提供支持,并提出负责任的参与技巧。该公司还宣布将扩大搜索干预措施,以便在用户搜索令人痛苦的内容时更好地提供危机支持资源。

“这对这些公司来说是一个真正的挑战,因为它们的规模太大了,”塔克说。“TikTok 发展得太快了。Facebook 也出现了这种情况:它发展得太快了,以至于没有意识到不同语言正在发生的危害。”

<<:  如何在一切事情上屏蔽某人

>>:  这些滑翔无人机可以将空军飞机上的补给运送到战场

推荐阅读

《奇妙的龙之湖传说》的魅力与评价:深入探究传奇动画

世纪末传说 奇妙龍之湖乐园 - 世纪末传说 奇妙龍之湖乐园概述《奇妙的龙之湖乐园:世纪末的传说》是T...

遥远太阳系中的彗星如何将海洋带到系外行星

两台太空望远镜对彗星进行的两项新研究表明,其他行星也可能形成海洋。天文学家首次探测到一圈冷水蒸气环绕...

使用这些临时防水布遮蔽处,保持温暖和干燥

本文最初刊登于《Field & Stream》。经过仔细考虑,我们必须问自己应该带哪些物品来...

如何将手机用作网络摄像头

市场上有一些不错的廉价网络摄像头,但你可以自己动手,用手机代替。这需要一点设置,但现代智能手机无需额...

进化使蚊子变成了隐秘而敏感的吸血鬼

经 Firefly Books Ltd. 许可,改编自Erica McAlister 所著的《The...

当手机电量达到 80% 时,你可以(也应该)停止充电

睡前给手机插上电源,让它通宵充电,是许多人每晚的例行公事。但实际上,如果你每次充电时都不达到 100...

逆转世界的电池女孩——全面回顾原著设定和感人故事

逆世界的电池少女概述《逆转世界的电池少女》是一部电视动画,于 2021 年 10 月 11 日至 1...

以 9.99 美元的价格获得 2 个月的 Xbox Game Pass Ultimate

如果你是一个热爱电子游戏的人,你并不孤单。每个人都可以从拿起控制器并享受乐趣中受益。然而,电子游戏似...

购买此专家指导的 IT 和网络安全培训套餐可节省 150 多美元

通过 Iducate 提供的完整 2023 年 CompTIA 课程超级套装,获得由专家指导的网络安...

夕颜之里:重新评价大家动人的歌曲

《夕颜之里》:这部NHK短篇动画的魅力与背景《夕颜之里》是1979年8月在NHK教育电视台(现NHK...

《咕咕干嘛》评论:独特的世界观、动人的故事

《Googoo Gunmo》:一场充满梦想和冒险的搞笑旅程■ 公共媒体剧院■ 原创媒体漫画■ 发布日...

所有早期人类的“祖父”在地球上行走的时间比我们想象的要长得多

我们的远古表亲之一直立人,两百万年前开始在世界各地定居——从非洲迁徙到亚洲和欧洲。这些古人类是人类最...

物质是什么?它并不像你想象的那么基本。

宇宙中略少于三分之一(约 31%)的物质是由物质构成的。一项新的计算证实了这一数字;天体物理学家长期...

《MIDNIGHT EYE Goku》的魅力与评价:体验赛博朋克的世界

《午夜之眼悟空》:赛博朋克的巅峰与寺泽武一的世界观1989年发售的OVA《MIDNIGHT EYE悟...

我们的太阳另一侧可能隐藏着一颗行星吗?

太阳可能看起来像一个相当大的银河系盲点,但我们已经设法瞥见它的后方,那里没有任何东西可以阻挡另一个地...