铜灵 发自 凹非寺
量子位 出品 | 公众号 QbitAI
评论区的AI水军,可能已经让你防不胜防了。
科技博主Justin Y就自制一个能自动生成评论的水军AI,根据油管上视频的标题,AI能够生成一连串相关评论。
小哥还将这个应用的Demo和开源代码放了出来,下载后还能自己感受。
发布短短一天,这条介绍视频就在油管收获了800多条评论,网友评论:你的生成机器人真实得让人害怕!
轻轻一点,假评论马上就来。
以假乱真
如果不摆明告诉你这是AI,不仔细看,这枚水军还有以假乱真的潜质。
语句中夹杂了一丝丝的幽默感,配上常用的表情符号,以假乱真没有问题。
比如,假定视频标题为无厘头风的Thanos and shrek are the same character(灭霸和史莱克是同一个角色),确定,AI马上生成一连串评论。
从没听说过整部电影。
像这样,我甚至不知道这部电影听起来是什么样的。
一旦灭霸拿下了半个宇宙……
根据题目,AI自动联想到了电影,并能根据电影话题进行下一步评论。
如果输入视频标题为“最糟糕的说唱(官方音乐视频)”(literally the worst rap [Offical Music Video]),AI水军将会生成怎样的评论呢?
即便如此,我真的觉得这个挺搞笑的。
我永远无法与这个匹敌。
AI水军看起来还蛮谦虚的。
再来一组例子,如果输入“博弈论:马里奥其实是个蜥蜴人”,会发生怎样的神奇反应?
想象不出在这个世界里将发生什么。
最终,这个理论是一个笑话。
我觉得他是制造这个的人。
虽然AI生成的评论有时会出现“大脑洞”,但整体效果还OK,还能从多个不同的角度给出评论。
循环神经网络加持
打造这样一个AI水军,需要用到哪些方法?
小哥哥表示,从识别视频标题到生成逼真评论,中间只差一个循环神经网络。
通过油管自带的数据API,可以下载大量的视频名字和下面的用户评论,这些数据可以用来的训练数据。
开始训练前,记得先清洁数据,不要担心耗时太长,干净的数据对于模型的训练帮助很大。
小哥哥是用词嵌入的方法预测评论中的下一个单词是什么,并且需要教会模型理解标题表示了什么含义。
最后,通过循环神经网络架构,下一个最有可能出现的词组就确定了。
传送门
Github地址:
https://github.com/HackerPoet/YouTubeCommenter
如果你是windows的64位系统,还可以下载Demo来玩。
下载地址(需要科学前往):
http://t.cn/Eo66Vr0
视频网站的弹幕,也可能不是人类写的了。