2013年4月1日,酷6传媒高调宣布,任命陆坚担任酷6网首席技术官。陆坚拥有美国长青藤盟校之一达特茅斯大学工学博士学位、并在其计算机系和加州大学戴维斯分校图像处理研究中心从事博士后研究。因此在酷6,很多人都称他——陆博。
陆坚曾担任盛大多媒体创新院院长,领导开发了一系列先进技术和产品,包括Real2Virtual增强现实技术,文学作品数字指纹和版权追踪系统,以及视频转码及在线视频编辑系统。
陆坚在海外工作很多年,在苹果有八年的工作经历。对于酷6这样一个在纳斯达克的上市公司来说,陆坚这种人才是非常重要的。酷6整个2012年发展战略就是围绕着UGC展开。酷6需要好的内容来源,不断壮大VCU和白金播客队伍。经过一年左右的发展,整个平台的流量和用户数迅猛增长。而对陆坚来说,未来的发力方向将在移动端。
CSDN:您作为酷6的新任CTO对于工作是否陌生?
陆坚:作为一个新的职位,我是上任第一周。但其实之前从2011年7月份我就任命是酷6的首席科学家,之前在盛大创新院时,其实也和酷6的同事一起做过很多的项目,所以酷6对于我来说并不陌生,并不是瞬时空降到这里来的。
图:酷6 CTO 陆坚
CSDN:您觉得以前在国外工作的时候,这些经历和团队氛围和现在有什么不同吗?有没有什么小故事?
陆坚:我给你讲一个,不是在盛大。我在来盛大之前做过一个创业公司,在杭州有一个研发中心,大概有一百人,那是我第一次管理一个中国的技术工程团队。我的体会还是挺深的,中国跟国外不一样。
在团队文化美国那边,多半是新的程序员来了以后先给你一个充足的信任,让你去做一件事,让你表现和展现自己。当然也可以说是领导对你的一种考验,或者看看到底你的水平是怎样。所以一般第一个、第二个项目是很重要的,领导也给了你很大的自由度,时间上也不会对你很苛刻,比如你可以十点来,下午五点就走,但是可能在家一晚上都在做。所以基本上是一种任务式的管理,你能把任务完成就行。
你说两周能做完,两周的时候领导看你的结果。这个是在硅谷那边的方式,考勤上不是特别严。但是以前在杭州那边,我觉得考勤上比较严,但是它的产出不见得高。这个我觉得是一个差别。
在文化上,我曾经和一些中国的管理人员交流过。总结出来这是一种哲学冲突:你是先给信任,还是先让他表现。在国外都是先给信任。如果你说两个礼拜要做出东西,但是总不能达到你的目标,你的经理就问你,你哪里需要帮助?问问你是怎么做的?实际上是想帮助你如何调整。
中国这边,一开始就有非常严格的考勤制度,你这个人可能过了三个月、六个月以后表现得很好,领导觉得你值得信任,然后再说时间可以灵活一些。信任是怎么来的?两个原因都有。有人说:我给了你这个信任!而有人说:这信任你是赢得的。所以这个信任是先给予,还是要让你自己通过工作和努力来赢得?我觉得这是中国和美国的管理理念不同之处。
CSDN:酷6有许多技术人才,聚焦到移动应用这边,您的团队怎样规划的?
陆坚:我们是一个非常精干的团队,同其他公司里面技术产品团队大致是类似的,有工程师,有产品经理,有UI设计。移动端我们现在还是专注在两个平台,Android和iOS,但是我们也非常重视直接的Web端,为移动设备做的网页端。
Web可以支持一些我们现在还不支持的设备的平台,比方说Windows Phone、Blackberry等。从我们目前数据上来看,用移动设备访问和观看内容是一个重要的渠道。因为有很多SNS、微博这种社交媒体转发。如果在移动设备上,或者是第三方的应用里面,看到一个视频链接。你去点击的时候,它是不会打开酷6的原生应用,而是会打开浏览器播放,这个就决定很多观看还是通过浏览器在看。实际上Mobile Web版本是给移动设备优化的,从分辨率、导航到用户体验。
CSDN:您觉得现在国内视频网站,技术层面是一个怎样的状态,您可以对其他的网站和酷6本身做一个点评吗?
陆坚:其实视频网站最早可以追溯到2005年、2006年的时候,Web2.0视频开始,其实酷6也是那会儿创建的,在国内几家包括土豆、优酷差不多都是同样的时期。到现在,网络视频首先是一个流媒体,属于视频流技术。之后慢慢完善,有了内容分发系统。在未来,通过边缘的节点来做视频服务是这个行业的趋势。
但到了移动互联网,就是另外一个故事了。移动上的流媒体的播放,由于移动带宽的限制,其实很像互联网视频初期。因为现在的带宽名义上有上百KB,但事实上,用户体验可能比当时56K的猫不见得好多少。所以在移动这方面的内容分发加速,在技术上还是一个挑战。
CSDN:现在有很多长视频类的移动应用,从技术角度讲,长、短视频的分发,哪个更难?成本如何?
陆坚:短视频看起来很简单,其实不然。长视频版权买来后,只要在各地的服务器做分发拷贝,就能确保就近读取这些高清视频,并能够迅速加载。
但短视频不同。可能上海拍了一部禽流感的短视频,而在新疆的用户非常关心想打开看。这种不可预见性特别大,如何去做好短视频的分发,来确保它既能高清又能快速地下载是非常难的。
UGC运营的成本在存储和分发上比长视频要高。长视频如果有一百个电视剧,实际分发的时候是把它复制到互联网边缘的各个节点。但酷6的短视频是几千万数量级的,如果这些东西如果都要拷贝到这上面,存储和分发的时候实际上代价是比长视频要高。但从另一方面做UGC少了版权成本,不用去买大片版权,所以总体来看差不多。
CSDN:酷6用什么视频编码格式?网站和移动端是否不同?
陆坚:你说的这个是比较专业的技术问题,在网站上的技术在几年前,从2006年开始,其实也是得益于Flash,比较统一,浏览器里可以直接播放,所以这也是当时视频分享起因。这么多年基本上是Flash的格式。在最近过去几年,虽然核还是Flash,里面变成了H.264的视频和AAC的音频。现在因为在移动的设备上,像iOS是不支持Flash的,所以慢慢在向MP4演变。我们现在,网站上还是Flash,移动上都是MP4。
MP4里面的视频编码都是用H.264,音频都是AAC,所以这两个在视频转码的时候是最费时间的。Flash是一个文件格式,MP4也是一个文件格式,把视频和内容包在里面,如果是已经编码成这两种了,只是换个壳换一个包装基本上是没有什么代价的。
当年Adobe在流媒体服务器就用的是Flash技术,但是iOS设备是不支持Flash的。此后Adobe在2011年,推出了新版服务器就可以动态地检测,如果知道这是一个iOS的设备,会动态将Flash转成MP4,再送给请求的设备。所以现在包格的式方面还是Flash和MP4都有,但是里面的视频和音频的格式基本上是统一的。
CSDN:UGC这些用户每天产生大量的内容,酷6网整个在后端云计算的平台上是怎么进行管理的?比如说视频分发,这些内容会存在哪里,会有多少备份?
陆坚:从整体视频来看,所有的网站其实都是一样的,从上传开始,会经历一个上传处理,通常转码成一个标准的格式。内容审查同步进行,通过后在页面上用户就能看到。之后也会把它放在分发系统里,拷贝到分发的节点上面。
分发管理系统是非常智能的,它会根据观看的次数增加分发节点。此后过了两三天,这个视频热度下去了,它又会从那个节点上淘汰。因此UGC的视频分发技术其实是比做长视频要更复杂。
CSDN:酷6在用户行为分析方面怎么作的?
陆坚:我们把以前是人工编辑推荐变成了机器的系统推荐,通过机器智能用户行为的挖掘来做出相应的推荐。通过这种方式,点击率增加了20%。在新的推荐版块要上线的时候,先做AB测试,一开始的时候同样的呈现,所有的用户过来的时候,有10%的人让他看这个新的,还有90%的人用原来的旧页面。比例慢慢会变到各50%。网站可以在这样的配置下面跑一个礼拜,我们可以看得非常清楚,A和B点击率有什么差别。这可以直接来促进我们产品在用户体验上的改进。这是一种量化的方法。现在很多产品改进都是通过这样的数据来决定的。
推荐有两种,有一种是知道你喜好什么给你推荐什么。还有一种,是让我发现更多。所以有一些热点或者是上升最快,实际上是推荐发现的有趣内容。所以我们会在推荐系统里面和个性化推荐结合在一起,知道你对一些东西感兴趣,再给你拓展兴趣的一个发现过程。
CSDN:怎么看待“编辑推荐”和“机器推荐”?
陆坚:这两个并不相互排斥,在酷6视频右边的相关视频推荐版块,会给一个推荐理由,这个理由极有可能来源于机器的挖掘,觉得这可能是一个很热门或者是上升很快的。也有可能来源于编辑强力推荐。我们的数据源既有编辑的智慧,也有机器的挖掘,这两个并不矛盾。
CSDN:未来会有新的app推出吗?
陆坚:今年还会推出拍摄的产品“酷6拍客”这是基于创新院原来做的微酷。是为一些喜欢拍的用户设计的。里面除了拍摄还有编辑的功能。创新院之前八个专利里面有几个是在线和手机上做视频编辑这方面的。所以这款应用我们也相信它会是一款最好的拍摄软件。但是整体来说,视频这个行业观看的人,大大多于拍摄和上传的人。
CSDN:是否有想过开放一些API,让其他的用户也来调用UGC的资源和能力?
陆坚:我们确实想过这个事情,原来盛大云做的视频云服务,一部分是建站。第三方网站如果想建一个网站,我们提供一套SDK,他可以非常快地在几分钟内建立一个视频网站。而这个视频网站的内容是来自酷6的,我们可以供他选择不同的频道,不同的视频。在他的网站里面就可以开辟一页专门提供视频服务的。域名完全是可以第三方的,广告我们是可以跟他分成的。这样的东西我们也想做一个移动的。
CSDN:现在视频应用的这些滤镜,是如何开发出来的?或者说这些视频的滤镜是有一些公司有特别的专利吗?
陆坚:其实没有专利,比方说像我们在微酷里面有几个滤镜,有一个叫老电影。很多拍照应用也有,把它弄黄一点,然后有点胶片的杂质这样的东西,这属比较简单的滤镜,容易做的。还有一些是效果,比方说两段接起来的时候有一个变换的过常这些都没有专利,但是这些在技术的实现上,视频上肯定比图片有难度,手机比桌面有挑战。
我们的实时预览是比较领先的,在微酷的时候就做到了一点,你一边在拍的时候,影像采集后直接通过滤镜,所以你看到的时候已经是滤过的效果了。这个在技术上还是有很大的挑战的,比方我们就不能直接用摄像头的原生数据,如果用iPhone上的,拍出来是720P高清的,iPhone的机能是做不到实时滤镜。但是分辨率如果降下来一些我们是可以做到的。从产品上讲是找一个数据的平衡点。想要所见即所得,又要帮用户保留高清的影像。
CSDN:未来4K可能是一个新的高清标准,H.265马上出了,可能大屏幕需求更迫切一点,这个对于手机的小屏幕,未来H.265会流行吗?
陆坚:我觉得在一段时间内不会的,每一种标准都会存在一段时间。这是因为当它产业化以后,会有很多设备、硬件都是这个上面的。它的量做得会很大,成本才能降下来。目前H.264的芯片非常便宜。之前像MPEG-2和JPEG为什么相机里都会装?
我给你举个例子,我在苹果的时候也参加做了一个图片的压缩标准——JPEG2000。JPEG2000从压缩比上,要比JPEG要好得多,但是它的成本比较高。首先做这个芯片方案的厂商不是特别多,所以每一枚芯片可能要比JPEG贵十倍,虽然JPEG2000能节省30%的存储空间,但硬件总体成本对比起来可能更亏。
所以像H.265,我觉得它最先找到的市场是4K。其产品定位最高端最高画质,软硬件成本也是比较高。但是中国内地市场,低于1M分辨率,肯定都是H.264的,因为那个芯片非常非常便宜,市场已经有四五年的历史了,下面我觉得至少还能走个五年、十年的。