算法时代到来,工程师能取代人工编辑吗?

摘要

当只有一个人在做某件事情的时候,那可能是探索,但当很多人都在做同一件事的时候,那可能意味着一个新时代的降临。

1471425025-4451-20160817165348250-1541629085

1. 里程碑:算法推送超过人工推送

细心的人会发现,现在随便打开一个视频网站新闻资讯 APP,都会有“个性推荐”或“猜你喜欢”之类的栏目,系统会根据你的浏览记录和好,自动为你推荐内容。

1471425026-4675-20160817165348281-429626080

两年前,这种个性化推荐并不常见,而近来已成为各大渠道的主流配置。

当只有一个人在做某件事情的时候,那可能是探索,但当很多人都在做同一件事的时候,那可能意味着一个新时代的降临。

近日,第三方监测机构易观发布了一个具有“里程碑式意义”的数据:2016 年,在资讯信息分发市场上,算法推送的内容将超过 50%。

1471425024-5597-20160817165348234-1392406917

这成为一个分水岭。它意味着,我们以后接触到的信息,将主要由“智能机器人”为我们准备,而以往看似不可或缺的“人工编辑”角色,则不可避免地被边缘化。

自 2012 年今日头条开启算法分发的尝试,4 年之后,算法时代正式宣告来临。

人类的信息分发模式经历了三种主要形态:专业编辑—社交传播—算法推送。算法模式能不能成为信息分发领域“历史的终结”?

冷战结束后,美国学者福山提出现代民主制度也许是“人类最后一种统治形式”,并因此构成“历史的终结”。以此为喻,算法推送是不是信息分发的最终形态?还会有其他模式挑战它吗?

2. 三张图包含所有秘密

当我们称一个时代到来时,绝不仅是基于一个指标。它应是新主角对关键性资源的“全面接管”。

互联网最重要的三个要素是资本、流量、人才。

1. 资本

先看这张图。

1471425025-7067-20160817165348234-1699740951

这张图显示,不仅各大传统门户客户端加入了算法潮流,BAT 在 2016 年到来时也悉数出手。各种资源开始向算法推送聚集。因此,2016 年成为拐点,并非偶然。

现有资讯分发产品可分为三类:媒体型,倚重人工编辑;关系型,依托社交链传播;算法型,基于算法对信息和人进行匹配。

这三种类型的产品各有特色,各有阵地。不过,眼下的一个大变化是,媒体型产品和关系型产品纷纷纳入算法功能,无形中向算法型产品靠拢。

当搜狐新闻、网易新闻和微信、微博都开始往自身产品功能添加算法时,标志着算法已经成为几乎所有主流资讯分发产品的标配。

互联网升级为人们生活和生产的基础设施,这是互联网时代到来的标志;而算法被设定为资讯分发不可或缺的主要驱动力乃至唯一驱动力,则无疑是“算法时代”最好的注脚。

资本对新趋势最敏锐。可以看到,资讯产品领域,风投的大手笔基本集中在算法类产品。

今日头条C轮融资获得红杉资本领投的 1 亿美元;

一点资讯获得凤凰新媒体的四次投资,总额超过 7400 万美元;

天天快报,腾讯砸下重金以及巨大的流量支持。

艾瑞咨询 7 月份发布了 2016 年中国独角兽企业估值榜。在前 300 强的排名中,“新闻资讯”行业的上榜企业只有三家,其中算法资讯分发平台有两家,分别是排名第 6 位的今日头条和排名 189 位的一点资讯,另一家是排在 121 位的 36 氪。今日头条以 92.3 亿美金的估值,仅次于蚂蚁金服、小米、滴滴、陆金所、新美大等巨头。

1471425027-6380-20160817165348281-1272262302

不久前,甚至有传言腾讯以高达 80 亿美元的估值投资今日头条。虽然消息被今日头条创始人张一鸣否认,但终不免引人浮想联翩:难道腾讯无法用产品来打败对手,最后只能用资本来收购这个“算法分发”的独角兽?

2. 流量

流量之于互联网,犹如土地之于地产商,是价值的来源、一切的根本。

看下面这张图:

1471425024-1456-20160817165348218-1370808339

注:算法类客户端以今日头条、天天快报和一点资讯为样本;非算法类客户端为新浪新闻、网易新闻、腾讯新闻、搜狐新闻和凤凰新闻为样本。数据来源:安卓市场

算法类资讯客户端下载量的增长速度,远远高于非算法类产品,差距多达 2 倍以上。

算法类产品,增长率都在 50% 以上,处于高速成长期。传统门户类产品,则明显感受到了“天花板”,有的只有百分之十几的增长率,这在互联网界与“停滞”同义。

越来越多的用户和流量将集中在算法类产品上。

根据前面提及的易观发布的数据,算法推送的内容今年将超过 50%,完全占据主体地位。

对于流量的准确描述是:流量=用户数X使用时长。

现在有意思的一个现象,传统门户类产品在用户数上还占有优势,但平均使用时长大大落后于算法类产品。

TrustData 发布的数据显示,2015 年 10 月,今日头条平均用户每日打开时长为 41.8 分钟,而网易新闻和凤凰新闻分别是 26.1 分钟和 24.7 分钟,腾讯新闻仅为 19.8 分钟,不到今日头条的一半。2016 年 8 月,今日头条的平均用户每日打开时长已经超过 70 分钟。

使用时间长,意味着给用户的信息,更对胃口,更为精准,更具粘性,一用就停不下来。这是算法类产品抢占流量高地最令人恐怖的地方。

3. 人才

三要素中,钱是最敏锐的,人是最理性的。人才变动是反映趋势的一个重要指标。

1471425033-5397-20160817165349953-221032628

上图是各资讯客户端及视频类网站近期的招聘统计。整体来看,内容分发环节,各大机构对于算法工程师的需求大于人工编辑。

无论是今日头条、天天快报等算法类产品,还是搜狐新闻、新浪新闻等老牌门户,都在重建内容分发的人员结构。占据重要流量的视频类产品,发力更为明显,爱奇艺和乐视招聘的算法人员之多,远超于人工编辑。

收入上,算法工程师月薪起点 25000 元,人工编辑为 8000 元,相差 3 倍。各机构宁愿支付更多的人员成本,一定是算法的方向能产生更高效率。

算法工程师普遍吃香,折射的是算法分发的欣欣向荣。

以上,从资本、流量、人才三个核心资源的流向来看,算法时代来临毋庸置疑。

3. 算法崛起的根本动因

算法为什么会接管信息分发的大权?在于两个关键词:“免于匮乏”与“免于过载”。

人类的信息传播经历了“匮乏”和“过载”两个阶段。

互联网之前的所有媒介形态,就是在解决信息匮乏问题。报纸最初只有一页纸,后来发展到上百个版面皆为常事。从报纸到广播再到电视,更是文字向音频、视频的跨越,信息的丰富程度呈几何级增加,最后网络把这几种形态都囊括其中,集大成。

这一步步的进化,就是满足人们的信息饥渴。免于匮乏,多即是好。

如果以数据单位来描述不同媒介之间信息量的大小,大致是:

1471425036-3165-20160817165348625-383439610

报纸文章是 KB 量级,1KB 大约是 500 个汉字。

广播节目是 MB 量级,1MB 音频节目的数据量约等于 60 万个汉字。

电视节目是 GB 量级,1GB 视频节目的数据量相当于 7.5 亿个汉字。

网站更新是 TB 量级,1TB 约等于 9000 亿个汉字。

这一阶段,媒介演化主要是通过两种方式来追求信息的“免于匮乏”:

  • 增大数量。比如报纸增加版面,电视增加细分频道等。
  • 减少延时。从印刷媒介到电子媒介,事件从发生到传播的时间间隔越来越短,直播更实现了同步。

免于匮乏的需求终于在互联网时代得以实现。信息爆炸,由匮乏转为过载,此时最大的痛点,是如何在海量资讯中过滤出最适合用户的信息。

解决信息过载,出现了三种模式。

首先是编辑分发模式,由专业编辑筛选出重要信息,依序放在网站不同位置。这实际上是传统媒体模式的照搬,只能解决头部信息的问题,无法处理海量的长尾信息,也与互联网“去中心化”相背离。

接着出现了社交分发模式。你的朋友、你关注的人帮你推荐、过滤信息,他们的评论、转发形成了一种信息筛选机制。

社交分民模式最大的颠覆,是大众传播史上第一次实现了“千人千面”。不同的人通过不同的“朋友圈”有了个性化的信息世界。

2010 年 Facebook 主页访问量超过 Google,可以看作是“社交分发”在全球成为主流的里程碑。

随后情况就出现了一些变化。“社交分发”的机制,慢慢出现了某种“退化”。

分析者概括了这种“退化”的几个重要特征:

  • 极少部分组织(比如大V)垄断平台上极大部分的流量,掌握流量分配权;
  • 新兴内容生产者获取流量成本剧增;
  • 用户社交关系爆炸,基于社交关系的推荐质量不断降低;
  • 内容生产源爆炸,信息过滤难度几何增加。

直观来看,就是微信朋友圈中养生、微商、晒娃晒吃类的无效信息越来越多;微博上则是大V和营销类账号占据了主体流量。随着用户社交关系数量的增加,信息过载逐渐加重。单纯通过社交分发并不能解决信息过载问题。

因此,第三种模式算法分发模式出现。根据用户的行为数据进行个性化推荐,试图做到更精准。

Facebook 是主流社交平台中最早开始布局算法推荐机制的。时至如今,机器算法在 facebook 的分发机制中已经非常重要。

1471425042-8102-20160817165350031-1919752231

而最近微信推出“朋友圈热文”,也是引入算法机制来提高信息推送质量。

算法之所以能有效地抵御社交分发机制的“退化”,有分析者认为是因为:

  • 算法对流量的分配独立于社交关系,不被“大号”垄断;
  • 算法能够处理的信息量几乎没有上限;
  • 算法能够对用户的社交推荐机制进行二次过滤,优化推荐结果

正是这些特点,使算法在这两年异军突起,成为信息分发的主流。

在信息分发上,人类对“免于匮乏”的追求,历经上百年,终于在互联网时代得以实现。现在,对“免于过载”的追求还开始不久,在技术的帮助下,用最短的时间找到了“社交+算法”的利器,并在 2016 年成为信息分发史上的拐点。

4. 美丽新世界

算法时代会带来什么变化?

我们不去多谈用户中心的彻底实现、人工分发的逐渐消失、内容创业者的篷勃兴起等人所皆知的事实。我们关注一点:算法时代对“汝之毒,我之甘饴”的重新诠释。

“汝之毒药,我之甘饴”,意味着信息价值的重估。你觉得不感兴趣甚至是垃圾的信息,对于我可能极有价值。

信息不再有统一的标准,不再有绝对的高低之分。对刚生下宝宝的妈妈来说,PM 值绝对比英国脱欧更重要。对旅游者来说,当地的天气信息绝对比当地的房价更重要。

“汝之毒药,我之甘饴”,信息偏好的差异其实一直都存在,只是以前的分发模式无法区分。算法时代,每个人都有了自己的头条,这一点得以实现。整个信息世界大一统的秩序被打破。

这使得长尾信息被极大激活。“两个 PS 教学者的故事”很能说明这一点。

2016 月 6 月起,一位网友在国内某知名视频网站创立了自频道“PS 零基础教学”,上传 PS 教学内容。从视频质量来看,品质在平均水准之上,对 PS 初学者很有帮助。

两个月内,博主上传约 70 个视频,然而,其自频道总播放量竟没超过 600,平均每个视频播放量还不超过 10,订阅者也仅有 4 人。

流量的惨淡无疑给热情的博主浇了一盆冷水。7 月 8 日后,博主停止了自频道更新。

1471425046-7260-20160817165350015-1983790701

有趣的是,在 Youtube 网站上,一位名为“Justin Odisho”的网友今年 3 月份同样创立了一个 PS 教学自频道,在其前两个月的 24 个教学视频,最低的点击量有 541,最高达 4 万。

仅六个月,Justin Odisho 即吸引了超过 6 万名订阅者,总点击量数十万。

1471425048-8290-20160817165350250-594994423

两个 PS 教学自媒体在流量上的巨大差异,有运营时间、内容特点等因素的影响,除此之外,一个非常重要的原因在发生作用——两个视频平台不同的流量分配机制。

国内视频平台以人工推荐为主,长尾内容无法顾及。YouTube 是以算法推荐为主,能把长尾内容分发到需要它的人。

算法机制下,每条信息找到了生命,找到了该去的地方。这构成了一个全新的信息世界。

这其中甚至包括广告。某种意义上,广告只要在正确的时间出现在对的人面前,那么它就是有用的信息,受众不会反感,反而会乐于接受。算法根据用户需求推荐信息,广告也能变成有用的资讯,原生广告的前景值得看好。

5. 历史的终结?

回到文章开头提出的问题,算法来了,这会是信息分发“历史的终结”吗?

目前来看,算法还存在两大问题:

1. 信息源瓶颈

信息分发的效果,与信息源紧密相关:1.数量上,能否抓取到足够多的信息;2.质量上,信息源是否有足够品质。信息源瓶颈不解决,再强的分发技术也会成为无米之炊。可以看到,各个平台正在弥补这方面的短板:将算法从图文资讯扩展到音频视频,试图提升信息的量级和丰富度有了明显提升;与此同时,为了改善内容供给端的质量,各大平台相继砸重金扶持自媒体,奖励优质的原创内容。算法是整个资讯传播生态中的一环,它既受整个生态的制约,但又改变着这个生态。

2. 算法精确性

算法如果精确度不够,由算法来分发资讯同样会导致很多噪音。对算法工程师来说,提高精确性是永无止境的挑战,精确到什么程度?或许能达到读心术的境地。

最后的分发机制或许是这样的:系统囊括每一条信息、每一个数据,同时也分析出用户所有的需求(甚至包括潜在的),在此基础上实现“所有信息对所有人”的分发,在信息海洋中,每个人收到的是自己需要的和应该知道的信息,不稀缺,也不过载。

这是信息乌托邦,也是信息传播的最后图景。

【钛媒体作者:严九元;微信公众号:智谷趋势】

  • 版权声明: 本文源自 钛媒体, 于4个月前,由整理发表,共 4915字。
  • 原文链接:点此查看原文

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: