Netflix跌跌撞撞的成长之路(中)

Netflix跌跌撞撞的成长之路(中)

图为 Netflix 创办人 Reed Hastings,图片来源:Flickr

Netflix 跌跌撞撞的成长之路微妙的 Netflix 与 Amazon

Hastings 和 Hunt 在过去 25 年间断断续续的有过合作,他们最初是在为油田技术服务公司 Schlumberger 的调研部门工作时结识的。据 Hastings 的说法,Hunt 负责 Netflix 所有的技术,「技术上基本都听 Neil 的」,他说道,「该不该改善某项技术,都是由 Neil 来判断。并不是我认为什幺东西好,他就一定会答应去做。」

不过据 Netflix 的工程师回忆,其实 2008 年技术框架当机之后,Hastings 事实上主导了好几场技术会议。他不断强调这些技术事故如果不是发生在邮寄服务上,而是发生在串流视听服务中,那幺带来的就将是毁灭性的打击。

后来,随着 Netflix 串流影音服务使用者不断成长,Hastings 意识到 Netflix 需要更强大的运算能力,他有两个选择——一是组建一批精英工程师的团队,建立 Netflix 自己的云端运算中心,就像 Google 和微软做的那样;另外一个选择则是,把一切计算都交给云端服务供应商。

Hastings 恰好是 Amazon 和微软董事会的成员,于是 Netflix 开始试用 Amazon 和 Microsoft 的云端服务,到了 2009 年,Hastings 最终决定把赌注押在 AWS 上。但在此之前,Netflix 还从未把如此重要的技术放到 Amazon 系统过,所以 Hastings 给 Jeff Bezos 写了封信,言明了自己的计划。

「我问 Bezos 他是否会对我的计划感到不快」,Hastings 说,「如果他会的话,那我没有任何理由继续我的计划。」不过, Bezos 爽快地同意了。

和 Amazon 合作后,Netflix 几乎时时刻刻都会用到 Amazon 数据中心一万到两万台的伺服器,这些电脑需要控制使用者资料的储存、影片推荐、数位版权管理、影片文件转档以及控制不同系统中的播放效果。最新的 Xbox 或者 Samsung 智慧型手机面市之际,Netflix 还需要额外的伺服器来转换影片格式,以保证这些新装置上的使用者可以正常观看影面。所以每个白天,伺服器得忙着串流影覑的传送分发,而到了晚上,这些伺服器又得转身变为数据分析的电脑。

Netflix 几乎把 AWS 的功能发挥到了它的极致。「我们对 AWS 的利用比 Amazon 零售部门自己的人用得还要好,」Netflix 的云端架构师 Adrian Cockcroft 说,「我们十分确信这一点。」

放眼望去,行业里可能再没有什幺比 Netflix 和 Amazon 之间更複杂更微妙的关係了。一方面,Netflix 是 Amazon 最大的客户之一,它为此获得了优惠的报价以及和 Amazon 顶级工程师直接沟通的权利,每当 Netflix 需要一项什幺新的软体功能时,Amazon 都会很快为 Netflix 做好,当然这些新功能也惠及了其它一些 Amazon 的客户。「毫无疑问,在和 Netflix 的合作中我们的平台变得更强大、功能更完善了。」Amazon 云端事业部的负责人 Andy Jassy 说道。

由于 Netflix 依赖 Amazon 的资料中心,所以 700 位 Netflix 工程师必须不断开发软体工具,让数以千计的云端伺服器可以自动启动并且完成配置。在硅谷,人们还为 Netflix 用来测试系统恢复能力的应用程式取了一系列外号,简直可以组成一个「猿猴军团」了。比如人们把随机关闭一下服务以模拟小当机的应用称作 Chaos Monkey,而把会关掉整个数据系统的应用称为 Chaos Kong。

后来诸如 eBay 和 Intel 都开始在自己的云端运算系统里运用 Netflix 开发的这些工具。欧巴马选举时的云端运算架构也同样得益于此。负责选举背后数据架构的 Scott VanDenPlas 提到了 Netflix 一个叫 Asgard 的软体工具,这个系统管理应用可以自动寻找伺服器群组,并把需要执行特殊工作的软体配对过去,让工程师本来需要几个小时甚至几天的工作在几秒内完成。

「这个工具为我们节省了很多时间,同时也帮我们加快了决策的速度。」VanDenPlas 说,当 Sandy 飓风在选举前两週席捲美国时,VanDenPlas 及时把 Obama 选举的基础框架从 Amazon 东海岸的数据中心转移到了西海岸的系统中。「如果没有 Asgard,我们根本无法做到如此快速的反应,Netflix 开发的这个工具让我们的执行效率获得前所未有的提升。」

Hastings 与他的员工

你看到的 Hastings 通常会在两种极端的状态间切换:不是专心致志兴致勃勃,就是闲散随意不屑一顾。当他讨论他在意的事情时,他会显得无比精力旺盛,而对其它事情则几乎置

之不理。他说他没有参与过 Netflix 总部的设计,只在办公设备都布置好了的时候才走进去逛了逛。「这就表示设计方面的事情不是我关注的,」Hastings 说,但如果你想跟他聊诸如分布式标籤资料库或者关键值储存的优势等等现代电脑科学技术,他会和你很有话说。

Hastings 有着非常 geek 的一面。2005 年 12 月,Hastings 确信 Netflix 的评分系统可以为使用者喜好预测系统提供所有必需讯息,而公司内部的其他人则坚持认为光靠评分系统是不够的,还需要其它参考指标,比如使用者点开影片和终止播放间的时间间隔,比如使用者在搜寻哪些明星等等。Hasting 不服气,就把他圣诞假期的两週时间都花在了撰写 Excel 表格上——他要基于百万用户的评分写一套可以打败其他工程师认可的推荐算法。

事实证明,他输了,但却激发他设立了「Netflix 奖」,以 100 万美元的奖金鼓励个人或团队来完善评分系统的算法。这个奖项为 Netflix 赢得不少关注度,因为最后 Netflix 把奖项颁给了一支由独立工程师组建的团队,他们为 Netflix 打造了一个更好预测引擎。而这次活动让凭藉 D VD 邮购服务闻名的 Netflix,第一次以创新殿堂的形象崭露头角。

因为 Netflix 在电脑科学上的成就,以及硅谷最高的薪酬,现在的 Netflix 已经可以招到它所想要的任何一位工程师。Netflix 的管理者们每个月都会调查一下硅谷的薪酬水準,然后为自己的员工提供高于这个水平 10% 到 20% 的工资。甚至那些被炒鱿鱼的员工也能拿到丰厚的酬劳——这样老闆在开除员工的时候就可以少些罪恶感了。

说到招募,Netflix 还有一个特殊的倾向——独锺年长者,而非年轻工程师。「我们雇用的工程师几乎都到达了成熟稳重的年龄,」Cockcroft 说,「在把他们招募进来之前,通常先让他们在 Google 历练五年。」我在 Netflix 总部转了一圈,亲眼证实了这一点。Netflix 工程师们的办公环境几乎是硅谷上世纪的格局,高高的隔板把每个人的工位围成一个半封闭的小方块,而今天的硅谷早就採用开放式的设计了。

Netflix 办公室唯一还算符合潮流的一点是:浴室门上贴着经典娱乐节目的装饰画,而 Netflix 的会议室是用影视节目来命名的,玻璃墙上还写着

一两句经典台词。比如某次会议是在墙上标有「我不认为我正在失去它,Bob」台词的「Office Space」会议室里进行的。

Netflix 跌跌撞撞的成长之路