本篇文章3248字,读完约8分钟

曾子恩:腾讯硬件实验室经验分享 曾子恩介绍了腾讯服务器实验室的三个关键点:建设、管理和运行,以及取得的成绩。在成果方面,他表示,在技术孵化方面,腾讯已经推出高性能虚拟化网卡应用,液冷服务器已经孵化,新的存储介质应用已经在实验室完成了概念验证。已经实施的例子包括25G以太网云主机、云存储池、海量数据迁移设备。

曾子恩:腾讯硬件实验室经验分享

曾子恩:大家下午好。当我们困的时候,我们有点沮丧。

今天的话题是我在腾讯服务器实验室。以前李博给我分配任务的时候,我想说什么?我已经在服务器实验室工作了三年多,所以我想和你分享一下。

这是腾讯服务实验室首次向业界披露一些细节。

我的工作时间不算太长,而且我在这个行业也不是很出名。我借此机会提升自己。我的名字是曾子恩,英文名字是维兹塔曾,我公司的股票代码是00700,来自深圳腾讯科技有限公司。如果你在微信上输了00700港元,你可以通过激活小程序来查看股价趋势。我的职位是腾讯科技集团的系统工程师。

我在腾讯实验室。腾讯服务器实验室成立于2005年,大约在我进入公司的8年前。2017年,信息技术得到了领导的特别批准和扩展。现在,它已经达到30多个机架,在信息技术实验室中占据了相对较大的面积。我们有各种各样的测试环境,除了制造商的基本测试之外,我们还有很多。例如,我们已经有了一些用于快速发展的云技术和质量认证的环境。由于腾讯的服务器研发资源集中在我们部门,每个月大约有50个单项任务,来自不同团队的同事来到我们实验室进行实地测试。

曾子恩:腾讯硬件实验室经验分享

今天我的演讲到此结束,因为我已经完成了《腾讯实验室与我》,但李博不会让我失望。实际上,下一件事是重点。

腾讯服务器实验室目前共有的三个关键点是建设、管理、运营和成果。

实验室可能会觉得每天在里面放设备或者呆在里面很无聊。然而,实验室背后有很多故事,甚至一些离我们岗位最近的操作和维护同事也不太清楚实验室里发生了什么。今天我想和你分享。

首先,让我们谈谈建筑。实验室的建设在我进入公司之前就开始了。今天,我将集中讨论实验室的扩建。今年,我们将响应公司的发展战略,大力支持这个行业。因此,作为云计算中最基本和最需要的部门,我们的服务器硬件部门将与云部门合作,规划实验室扩展的新领域。

在实验室扩建期间,我与领导们进行了讨论。我们要用这个实验室做什么?既然我们已经有了实验室,为什么还要扩大它?经过讨论,我们总结了实验室的主要用途。

一是标杆管理。简而言之,腾讯自己的团队将在每台服务器投入生产之前先摸摸它的底部。第二是质量保证。最近,作为最终用户,我们在早期阶段就参与了英特尔新发布平台硬件的研发。对于这个大项目,我们已经将质量保证项目引入实验室。上述两项功能已在现有实验室得到满足。扩展我们实验室的目的实际上是为了满足快速发展的各种服务器和云平台技术的认证。可以在实验室验证的云技术位于硬件和最终交付给用户的服务之间的层。这一层包括刚刚上台的同事提到的所有新兴技术。在技术发展的早期阶段,当实际业务中没有可以在硬件上运行的代码时,我们将这种新技术投入实验室是最合适的。由于这个地区缺乏资源,我们建了这样一个实验室。在我们知道实验室在做什么之后,以后就很容易做了。

曾子恩:腾讯硬件实验室经验分享

完成整个项目后,我总结了这三点。如何建立实验室有三个原则。

一个是真的。它必须非常符合当前的网络环境。我们经常看到一些东西在实验室验证后上线并失败。这种事情在百万级的服务器上是不可接受的。如果有一天可以将10,000台服务器交付到国家数据中心,其中一半以上将无法自动部署。此时,需要5000人同时安装服务器。这是大规模操作中不可接受的操作事故。因此,真实的实验室环境对于当前网络运行的高要求是一个很好的保障。然而,实验室毕竟是一个研发机构。我们不可能将所有东西从数据中心的一半移到实验室。我们投入的资源必须仔细计算。因此,我们必须在保证真实环境的条件下,很好地控制整个实验室的成本。例如,一个企业可以通过代码优化和一些抽象手段在12台机器的集群上运行吗?整个概念验证过程可以减少对资源的依赖,使实验室运行得更好。

曾子恩:腾讯硬件实验室经验分享

最后但同样重要的是,所有人似乎都与简有矛盾,但事实并非如此。我们所说的一切都是因为主要的信息技术设备制造商提供了多种技术。为了更好地了解这个行业,我们必须让所有的东西都通过实验室的认证。如果不完善,实验室作为一个前瞻性的技术预研究机构,将失去其领先地位。

这就是我们对建筑的看法。也许这里的每个人都没有机会参与实验室建设。让我们简单分享一下。然而,以下关于管理和运营的章节对中小型企业来说很有价值。

我为什么这么说?因为实验室的管理负责人、事和事。一旦这三者得到适当的管理,就可以管理一个简单的数据中心。我们不仅应该知道它在哪里,还应该知道谁在使用它。在人员方面,我们将有十名左右的供应商外包人员在现场为我们服务。这些人员是如何管理的?Steward,因为每个月都有50个测试任务,如何跟踪项目也是一件非常优雅的事情。尽管有这三个,我们还是使用了一个系统。该系统的开发者是腾讯服务器管理平台的负责人王镇,在下一个服务器分会场。他的演讲是关于当前网络的大规模操作系统的开发经验。在实际工作中,我们发现将丰富的网络操作经验应用于实验室是绰绰有余的。

曾子恩:腾讯硬件实验室经验分享

在线资产管理系统的测试肯定不同于IDC。测试环境经常变化,因为在实验室里,经常会出现“今天保存一台双CPU的机器,明天保存一台带有五个硬盘的服务器”的情况。备件将被更宽松地拆卸。我们将按照进出仓库的方式管理服务器测试资源,并在测试人员中实施,同时与IDC进行严格控制。工单系统在线通知外包人员,外包人员将经常更换。我们将在实验室进行统一的标准培训,并通知外包人员进行操作。在更换一个人后,我们不会不知道如何操作。测试平台是我们正在进行的一个项目,目的是解决将自动化测试用例组装到测试平台中的问题。整个服务器实验室是一个网络系统。如果您在过去运行过一次基本测试,操作员将登录机器并点击命令。如果有测试平台,该工具可以远程分发,数据可以恢复。自动化后,只需少量人力即可完成。

曾子恩:腾讯硬件实验室经验分享

最后,腾讯实验室取得了哪些成绩?我很惭愧我们只做了一点点工作。在质量保证方面,我们有工厂预测试环节。在服务器制造商离开工厂之前,所有服务器都必须运行腾讯的工厂预测试程序。该程序在我们的实验室中完成了整个开发验证,以确保服务器制造商端的平稳运行。最近,为了新平台的整机质量认证,我们在实验室部署了三个新平台机器机柜进行长期压力测试。此外,一些自行开发的服务器设备也将在实验室完成纺织品测试。至于技术孵化的成果,除了高性能虚拟化网卡应用外,领先的行业项目如液冷服务器和新的存储介质应用已经在实验室完成了概念验证。商业案例包括25G以太网云主机、云存储池、海量数据迁移设备等。

曾子恩:腾讯硬件实验室经验分享

按照我去年演讲的惯例,是时候开始升华主题了。今年我也会做一次升华。我在腾讯的硬件实验室。我不是一个人蹲在电脑室里。我是云架构师。这两件事非常相似。从底层数据中心到硬件设备再到上面的计算资源、网络资源和存储资源,实验室和网络没有区别。最重要的是服务。我们销售设备的同事的最终目标是销售服务,因为边际成本低,利润率高。这也是我们实验室的意思。我们需要在有限的计算网络存储资源中创造更多的服务,这是实验室的最大价值。

曾子恩:腾讯硬件实验室经验分享

什么实验室云服务?除了滕循同事参加的实验室技术研讨会,还有系列技术文章等服务。我们定期发布腾讯实验室的内部期刊,并在内部推广新设备和技术,作为服务器技术的门户。我们的团队通过这个非常好的平台将技术推广到了内部。还有一个增值服务,因为深圳的天气比较热,同事们更喜欢呆在空的中转房。

从实验室的建设开始,我想我的前辈们可能没有想到实验室能从这样一个房间里买很多设备并把它放进去。到2017年,我们今天就能拿出一个计划。我们可以和云平台做生意,最终实现我们的梦想。我想每个岗位的同事都会经历从基础工作到实现梦想的心理过程,这是我在实验室里最大的感受。

愿你的梦想成真,谢谢。

标题:曾子恩:腾讯硬件实验室经验分享

地址:http://www.yunqingbao.cn/yqbxx/1386.html