引言这里总结整理了诸如国外wikipedia,Facebook,Yahoo!,YouTube,MySpace,Twitter,国内如优酷网等大型网站的技术架构。
1、WikiPedia 技术架构
WikiPedia 技术架构图Copy @Mark Bergsma
来自wikipedia的数据:峰值每秒钟3万个
350 台 PC 服务器。
GeoDNSA :40-line patch for BIND to add geographical filters support to the existent views in BIND", 把用户带到最近的服务器。GeoDNS 在 WikiPedia 架构中担当重任当然是由 WikiPedia 的内容性质决定的--面向各个国家,各个地域。
负载均衡:LVS,请看下图:
2、Facebook 架构
Facebook 搜索功能的架构示意图
细心的读者一定能发现,上副架构图之前出现在此文之中:从几幅架构图中偷得半点海里数据处理经验。本文与前文最大的不同是,前文只有几幅,此文系列将有上百幅架构图,任您尽情观赏。
3、Yahoo! Mail 架构
Yahoo! Mail 架构
Yahoo! Mail 架构部署了 Oracle RAC,用来存储 Mail 服务相关的 Meta 数据。
4、twitter技术架构
twitter的整体架构设计图
twitter平台大致由twitter.com、手机以及第三方应用构成,如下图所示(其中流量主要以手机和第三方为主要来源):
缓存在大型web项目中起到了举足轻重的作用,毕竟数据越靠近CPU存取速度越快。下图是twitter的缓存架构图:
关于缓存系统,还可以看看下幅图:
5、Google App Engine技术架构
GAE的架构图
简单而言,上述GAE的架构分为如图所示的三个部分:前端,Datastore和服务群。
前端包括4个模块:Front End,Static Files,App Server,App Master。
Datastore是基于BigTable技术的分布式数据库,虽然其也可以被理解成为一个服务,但是由于其是整个App Engine唯一存储持久化数据的地方,所以其是App Engine中一个非常核心的模块。其具体细节将在下篇和大家讨论。
整个服务群包括很多服务供App Server调用,比如Memcache,图形,用户,URL抓取和任务队列等。
6、Amazon技术架构
Amazon的Dynamo Key-Value存储架构图
可能有读者并不熟悉Amazon,它现在已经是全球商品品种最多的网上零售商和全球第2大互联网公司。而之前它仅仅是一个小小的网上书店。ok,下面,咱们来见识下它的架构。
Dynamo是亚马逊的key-value模式的存储平台,可用性和扩展性都很好,性能也不错:读写访问中99.9%的响应时间都在300ms内。按分布式系统常用的哈希算法切分数据,分放在不同的node上。Read操作时,也是根据key的哈希值寻找对应的node。Dynamo使用了 Consistent Hashing算法,node对应的不再是一个确定的hash值,而是一个hash值范围,key的hash值落在这个范围内,则顺时针沿ring找,碰到的第一个node即为所需。
Dynamo对Consistent Hashing算法的改进在于:它放在环上作为一个node的是一组机器(而不是memcached把一台机器作为node),这一组机器是通过同步机制保证数据一致的。
下图是分布式存储系统的示意图,读者可观摩之:
Amazon的云架构图如下:
Amazon的云架构图
7、优酷网的技术架构
从一开始,优酷网就自建了一套CMS来解决前端的页面显示,各个模块之间分离得比较恰当,前端可扩展性很好,UI的分离,让开发与维护变得十分简单和灵活,下图是优酷前端的模块调用关系:
这样,就根据module、method及params来确定调用相对独立的模块,显得非常简洁。下图是优酷的前端局部架构图:
优酷的数据库架构也是经历了许多波折,从一开始的单台MySQL服务器(Just Running)到简单的MySQL主从复制、SSD优化、垂直分库、水平sharding分库。
1.简单的MySQL主从复制。
MySQL的主从复制解决了数据库的读写分离,并很好的提升了读的性能,其原来图如下:
其主从复制的过程如下图所示:
但是,主从复制也带来其他一系列性能瓶颈问题:
写入无法扩展
写入无法缓存
复制延时
锁表率上升
表变大,缓存率下降
那问题产生总得解决的,这就产生下面的优化方案。
2. MySQL垂直分区
如果把业务切割得足够独立,那把不同业务的数据放到不同的数据库服务器将是一个不错的方案,而且万一其中一个业务崩溃了也不会影响其他业务的正常进行,并且也起到了负载分流的作用,大大提升了数据库的吞吐能力。经过垂直分区后的数据库架构图如下:
然而,尽管业务之间已经足够独立了,但是有些业务之间或多或少总会有点联系,如用户,基本上都会和每个业务相关联,况且这种分区方式,也不能解决单张表数据量暴涨的问题,因此为何不试试水平sharding呢?
3. MySQL水平分片(Sharding)
这是一个非常好的思路,将用户按一定规则(按id哈希)分组,并把该组用户的数据存储到一个数据库分片中,即一个sharding,这样随着用户数量的增加,只要简单地配置一台服务器即可,原理图如下:
如何来确定某个用户所在的shard呢,可以建一张用户和shard对应的数据表,每次请求先从这张表找用户的shard id,再从对应shard中查询相关数据,如下图所示:
是如何解决跨shard的查询呢,这个是个难点,据介绍优酷是尽量不跨shard查询,实在不行通过多维分片索引、分布式搜索引擎,下策是分布式数据库查询(这个非常麻烦而且耗性能)。
缓存策略
貌似大的系统都对“缓存”情有独钟,从内存数据缓存,但优酷表示没有用内存缓存,理由如下:
避免内存拷贝,避免内存锁
如接到老大哥通知要把某个视频撤下来,如果在缓存里是比较麻烦的
而且Squid 的 write() 用户进程空间有消耗,Lig) 读取文件到用户内存导致效率也比较低下。
但为何我们访问优酷会如此流畅,与土豆相比优酷的视频加载速度略胜一筹?这个要归功于优酷建立的比较完善的内容分发网络(CDN),它通过多种方式保证分布在全国各地的用户进行就近访问——用户点击视频请求后,优酷网将根据用户所处地区位置,将离用户最近、服务状况最好的视频服务器地址传送给用户,从而保证用户可以得到快速的视频体验。这就是CDN带来的优势,就近访问。
原文:
网站建设我比较了解耐思尼克,非常专业,是CNNIC认证顶级域名注册商,是全国虚拟主机十强服务商,你可以去他们家了解,上个月我刚买的域名,国际顶级域名域名和中国国家顶级域名才45,价格实惠,服务超好...
这个问题比较大,我简单说几点 1、必须先有一个网站,当然英文或多语言也是必须的,且网站建设符合SEO要求,SEO标准有很多,这里就不一一说了。 2、做好关键词分析,包括热门词,长尾关键词,排名竞争难度...
b2c的网站肯定得办ICP经营许可证。如果经营的业务中有电信业务,还得办增值电信业务经营许可证。 如果从事新闻、出版、教育、医疗保健、药品和医疗器械、文化、广播电影电视节目等互联网信息服务,还得办理其...
一、有利于提升企业品牌形象 一般来说,企业建立自己的网站,不但可以给企业带来新客户、新生意,也可以马上大幅度提升企业业绩。企业网站的作用更类似于企业在报纸 和电视上所做的宣传公司本身及品牌的广告。不...
做外贸不能低头蛮干,还得抬头看天。人类和动物的最大区别就是制造工具和使用工具,同样做外贸,工具的使用能够让我们提升效率,更快的进化。 这里推荐几种外贸实用工具: 浏览谷歌 浏览谷歌,浏览faceb...
你這(zhè)个问题有(yǒu)点前瞻(zhān)性,但是(shì)目前来看房地产领域还是(shì)以地理位置为依據(jù),排在重要因素的(de)第一点,受众的(de)人群在某些方面来說(shuō)...
大家好,对于域名的注册、管理、交易等我还是比较熟悉的,毕竟在互联网公司做了差不多有12年了。 什么是“黑米”? 何为“黑米”,黑米就是被盗域名,然后拿出来交易和买卖,买到“黑米”一直是让很多域名投资...
在线支付是一种通过第三方提供的与银行之间的支付接口进行支付的方式,这种方式的好处在于可以直接把资金从用户的银行卡中转账到网站帐户中,汇款马上到帐,不需要人工确认。如何实现在线支付1:先到银行网点办理一...