开发者社区> 华章计算机> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一1.9 示例应用:SuperWebAnalytics.com

简介:
+关注继续查看
福利推荐:阿里云、腾讯云、华为云等大品牌云产品全线2折优惠活动来袭,4核8G云服务器899元/3年,新老用户共享优惠,点击这里立即抢购>>>

本节书摘来自华章出版社《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一书中的第1章,第1.9节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.9 示例应用:SuperWebAnalytics.com

在本书中,我们将创建一个大数据应用程序示例来说明一些概念。我们将为Google Analytics构建数据管理层—比如服务。该服务将能够每天追踪数十亿的页面浏览量。
该服务将支持多种不同的指标。每个指标都被实时地支持。指标的范围很广—从简单的统计指标,到访客是如何浏览网站的复杂分析指标。
示例应用将支持的指标如下:
按照时间切片基于URL的页面浏览计数—示例查询是“过去一年中每一天的页面浏览量是多少?”和“过去12小时内有多少页面浏览量?”
按照时间切片基于URL的独立访客—示例查询是“2010年有多少独立访客访问这个域名?”和“过去三天内每个小时,有多少访客访问这个域名?”
跳出率分析—“用户访问该站点的某个页面,没有访问其他任何页面的百分比是多少?”
我们将构建存储、处理并为应用程序提供查询的层。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
大数据平台网站日志分析系统
1:大数据平台网站日志分析系统,项目技术架构图: 2:大数据平台网站日志分析系统,流程图解析,整体流程如下:   ETL即hive查询的sql;   但是,由于本案例的前提是处理海量数据,因而,流程中各环节所使用的技术则跟传统BI完全不同:     1)?数据采集:定制开发采集程序,...
1792 0
《大数据分析原理与实践》一一 3.1 回归分析
本节书摘来自华章出版社《大数据分析原理与实践》一 书中的第3章,第3.1节,作者:王宏志 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2333 0
《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一导读
Preface 前  言 当第一次进入大数据的世界时,我仿佛置身于软件开发的美国西部荒原。许多人放弃了关系型数据库,转而选择带有高度受限模型的NoSQL数据库,主要是因为其使用体验良好、熟悉度较高且这种数据库可以扩展到成千上万台机器上。
1875 0
文章
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
超大规模实时数仓架构挑战与实践解析
立即下载
深入解析数据存储技术原理及发展演进—数据存储技术概述
立即下载
数据运营系统的核心应用场景实现方案浅析
立即下载


http://www.vxiaotou.com