《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一1.9 示例应用:SuperWebAnalytics.com

简介:
+关注继续查看

本节书摘来自华章出版社《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一书中的第1章,第1.9节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.9 示例应用:SuperWebAnalytics.com

在本书中,我们将创建一个大数据应用程序示例来说明一些概念。我们将为Google Analytics构建数据管理层—比如服务。该服务将能够每天追踪数十亿的页面浏览量。
该服务将支持多种不同的指标。每个指标都被实时地支持。指标的范围很广—从简单的统计指标,到访客是如何浏览网站的复杂分析指标。
示例应用将支持的指标如下:
按照时间切片基于URL的页面浏览计数—示例查询是“过去一年中每一天的页面浏览量是多少?”和“过去12小时内有多少页面浏览量?”
按照时间切片基于URL的独立访客—示例查询是“2010年有多少独立访客访问这个域名?”和“过去三天内每个小时,有多少访客访问这个域名?”
跳出率分析—“用户访问该站点的某个页面,没有访问其他任何页面的百分比是多少?”
我们将构建存储、处理并为应用程序提供查询的层。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由便宜云服务器开发者社区和便宜云服务器大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由便宜云服务器资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:便宜云服务器大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6天前
|
机器学习/深度学习 数据采集 算法
解码大数据:模型与算法的奥秘和应用
解码大数据:模型与算法的奥秘和应用
26 0
|
10天前
|
SQL 分布式计算 关系型数据库
大数据Hive安装与应用
大数据Hive安装与应用
39 0
|
10天前
|
SQL 数据可视化 大数据
大数据Hive行列转换应用与实现
大数据Hive行列转换应用与实现
10 0
|
1月前
|
存储 算法 大数据
倚天性能优化--基于倚天优化后的zstd在大数据场景应用:降低存储成本+提升重IO场景性能
倚天性能优化--基于倚天优化后的zstd在大数据场景应用:降低存储成本+提升重IO场景性能
|
1月前
|
弹性计算 负载均衡 并行计算
实战案例分析:ECS在电商和大数据领域的应用
本文通过实际案例分析,深入探讨了云服务器ECS在电子商务和大数据领域的应用。在电子商务网站部署方面,我们介绍了如何使用ECS构建稳定的电商平台,包括弹性伸缩和负载均衡的实践。通过示例代码,读者可以了解如何创建ECS实例、配置负载均衡器,以及设置自动伸缩策略,以应对不同流量情况。
94 1
|
2月前
|
机器学习/深度学习 存储 SQL
大数据应用发展史:从搜索引擎到人工智能
从最开始的 Google 在搜索引擎中开始使用大数据技术,到现在无处不在的各种人工智能应用,伴随着大数据技术的发展,大数据应用也从曲高和寡走到了今天的遍地开花。
43 0
|
3月前
|
存储 机器学习/深度学习 搜索推荐
构建智能电商推荐系统:大数据实战中的Kudu、Flink和Mahout应用【上进小菜猪大数据】
构建智能电商推荐系统:大数据实战中的Kudu、Flink和Mahout应用【上进小菜猪大数据】
117 0
|
3月前
|
存储 分布式计算 大数据
大数据处理领域的经典框架:MapReduce详解与应用【上进小菜猪大数据】
大数据处理领域的经典框架:MapReduce详解与应用【上进小菜猪大数据】
124 0
大数据处理领域的经典框架:MapReduce详解与应用【上进小菜猪大数据】
|
4月前
|
存储 人工智能 自然语言处理
|
4月前
|
存储 分布式计算 Oracle
MySQL与Hadoop数据同步方案:Sqoop与Flume的应用探究【上进小菜猪大数据系列】
MySQL与Hadoop数据同步方案:Sqoop与Flume的应用探究【上进小菜猪大数据系列】
196 0
热门文章
最新文章
推荐文章
更多


http://www.vxiaotou.com