分享好友 最新动态首页 最新动态分类 切换频道
数据仓库和分析
2024-11-07 21:57

本示例方案演示一个将大量数据从多个源集成到 Azure 中统一分析平台的数据管道。 此特定方案基于某个销售和营销解决方案,但设计模式与需要对大型数据集进行高级分析的多个行业(例如电子商务、零售和医疗保健)相关。

数据仓库和分析

下载此体系结构的 Visio 文件。

数据流经解决方案的情形如下所示:

  1. 对于每个数据源,会定期将所有更新导出到 Azure Data Lake Storage 中的临时区域。
  2. Azure 数据工厂逐渐将数据从 Azure Data Lake Storage 载入 Azure Synapse Analytics 中的临时表。 在此过程中,会清理并转换数据。 Polybase 可将大型数据集的处理过程并行化。
  3. 将新的一批数据载入仓库后,会刷新以前创建的 Azure Analysis Services 表格模型。 此语义模型简化了业务数据和关系的分析。
  4. 业务分析师使用 Microsoft Power BI 通过 Analysis Services 语义模型来分析数据仓库数据。

该公司的数据源位于多个不同的平台上:

  • 本地 SQL Server
  • 本地 Oracle 平台
  • Azure SQL Database
  • Azure 表存储
  • Azure Cosmos DB

使用多个 Azure 组件从不同的数据源加载数据:

  • 将源数据加载到 Azure Synapse 之前,使用 Azure Data Lake Storage 暂存这些数据。
  • 数据工厂在 Azure Synapse 的通用结构中协调临时数据的转换。 数据工厂在将数据载入 Azure Synapse 时使用 Polybase,以最大化吞吐量。
  • Azure Synapse 是用于存储和分析大型数据集的分布式系统。 它使用大规模并行处理 (MPP),因此很适合用于运行高性能分析。 Azure Synapse 可以使用 Polybase 快速从 Azure Data Lake Storage 加载数据。
  • Analysis Services 为数据提供语义模型。 分析数据时,它还可以提高系统性能。
  • Power BI 是一套业务分析工具,可以分析数据和分享见解。 Power BI 可以查询 Analysis Services 中存储的语义模型,或者直接查询 Azure Synapse。
  • Microsoft Entra ID 通过 Power BI 对连接到 Analysis Services 服务器的用户进行身份验证。 数据工厂还可以使用 Microsoft Entra ID 通过服务主体或 Azure 资源的托管标识对 Azure Synapse 进行身份验证。
  • 示例管道包含多种不同的数据源。 此体系结构可以处理各种关系和非关系数据源。

  • 数据工厂协调数据管道的工作流。 如果你只想加载数据一次或按需加载数据,可以使用 SQL Server 批量复制 (bcp) 和 AzCopy 等工具将数据复制到 Azure Data Lake Storage 中。 然后,可以使用 Polybase 将数据直接载入 Azure Synapse。

  • 对于极大型的数据集,请考虑使用 Data Lake Storage,它可为分析数据提供无限存储。

  • Azure Synapse 不适合 OLTP 工作负荷或小于 250 GB 的数据集。 对于这种情况,应使用 Azure SQL 数据库或 SQL Server。

  • 有关其他备选方案的比较,请参阅:

    • 在 Azure 中选择数据管道业务流程技术
    • 在 Azure 中选择批处理技术
    • 在 Azure 中选择分析型数据存储
    • 在 Azure 中选择数据分析技术

本示例演示了一家需要创建激励计划的销售和营销公司。 这些计划涉及到客户、供应商、销售人员和员工的奖励。 数据是这些计划的基础,该公司希望改善使用 Azure 通过数据分析获得的见解。

该公司需要采用新式方法来分析数据,以便在适当的时间使用适当的数据做出决策。 该公司的目标包括:

  • 将不同种类的数据源合并到一个云规模的平台。
  • 将源数据转换为常见的分类和结构,使数据保持一致并可轻松进行比较。
  • 使用支持数千个激励计划的高度并行化方法加载数据,并避免部署和维护本地基础结构所产生的较高成本。
  • 大幅减少收集和转换数据所需的时间,以便可以专注于分析数据。

此方法还可以用来:

  • 建立数据仓库,用作数据的单一事实源。
  • 将关系数据源与其他非结构化数据集相集成。
  • 使用语义建模和强大的可视化工具来简化数据分析。

这些注意事项实施 Azure 架构良好的框架的支柱原则,即一套可用于改善工作负荷质量的指导原则。 有关详细信息,请参阅 Microsoft Azure 架构良好的框架。

之所以选择此体系结构中的技术,是因为它们符合公司在可伸缩性与可用性方面的要求,同时有助于控制成本。

  • Azure Synapse 的大规模并行处理体系结构提供可伸缩性和高性能。
  • Azure Synapse 提供有保障的服务级别协议 (SLA) 以及实现高可用性的建议做法。
  • 当分析活动较少时,公司可以按需缩减 Azure Synapse,以减少甚至暂停计算资源,从而降低成本。
  • 当查询工作负荷较高时,可以横向扩展 Azure Analysis Services 来减少响应时间。 也可将处理与查询池分开,使处理操作不会减慢客户端查询的速度。
  • Azure Analysis Services 也提供有保障的 SLA,以及实现高可用性的建议做法。
  • Azure Synapse 安全模型通过 Microsoft Entra ID 或 SQL Server 身份验证和加密提供连接安全性、身份验证和授权。 Azure Analysis Services 使用 Microsoft Entra ID 进行标识管理和用户身份验证。

成本优化是关于寻找减少不必要的费用和提高运营效率的方法。 有关详细信息,请参阅成本优化支柱概述。

请通过 Azure 定价计算器了解数据仓库方案的定价示例。 请调整值,查看要求如何影响成本。

  • Azure Synapse 允许独立缩放计算和存储级别。 计算资源按小时计费,可按需缩放或暂停这些资源。 存储资源按 TB 计费,因此,引入的数据越多,费用就越高。
  • 数据工厂的费用根据读/写操作数目、监视操作数目以及在一个工作负荷中执行的业务流程活动数目来计收。 每增加一个数据流和每增加一个单位的处理数据量,数据工厂的费用都会增加。
  • 可在开发人员层、基本层和标准层使用 Analysis Services。 实例按查询处理单位 (QPU) 和可用内存定价。 为了控制成本,请尽量减少运行的查询数、查询处理的数据量以及查询的运行频率。
  • Power BI 提供不同的产品选项来满足不同的要求。 Power BI Embedded 提供基于 Azure 的选项用于在应用程序中嵌入 Power BI 功能。 上述定价示例包括 Power BI Embedded 实例。

本文由 Microsoft 维护, 最初由以下参与者撰写。

主要作者:

  • Alex Buck | 高级内容开发人员

若要查看非公开的 linkedIn 个人资料,请登录到 linkedIn。

  • 查看自动化企业 BI 的 Azure 参考体系结构,其中包含了有关在 Azure 中部署此体系结构的实例的说明。

最新文章
什么是思维导图,在线思维导图对SEO有用吗?
在我多年的SEO优化与项目管理经历中,我发现,无论是策划内容框架还是梳理复杂信息,思维导图都是一个不可或缺的工具。它不仅帮助我更清晰地思考,还无形中促进了创意的碰撞。今天,我们就来聊聊什么是思维导图,以及在线思维导图在SEO优化
揭秘 SEO 按天扣费模式的猫腻,你知道多少?
关键词每日扣费一定靠谱吗?近年来,SEO行业形势不断发生变化,各种新的SEO计费方式和营销模式不断涌现。如今,大多数SEO公司都采用每日扣费的模式来吸引客户。事实上,每日抵扣模式还有很多技巧。今天,就带大家了解一下一家公司的日常扣
专业SEO关键词优化:提升网站排名,打造互联网流量利器
为了让您的网站在激烈的市场竞争中占据有利位置,进行精准的关键词优化是必不可少的。如何才能进行高效且专业的SEO关键词优化呢?我们将为您介绍几个关键的优化步骤。关键词研究是SEO优化的第一步,也是最为基础和重要的一步。通过关键词研
Copilot插件:时时陪伴的AI助手 | Obsidian实践
这段时间,有点儿沉迷于AIGC实践不可自拔,也因此懈怠了Obsidian实践。回过头来猛然发觉,其实Obsidian也“上架”了很多与ChatGPT有关的插件。赶紧体验下,看看有没有什么,是一下子就能用起来的。不得不说,自从我安装了Copilot插件,就再
seo优化推广如何 SEO优化推广效果与策略解析
SEO优化推广如何:掌握数字时代的营销利器在当今数字化迅猛发展的时代,企业的在线可见性和品牌影响力变得至关重要SEO(搜索引擎优化)作为一种有效的数字营销策略,不仅能够帮助企业在竞争激烈的市场中脱颖而出,还能带来持续、稳定的流量
宁波SEO服务热线汇总,助力网站快速提升排名抢占市场优势
宁波SEO厂商电话一览,为您提供专业SEO服务,助您快速提升网站排名,抢占市场先机。涵盖多家知名SEO公司,详尽联系方式,让您轻松选择,高效优化网站,助力企业发展。随着互联网的快速发展,企业对网络营销的需求日益增长,SEO(搜索引擎优
Python开发QQ聊天机器人——Yes酱的部署与调教
Yes酱是一个会发s图的群管理机器人,基于 go-cqhttp,使用OneBot标准的插件开发的一个机器人,支持以下功能:发送setu/猫猫图返回一张涩图/猫猫图检测关键字禁言私聊调教对话本文主要参考了其官方博客,结合Yes酱的github和go-cqhttp的gith
2024 (图文)Yoast SEO插件使用教程,详细设置步骤
  Yoast SEO是著排名第一的。插件有Yoast SEO(免费)和Yoast SEO Premium(付费)有两个版本  Yoast SEO可以完美地在所有类型的网站或上实现SEO相关的设置。可帮助您编写更好的且经过优化的内容让搜索引擎收录。该插件的免费版本还具
EyouCms(易优企业建站系统) 官网版 v3.5.6
EyouCms(易优企业建站系统)官方版是一款十分受欢迎的企业内容管理软件。EyouCms(易优企业建站系统)最新版支持文章的「发布、删除、移动、复制、排序、推荐、置顶、隐藏、显示」操作。EyouCms(易优企业建站系统)官方版支持设置每篇文章的「
【技术】全站仪测量使用方法及坐标计算,一步一步讲解!
全站仪常规注意事项:在使用本仪器之前, 要把各种注意事项烂熟于心,务必检查并确认该仪器各项功能运行正常。1、不要将仪器直接对准太阳将仪器直接对准太阳会严重伤害眼睛。若仪器的物镜直接对准太阳, 也会损坏仪器。2、将仪器架设到脚架
相关文章
推荐文章
发表评论
0评