### Power BI 数据分析知识点 #### 一、数据分析概述 **数据分析**是指理解数据的各种细节,包括确定异常值、检查和开发基本数据结构以及查询数据的统计信息,如行计数、值分布、最小值和最大值及平均值等。数据分析的重要性在于它允许用户对数据进行调整和整理,从而更轻松地与数据交互并识别数据分布,这对于前端处理数据以开发报表元素至关重要。 #### 二、Power BI 中的数据分析流程 1. **理解数据结构**: - **Power BI Desktop 的“模型”选项卡**:这里可以看到最新的语义模型。 - **编辑特定列和表属性**:通过选择表或列来进行。 - **转换数据**:使用“转换数据”按钮进入 Power Query 编辑器。 - **管理关系**:利用功能区上的“管理关系”选项管理、创建、编辑和删除不同表之间的关系。 2. **查找数据异常和统计信息**: - **Power Query 编辑器**:用于确定数据中存在的异常值。 - **数据异常**:指的是数据中的离群值。 - **列分布功能**:用于确定数据异常。 - **列质量**:显示有效、错误和空数据的百分比。 - **列分析**:提供列内前1,000行数据的统计信息,包括行计数、离群值、空行、字符串以及最小值和最大值。 3. **深入分析**: - **明确值与唯一值**:明确值指列中所有不同的值(含重复值和NULL值);唯一值不含重复值和NULL值。 - **列分析提供的统计信息**:包括零和NULL值的数量、平均值、标准偏差、偶数和奇数值的数量。 - **值分布图**:指示特定列中每个非重复值的计数,帮助识别离群值。 4. **完成编辑并应用**: - 完成编辑后,回到 Power Query 编辑器功能区上的“开始”,选择“关闭并应用”返回 Power BI Desktop 并应用任何列编辑/转换。 #### 三、具体应用场景示例 假设你在为一个组织的销售团队开发报表,但不清楚数据的具体结构和如何包含在表中。此时,你需要在开发视觉对象之前对数据进行幕后分析。 1. **检查数据结构**: - 在 Power BI Desktop 的“模型”选项卡下查看数据结构。 - 编辑特定列和表属性,了解数据的基本结构。 - 使用“转换数据”按钮进入 Power Query 编辑器进行更深入的数据处理。 - 利用“管理关系”选项来管理表之间的关系。 2. **查找数据异常和统计信息**: - 进入 Power Query 编辑器后,使用“列分布”、“列质量”和“列分析”等功能来确定数据异常。 - 检查“列质量”,确保数据的有效性。 - 利用“列分析”获取更多统计信息,如行计数、最小值和最大值等。 - 通过“值分布”图识别数据中的离群值。 3. **处理数据**: - 对于发现的问题,进行相应的数据处理,如修正错误、填充缺失值等。 - 应用数据转换,如清洗、重塑等。 - 利用 Power BI 的可视化工具创建报表元素。 4. **完成编辑并应用**: - 完成所有编辑后,回到 Power Query 编辑器功能区上的“开始”选项,选择“关闭并应用”。 - 返回 Power BI Desktop,查看并应用所有的列编辑/转换。 #### 四、总结 在 Power BI 中进行数据分析是一个系统的过程,涉及理解数据结构、查找数据异常和统计信息、深入分析以及最终完成编辑并应用。通过这些步骤,你可以有效地整理和理解数据,从而更好地支持报表开发工作。Power BI 提供的强大工具和功能使得数据分析变得更加高效和直观,对于提升数据分析的质量和速度具有重要意义。
- 粉丝: 5627
- 资源: 674
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助