公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
推荐课程:
制作中文日期粒度切片器
本视频深入讲解了如何利用Power BI工具实现高效的数据日期筛选功能。通过创新设计,合并了多个日期粒度的切片器,使用按钮控制不同日期粒度(如日、月、季度、年)的筛选。演示了如何通过插入形状、调整按钮状态、设置书签使报表界面更加直观、易用。重点讨论了如何优化用户界面,减少空间占用,并实现图表随切片器变化而联动更新的效果。视频非常适合对数据可视化、界面设计有兴趣的人群,尤其是希望通过Power BI提升报表交互性和视觉呈现能力的数据分析师和报表开发者。
Python爬虫:Requests库的基本用法
本次内容聚焦于使用Python的requests库进行网页数据爬取。介绍了requests库作为一个无需转基因的HTTP库,在人类获取网页数据过程的适用性与便捷性。视频解释了如何安装库,以及如何使用GET方法来获取网页对象。其中,还包含了HTTP状态码的讲解,状态码帮助开发者识别HTTP请求的响应状态。强调了文本编码的重要性,在处理爬取到的文本数据时需设置合适的编码以避免乱码问题。此外,视频提供了通过requests库对网页文本信息提取的具体代码实例演示,旨在帮助开发者理解如何使用这一工具进行数据抓取。
大数据架构与生态圈01
视频内容聚焦于大数据技术的发展三个阶段,其中大数据1.0时代遍及2006-2009年,以Apache基金会建立的Hadoop开源项目和相关技术(如HDFS、MapReduce、HBase)为标志,主要解决大规模结构化数据批处理问题。2.0时代自2009年至2015年,以Spark为主流计算引擎,着重于结构化数据处理与多种流计算引擎的出现。而3.0时代则自2015年开始,注重非结构化数据处理、数据共享及解决数据孤岛问题,推进大数据与人工智能、云计算技术的融合。内容指出大数据技术依据不同行业需求有不同架构,并且强调技术的持续更新与业务适配性。
我国大数据水平处于什么阶段?
中国大数据发展正面临硬件、软件与意识层面的挑战,尚在初级阶段。发展过程包含数据准备、存储、计算、分析及价值展现五大环节。现阶段,对大数据价值认识不足,相关领域数据未充分利用。存储环节依赖于进口核心芯片;计算管理中虚拟化产品国产化程度低;分析工具及数据库主要采用外国技术。国产化进步可加强数据安全,增强价值展现。本段内容适合关注本土技术发展、数据安全及大数据应用实践的专业人士。
美国大数据现状
美国以其大量的信息技术巨头牵头,大数据技术的发展及其应用处于全球领先地位,特别是在技术研发、商业应用和国家安全的维护上。强调数据主权和安全的重要性,美国加强了数据获取能力,并通过法律确立数据主权战略。澄清境外数据合法使用法案的例子突显了数据安全成为全球性问题。美国的顶层设计包含七个维度,旨在建立一个未来导向的大数据创新生态,涉及技术、开放共享、隐私安全等多方面,同时注重大数据人才的培养和引进以保持其全球领先地位。
数据分析之电商数据整体任务分析
视频内容涵盖了从数据清洗到数据分析各个步骤的详细教学。主要介绍了如何处理交易数据中的缺失值、重复值和异常值之后,进入到数据分析阶段。具体分析内容包含交易额、订单量、客户数、商家数、商品种类(SPU)和数量(SKU)、客单价及评价量等关键指标。通过SQL查询,提取了指定时间范围内的电商平台的营业数据,计算了各类重要业务指标,并对数据分析结果进行了简要解读,如单月交易额、平均订单量、客户挖掘潜力、商品多样性等。此视频适合数据分析师、电商运营、SQL技术人员。
整个人类历史都是偶然的吗?我在统计学里寻找答案
这段内容介绍了统计学的重要性和在多个方面的应用。讲解者首先说明统计学怎样理解并应用于日常工作和生活中的随机现象,例如在供应链管理中如何处理设备故障率和配件库存问题。内容强调了单个案例和总体规律的区别,用一个关于健康与不良习惯的案例进行了说明。观众通过学习统计学可以更好地理解和预测随机事件的规律,优化决策过程,减少不确定性。内容适合对数据分析、规律识别和决策优化都感兴趣的专业人士。
概念澄清:数据资源、数据资产、数据要素
视频聚焦了数据资源、数据资产和数据要素三者在大数据平台构建中的区别与联系。数据资源被描述为企业中所有潜在的有价值数据,包括自动化和非自动化的形式,如文档和图表。数据资产则是经过治理和处理的数据资源,可以被量化、交易并创造经济效益。数据要素是生产和服务中投入产生经济价值的数据,包括原始数据、衍生数据及数据产品。相关技术人员通过数据治理和AI模型合并、处理数据,以提供数据服务或生成更多数据产物。内容适合那些想要更深入理解数据管理和大数据应用的技术人员,特别是数据分析师、数据科学家和数据管理专业人士。