公开课《数据的采集》

2024/11/12 19:16:59 人评论 次浏览 分享 分类:自定义模块     发布人:花钰锋

城市空气质量数据分析和可视化表达——数据的采集》教学设计

南京市聋人学校   董媛

一、 核心素养

1. 能够根据解决问题的需要,自觉、主动地寻求恰当的方式获取和处理信息。(信息意识)

2. 通过评估并选用常见的数字化资源和工具,有效地管理学习过程和学习资源。(数字化学习与创新)

3. 掌握数字化学习系统、学习资源与学习工具的操作技能,用于开展自主学习、协同工作、知识分享与创新创造,助力终身学习能力的提高。(数字化学习与创新)

4. 能够遵守信息法律法规,信守信息社会的道德与伦理准则,既能有效维护信息活动中个人的合法权益,又能积极维护他人合法权益和公共信息安全。(信息社会责任)

5. 对于信息技术创新所产生的新观念和新事物,具有积极学习的态度、理性判断和负责任的行动能力。(信息社会责任)

二、 内容要求

1.   通过典型的应用实例,了解数据采集的基本方法。

三、 学业要求

1.   了解数据采集的基本方法,能够利用软件工具或平台对数据进行整理

四、 学习目标:

1. 知道excel软件的基本功能

2. 知道工作薄、工作表、单元格、单元格区域的概念;知道excel工作薄的扩展名。

3. 能够将数据采集到excel中,并进行适当的整理

4. 知道网络爬虫的主要功能和优势,对信息技术创新产生的新事物具有积极学习的态度。

5. 通过网络爬虫和反爬虫机制的分析,能够辩证地看待数据采集机制;理解数据保护的概念和意义;形成遵守信息法律法规,信守道德伦理;合理合法使用网络数据的意识。

五、 教学重难点

1. 重点:

1Excel的基本概念(工作薄、工作表、单元格、单元格区域、扩展名等)、数据的采集

2网络爬虫的功能

3)合理、合法使用网络数据的意识与责任

2. 难点:

1网络爬虫对信息社会的两面性影响

六、教学环节

环节

教师活动

学生活动

设计意图

一、回顾项目进展

前几节课同学们依据项目主题“八城市空气质量数据分析和可视化表达”选定了南京、上海等八个城市,确定了空气质量的地域差异等研究问题,今天我们进行项目实施的第一步—数据采集。

生认真听讲

 

二、数据采集——excel数据的置入

1.数据采集可以从数据在哪里?数据采集到哪里?用什么方法采集?三个问题来考虑。

(1) 数据在哪里?在真气网空气质量历史数据查询平台。

(2) 数据采集到哪里?

师请生观看excel软件介绍视频。并依据视频回答以下两个问题。

Excel是一款什么软件?

Excel具有什么基本功能?

依据回答讨论,确定数据可以采集到excel中。

师介绍工作薄、工作表的概念。

(3)用什么方法采集?

师请生根据数据及操作经验,讨论方法。

通过复制数据可以将数据置入到excel中。

师请生分组将本组负责的两个城市数据采集到excel中。

2. 数据的整理

采集的数据存在标题过窄、数据不显示等问题,师引导生进行数据的整理,并请生保存工作薄。

生思考问题

 

 

 

 

 

生观看视频

 

 

 

生讨论回答

 

生认真听讲

 

生讨论

 

 

生上机操作

 

生上机操作

问题驱动,深入思考

 

 

 

 

能够从视频中提取有用信息

 

 

 

 

迁移学习经验

 

 

提供视频支架,辅助操作

自然融入单元格等概念

三、数据采集——网络爬虫

通过复制数据的方式可以采集到数据,但是如果采集的数据量很大,应该如何做呢?

师展示网络爬虫的定义。

网络爬虫是一种按照一定的规则自动浏览、检索网页信息的程序。网络爬虫能够自动请求网页,并将所需要的数据抓取下来。

师以爬取哔哩哔哩数据为例,展示爬虫过程。

师将复制数据与网络爬虫作为对比,体会网络爬虫在自动化、大规模采集数据、实时更新数据等方面的优势。

师展示爬取真气网数据的过程。

师请生观察结果(发现数据爬取不下来)

师引导生思考:为什么空气质量数据爬取不下来?(反爬虫)为什么要使用反爬虫?(保护数据)

师引导生进一步思考讨论:采集网络数据是否违反网络道德,甚至是违法?(具体情况具体分析)

师引导生进一步思考讨论:我们应该如何使用网络数据?(采集公开的数据、用于学习、公益等目的,不损害他人利益。)

生思考

 

 

生认真学习

 

 

生观察演示

 

生对比讨论

 

 

生观察演示

 

生思考讨论

 

 

生思考讨论

 

 

生思考讨论

通过实际存在的问题引发思考

 

 

 

通过观看演示、分析对比感受网络爬虫的强大功能

 

 

 

 

引起认知冲突

 

问题驱动,引导思维层层深入

 

四、本课小结

师生共同小结:

生讨论总结

 

板书设计

一、数据采集:从数据源获取数据的过程。

二、Excel:电子表格软件

工作簿、工作表、单元格、单元格区域  扩展名:.XLSX

三、网络爬虫:自动抓取网络数据的程序

四、合理合法的进行数据采集

教学反思

本节课让学生了解了数据采集的基本方法,让学生将数据采集到EXCEL数据表中,大部分学生能够按照要求完成操作,但在整理数据的过程中,由于学生缺乏数据格式化经验,出现了各种小问题。

此外,带领学生观察了网络爬虫程序爬取数据的过程,在感受高效获取数据的同时,引导学生讨论数据安全问题,让学生对数据采集有辩证的认识。

 

上一篇:公开课《算法及其描述》

下一篇:没有了

附件下载

  • 波浪
  • 波浪
  • 波浪
  • 波浪