发布日期:
网络爬虫技术助力思政要素挖掘
文章字数:1473
作为课程思政课前准备的重要准备工作,思政元素的挖掘往往不到位。思政元素挖掘效果不佳的原因在于专业课中的思政要素本来就存在隐蔽性、随机性和渗透性的特点。具体而言,专业课中思政元素的隐蔽性是指专业课都具备自己的知识体系,这与思政元素所存在的思想政治教育课程的体系不同,要想在两个不同的知识体系中寻找共同点难度是较大的;随机性是指各个专业课之间的知识体系也不同,不可能针对不同专业出台统一的思政元素标准,只能在各个专业课程之中具体的发掘思政元素,这必然导致思政元素在各个专业之中的随机性;渗透性是指课堂教学中思政元素的融入无法做到大范围的密集铺开,而是结合专业课的具体知识点进行点对点的渗透,导致现阶段思政元素的融入碎片化较强,缺少系统设计。以笔者所承担的法学专业民法学课程为例,作为法学专业主干课程的民法学具有自身独立的知识体系,其中的思政元素往往隐藏较深,各个知识点中思政元素的分布具有较大差异性,在具体授课过程中无法做到思政元素的集中讲授,只能将思政元素穿插到知识点或者案例分析之中。由此可见,目前实践中课程思政的思政元素挖掘效果不佳,亟须网络爬虫等数字化手段助力更好地发掘更多的思政元素。
网络爬虫技术的运用可以辅助挖掘较为隐蔽的思政元素,找出更多更契合专业课程的思政元素。网络爬虫技术主要用于互联网的信息搜索,根据搜索目标尽量多发现新内容,并将搜索结果以及更新到的信息存入数据库之中。具体而言,网络爬虫的基本工作原理如下:首先选定一个初始的URL(UniformResource Loca-tor,可以简单理解为网址),对该网页进行下载,运用一定的算法爬取特定的数据并分析、储存,反复的重复上述过程直到达到某种标准。简单理解的话,网络爬虫就是一种通过模仿用户并且可以高效收集并处理客户端数据的技术而已,本质上就是机器模仿人的行为抓取数据的工具。如果进行细化分类的话,网络爬虫技术又可以分为通用网络爬虫、主题网络爬虫、增量式网络爬虫和深层网络爬虫,其中主题网络爬虫可以按照对应的主题进行有目的地爬取,聚焦网络爬虫将目标定位在互联网中与主题相关的页面中,初始URL的获取是通过对抓取目标的定义以及相关的描述。
由上可知,网络爬虫技术(特别是主题网络爬虫技术)可能更为高效地挖掘隐蔽的思政元素。以笔者所在法学专业为例,具体可以分为以下几个步骤:其一,选取爬取的对象,即确定初始的URL,一方面可以选取较为权威的教材,例如马工程的各类教材或者业界公认的权威教材;另一方面可以选取中国法学会、中国法学创新网等权威的法学专业网站以及中国大学MOOC(慕课)、爱课程等课程平台网站。其二,确定爬取的方法,此处主要涉及关键词的选取,在法学专业课中可以确定社会主义核心价值观、习近平法治思想等关键词,注意关键词的选取仍然需要教师凭借以往的教学科研经验选取,网络爬虫技术是无法在此处助力的。其三,运用爬虫程序,实践中应当主要运用主题网络爬虫技术进行数据抓取,不断获得蕴含思政元素的资源案例,最终形成某项课程的思政元素案例资源库,供教师课前准备使用。但需要注意的是,网络爬虫技术的运用应当符合法律法规的规定,事先应当征得目标网站的授权许可,不能因为网络爬虫技术的运用而造成对他人隐私的侵犯。
基金项目:2021年度重庆邮电大学校级教育教学改革一般项目“社会主义核心价值观融入民法教学实践研究”(项目编号:XJG21232);重庆市研究生教育教学改革研究项目“人工智能法学交叉学科研究生培养模式的探索、实践与创新”(项目编号:yjg223084);重庆市专业学位研究生教学案例库建设项目“人工智能发展中的法律议题”教学案例库。
作者单位:重庆邮电大学网络空间安全与信息法学院
网络爬虫技术的运用可以辅助挖掘较为隐蔽的思政元素,找出更多更契合专业课程的思政元素。网络爬虫技术主要用于互联网的信息搜索,根据搜索目标尽量多发现新内容,并将搜索结果以及更新到的信息存入数据库之中。具体而言,网络爬虫的基本工作原理如下:首先选定一个初始的URL(UniformResource Loca-tor,可以简单理解为网址),对该网页进行下载,运用一定的算法爬取特定的数据并分析、储存,反复的重复上述过程直到达到某种标准。简单理解的话,网络爬虫就是一种通过模仿用户并且可以高效收集并处理客户端数据的技术而已,本质上就是机器模仿人的行为抓取数据的工具。如果进行细化分类的话,网络爬虫技术又可以分为通用网络爬虫、主题网络爬虫、增量式网络爬虫和深层网络爬虫,其中主题网络爬虫可以按照对应的主题进行有目的地爬取,聚焦网络爬虫将目标定位在互联网中与主题相关的页面中,初始URL的获取是通过对抓取目标的定义以及相关的描述。
由上可知,网络爬虫技术(特别是主题网络爬虫技术)可能更为高效地挖掘隐蔽的思政元素。以笔者所在法学专业为例,具体可以分为以下几个步骤:其一,选取爬取的对象,即确定初始的URL,一方面可以选取较为权威的教材,例如马工程的各类教材或者业界公认的权威教材;另一方面可以选取中国法学会、中国法学创新网等权威的法学专业网站以及中国大学MOOC(慕课)、爱课程等课程平台网站。其二,确定爬取的方法,此处主要涉及关键词的选取,在法学专业课中可以确定社会主义核心价值观、习近平法治思想等关键词,注意关键词的选取仍然需要教师凭借以往的教学科研经验选取,网络爬虫技术是无法在此处助力的。其三,运用爬虫程序,实践中应当主要运用主题网络爬虫技术进行数据抓取,不断获得蕴含思政元素的资源案例,最终形成某项课程的思政元素案例资源库,供教师课前准备使用。但需要注意的是,网络爬虫技术的运用应当符合法律法规的规定,事先应当征得目标网站的授权许可,不能因为网络爬虫技术的运用而造成对他人隐私的侵犯。
基金项目:2021年度重庆邮电大学校级教育教学改革一般项目“社会主义核心价值观融入民法教学实践研究”(项目编号:XJG21232);重庆市研究生教育教学改革研究项目“人工智能法学交叉学科研究生培养模式的探索、实践与创新”(项目编号:yjg223084);重庆市专业学位研究生教学案例库建设项目“人工智能发展中的法律议题”教学案例库。
作者单位:重庆邮电大学网络空间安全与信息法学院