邵俊明:“挖掘”网络教学新天地

文:必威官网亚洲 罗莎 图:邵俊明 / 来源:新闻中心 / 2020-03-24 / 点击量:2081

  全英文、受众范围广、跨学院、选课学生覆盖全校不同学院的研究生、博士生以及海外留学生……这是近年来颇受选课学生欢迎的《大数据分析与挖掘》课程的标签。

  校“百人计划”入选者、洪堡学者、计算机科学与工程学院教授邵俊明担任本课程主讲,“不仅关注大数据分析与挖掘的基础理论算法,同时尽力注重该领域的学术前沿”是他为自己的课堂教学定下的必达要求,为在抗“疫”时期上好“云端”课堂,他除了在课内课外花心思下功夫“折腾”,还深入研究总结线上教学的特点和教法,带领研究生挖掘网课学习新天地,在张弛有度中,将自己的每一堂网课,都变成一种“云端”享受。

悉心准备:用好现代化教学工具制胜网课

  教学工具不是万能的,不了解、不学习、不使用信息化、现代化的教学工具是万万不能的。

image.png

  为上好抗“疫”特殊时期的网课,邵俊明早在2月初就开始了课件资料、各种预案的准备。同时作为学院教指委的一员,在教学副院长、教指委、教务科和教学关键岗老师的指导下,他还进行了大量教学平台和教学方式方法上的交流。通过对比分析,邵俊明最终选定腾讯课堂和QQ直播方式作为AB两套方案开展教学,并未雨绸缪,提前线下录制部分视频,作为万一不能直播时的第三方案,确保线上教学万无一失。

  正式授课前,邵俊明特地多方对比甄选了适合网络教学使用的摄像头、麦克风和手写板(数码绘图板),尤其是手写板,在他看来“非常有用”。

  《大数据分析与挖掘》讲解经常涉及演算推理,有些步骤需要一边讲一边书写,另外有些题目的作答,需要不断标记重点、易错点,而鼠标操作会非常不便。如果制作PPT,这样的讲解和制作又需要花费大量的时间。利用手写板这一教学工具,邵俊明通过自己的实践摸索,顺利实现了在网络课堂中的板书书写。上课后,像平时在课堂上一样,一边讲,一边把演算过程写在白板上,可圈可点的地方,也用红色笔直接勾画出来,让学生直呼“整个过程就像一对一辅导”。

  “如果可能,多用手写板,感觉进行交流互动时会比直接讲好很多,尤其是涉及到一些关键点需要细致讲解的时候。”看到课后同学们纷纷在留言板献花并反馈说感觉不错,第一次上网课前一早就起来作了N轮测试的邵俊明感到“不再紧张,心里一下就安顿下来了”,甚至坦言比在教室上课还更放松。

深度课堂:从习惯思考过渡到科研思维

  与其他老师提倡的研讨式教学、翻转课堂不同,邵俊明在课堂上会对一个知识点进行深入解析,往往由他讲解的内容相对还多一些。

  在讲解数据挖掘、机器学习中著名的模型“过拟合”问题时,邵俊明不是像传统的方法直接讲模型的复杂度,而是剖析和挖掘“过拟合”问题的本质原因并不是模型过于复杂,而是由于“训练集和测试集分布不一致”这一根本原因造成了模型泛化能力差,容易过拟合。

  “因此避免过拟合的最有效方法是什么?”邵俊明引导同学们步步展开深入思考,说明增加样本数量,使得训练样本的分布尽量趋近于总体分布,从根本上解决“过拟合”问题。

  在他的抽丝剥茧的讲解下,同学们了解到当今数据的增加和计算、存储能力的提高,使得深度学习能够很好地学习海量训练数据的整体分布,从而精度大大提高。这也是深度学习为什么在图像和文本领域取得更大成功的原因,也更能理解到当前“深度学习”流行的原因。

  又如在讲解不同机器学习算法时,除了讲解其原理之外,邵俊明更注重对比分析不同算法之间的差异性及优劣性,帮助学生能够更加清晰地掌握和使用各种算法。

  “比如最简单的KNN算法,它是经典的懒惰学习,不需要训练,因此特别适合增量学习、在线学习和数据流学习,同时可有效处理多标记、多分类、噪声数据等。”邵俊明解释说,但同时由于测试时太耗时,因此需要对训练集进行有效的压缩。针对朴素贝叶斯算法,它基于贝叶斯理论,因此输出结果是概率形式,特别适合进行概率输出等要求可解释性的场景;决策树算法则是一类弱分类器,同样具有很好的可解释性,适合专家解释和产品设计,同时集成这类弱分类器会大大提高分类性能,这也是目前XGBOOST等流行的基本原因;相比而言,支持向量机则引入了结构风险最小化,因此它的主要优势是只需要少量训练数据,就可以得到很好的分类性能,具有很好的泛化能力。

  通过对比分析这些算法本身的优势,更重要的是让学生去思考,发现各类算法的问题,从而达到培养科研思维的目的。在线上课堂,邵俊明坚守的研究型教学理念依然。

张弛有度:经典算法指导+轻音乐的云端课堂

  针对《大数据分析与挖掘》课程的实用性,考虑到选课学生来自不同学院,而有些是没有任何计算机方面基础知识的同学,上课前,长期从事数据挖掘和机器学习的基础理论研究的邵俊明特意根据同学们的实际情况,额外为学生准备了各种数据挖掘经典算法实现方面的指导书,让对数据挖掘充满求知欲的学生,能在读指导书做实验的过程中,顺利“上路”。

  指导书里面包含了知识发现整个流程涉及的基本步骤,包括数据预处理、关联规则挖掘算法、分类算法、聚类算法和离群点检测算法,同时考虑不同专业学生的编程能力,提供了JAVA和Python两个版本,包括三个由易到难、由浅入深的实验:

  最简单的是利用WEKA图形界面实现,相当于只要熟悉了WEKA工具包,就可以处理最基本的数据挖掘任务,简单方便,但灵活性差,适合于没有任何计算机基础的学生;其次是调用WEKA包实现数据挖掘任务,涉及一些基本的编程;最后是相对难点的实验,需要学生自己利用JAVA或Python实现各种机器学习算法,但周全考虑的邵老师为同学们提供了详细的指南,助力学子深入理解算法、实现编程能力的训练。

  当年留学慕尼黑大学读博期间,热爱音乐且极具音乐天赋的德意志民族给邵俊明留下深刻的印象,在音乐之乡的熏陶,让他喜欢上音乐并善于用音乐来松弛因高度投入科研而紧绷的神经。他也将这种张弛有度的休息术带到这一次的网络课堂,于是,课间休息的时候,同学们会在巴赫、舒伯特的古典音乐里松弛,亦或在轻松的爵士或流行轻音乐里惬意。

  “同学们上课久了会感到累,课间音乐就像杯醇香的咖啡,能缓解上课时紧张的情绪,为高速运转的大脑提个神。”

变被动为主动:挖掘网课的闪光点

  邵俊明曾说,每个人其实都是一片大数据,只要勇敢挖掘,总有意料不到的新天地。在全国打响疫情防控的人民战争之际,他用自己的智慧和践行,主动挖掘网络教学的闪光点。

  除了无法实时关注到学生的上课状态,邵俊明认为线上上课还是有很“闪光点”:一是老师可以为学生准备更多的学习资料;二是资源整合是线上课程一大优势,老师可以整合分享国内外许多教学资源给学生;三是有助于培养学生的自主学习性;四是课堂上的互动人数和实时性会更强。

  线上教学让学习时空延展性更强,更大程度保证了学生和老师之间的交流互动。这门课程本身就是面向学术前沿,互动研讨贯穿整个讲解内容,因此在讲解每个知识点,尤其是一些难点上的问题时,邵俊明都会和当前学术前沿方向有机结合起来解析,并让学生在讨论区快速作答,“这样参与的人数更多,也比较快,而且大家更积极。”

  课程的考核包括期末考试,平时互动和研究报告。在课程知识考核的时候,他往往还是采用问答方式进行,最后每名学生还需要根据自己的研究方向,选择与大数据分析与挖掘领域的主题写一篇研究型小报告。几次课下来,师生都感到比传统课堂更便捷,也更有效。

  “必威的研究生对真正的实际应用非常感兴趣,当我们将生活中的实际例子展现出来,学生们非常喜欢可以自己实现并能改进,没有人希望学习仅仅停留在公式层面。”在讲朴素贝叶斯分类算法的时候,邵俊明就举了一个“垃圾邮件过滤”的例子,学生们当时就表现出了极大的兴趣,同时也带动了学生针对垃圾邮件分类问题涉及的其他一些问题进行思考,这对研究型学习本身来说是非常有益的。

  虽然隔着屏幕,依然能感受到同学们的兴奋,这令“主播”感到鼓舞,“但应用案例选择上的难易度,也是非常重要的。”邵俊明开心地说。

  学生们如是说:

  深入云端教学的邵老师,在与学生的日益隔屏相望中,得到了同学们的一致好评:

  计算机科学与工程学院研一学生李杰的家在湖北武汉,人生中第一次在家上课的他坦言:“面对疫情,大家只能待在家,不能外出,这使得这段日子变得无聊。但是通过在线课程,我能够与老师和同学无障碍地交流并讨论学习问题,这给我带来了很大的乐趣。课上有些没有听懂的地方可以通过反复回放课堂视频来巩固提高,让我更好地掌握知识。”

  “大数据这堂课虽然是全英文的课堂,但是我们并没有因此产生学习上的困难,邵俊明老师针对我们的基础和我们的疑问,给予了更细致的讲解、更深入的答疑解惑,在稍微复杂的地方还会用中文再次进行解释,这让我们有了学习大数据的信心。”信息与通信工程学院研一学生薛黎说。

  同样来自计算机科学与工程学院研一的留学生Doe Daniel Mawunyo则表示,“邵教授上课的班级 是我在必威官网亚洲就读过的人数最多的班级,人们可能会认为学生的管理和互动是个问题,但事实并非如此。他有熟练的沟通技巧,对学生在课堂上遇到的问题非常在意。他的助教也很努力。邵教授给我们提供了大量的信息和简明的教学章节,这使得在线教学过程与线下课堂区别并不大,我很高兴选到他的课学习。”



编辑:罗莎  / 审核:林坤  / 发布者:陈伟