基于深度学习的教师课堂提问方式

黄发良,杨 倩,闭应洲,莫运佳,熊冬春,吴兰岸

(南宁师范大学广西人机交互与智能决策重点实验室,广西 南宁 530100)

课堂提问是教师课堂教学行为的关键组成部分,是师生之间传递知识和思想交流的纽带,在课堂教学中起着不容替代的作用.有效的课堂教学提问是学生学习和思考的催化剂,不仅能够吸引学生的注意力,激发学习兴趣,而且能够引导学生深入思考,及时评价教学效果.对教师的课堂提问进行质性研究,是区分新手教师与专家教师,促进教师专业发展的有效途径之一[1-3].

当前,学者主要从观察视角、观察工具、观察方式等方面对教师提问方式展开研究.在观察视角方面,学者围绕提问类型和深度观察教学效果,叶立军等[4]根据教师提问作用和培养学习者的认知水平,将教师提问分为为管理型、识记型、理解型、补充型、重复型、提示型和评价型7种观察教师提问;
于国文等[5]从教师提问视角比较国际上4个国家的课堂,分别从提问频率、提问对象、提问水平和提问话语量4方面分析和解读,审视我国课堂教学实践.教师课堂提问的观察工具大致可分为2大类:以弗兰德斯互动分析系统FIAS[6](flanders interaction analysis system)、言语互动分类系统VICS[7](verbal interaction category system)等非聚焦式工具和四何问题分类[8]、课堂对话方式观察等聚焦式工具.FIAS以教师提问编码方式对课堂言语行为进行量化分析,进而探究教学结构和教学模式,该模型将教师提问笼统地划为一类,无法进行细致分析.基于信息技术的课堂互动分析系统ITIAS[9-10](information technology-based interaction analysis system)通过添加提问的开放性和封闭性编码对FIAS进行改进,但因该方法的提出动机是为了评价教学,对教师提问分析的指导意义并不充分.VICS方法提出广义、狭义提问等12种师生言语行为互动的分类体系.在观察方式上,课堂对话观察方法只关注对话方式,对教师提问内容不做指导,四何问题观察方法聚焦对话方式和提问方式,将课题教师提问分为4大类,即:是何类、为何类、如何类与若何类,四类问题侧重思维倾向的培养,但在问题深度方面有所欠缺.上述的这些方法都是基于邻域专家的人力处理方式,巨大的人力成本使其难以胜任分析教学行为大数据的任务.

深度学习作为人工智能领域的热门方向,其思想是模拟人脑对文本数据、图像数据等信息,通过多层网络提取和分析的学习模型.深度学习已经在教育数据智能分析方面得到成功应用.曾明星等[11]将人工智能赋能培养学习者的高阶思维,利用智能交互、智能计算助力学习者的个性化学习体验.黄昌勤等[12]关注学习者的情感构建学习推荐系统,利用LSTM分析模型检测和分析学习者的情感动态,在学习云空间平台得基础上实现学习推荐功能.Sidney等[13]开发的智能辅导系统通过对学生的行为监测,及时发现学生的游离以唤醒学生在课堂中的情感和状态.Akram等[14]设计基于LSTM模型的分析系统,在不干扰学生游戏过程前提下,隐形收集学生解决问题的行为用以评估学生学习状况,取得良好实验效果.Cook等[15]基于决策树技术设计自动化教师反馈系统,通过开放性和封闭性词汇表的结合对教师提出问题进行预测.冯翔等[16]构建基于LSTM的学业情绪预测模型,用以快速反馈学业情绪类型.甄园宜等[17]采用多种深度学习网络CNN、LSTM和Bi-LSTM模型对在线协作学习交互进行分类,通过监控和干预大规模在线学习过程,提高学习者在线协作学习的效率.罗枭[18]将Bi-LSTM和CNN相结合来实现主观题自动评分,采取分数分段的方法将主观题的判定转化为文本多分类问题,使用文本相似度计算学生答案和参考答案文本之间的相似性实现主观题的自动评分.然而,据现有文献,从深度学习的角度对教师课堂提问方式展开的研究还较为少见.

为此,本文借鉴布鲁姆教育目标分类学对四何问题模型进行改进,设计了细粒度四何问题分类方法探索教师提问的类型和倾向;
将深度学习技术应用于课堂观察,采用自动化技术分类教师课堂问题,为促进教师教学实践能力的发展和大规模教师课堂提问的观察提供有效途径.

1.1 四何问题模型及其局限

基于人脑感知信息和处理信息的自然循环过程,四何问题模型将教师提出的问题分为四类,是何类、为何类、如何类及若何类,分别指向“是什么”、“为什么”、“用什么”、“如果什么”,即内容、原因、方法和其他4类问题,四类问题侧重培养学习者的深度学习思维,“是何”问题反映教师提问的开放性程度,是何问题提出的越多,课堂开放性越低;
“如何”“为何”类问题注重学习者的原理性知识、策略性知识的获取,侧重培养学习者的问题解决能力;
“若何”问题注重学习者的迁移能力的获取,侧重培养学习者的创造性和批判性能力[19](以下简称创新性思维),后3类问题反映学习者高阶思维倾向的培养.

本研究观察40节课堂提问(考虑到文理课堂教学存在差异[20],文科课堂与理科课堂均采样20节课进行分析),课堂教学中的四何问题统计数据见表1.由该表可以看出:(1)教学提问在课堂教学活动中极为重要,教师平均每节课的提问数为34个;
(2)是何问题在四何问题分析模型平均占比达79.65%,无论是文科还是理科课堂,是何问题的占比都处于绝对统治地位,四何问题分析模型中存在着严重的类型不平衡问题;
(3)在四何问题模型中,低开放性思维倾向问题占比79.65%,问题解决倾向占比10%.若将此表统计数据纳入认知水平分类模型[21]中,则记忆性问题与推理性问题的占比分别达40.67%与46.14%,这与四何问题模型反映的深度思维倾向数量相差较大.实际上,四何问题的划分是基于教师问法、疑问词等特征分类,为何、如何、若何3类问题语法策略的划分限制严格,课堂问题堆聚是何类型,导致分布极其不均,不利于课堂提问的持续探索与研究;
其次,是何问题归属为低开放性问题,却包含丰富的思维训练问题,大大降低了课堂提问深度,从而难以达成培养学习者高阶思维能力的目标.

表1 文理课堂中的四何问题分布情况Tab.1 The distribution of 4MAT question in the arts and sciences classroom

针对四何问题模型的不足,学者们提出了一些改进方法.柯旺花[21]结合2种模型观察教师提问,四何问题模型和能力培养模型,能力培养模型包括记忆性、推理性、批判性、创造性和常规管理类问题,多维度地听评课堂提问.王陆等[20]改进四何问题模型,加入“记忆性”、“推理性”、“创造性”和“批判性”能力培养角度,探究八类教师提问规律.两种方法基于横向扩展策略改进模型,关注教师提问方式和问题深度两个维度,但模型实际上是对四何问题模型和能力体现模型的结合,观察者重复两次观察动作,数据重复记录和处理造成观察效率较低.因此,很有必要构建纵向教学思维改进四何模型,实现仅以一个模型完成提问类型和教学倾向2个维度的观察,以便打破课堂言语行为观察的僵化状态.

1.2 分类模式的改进与应用

图1 细粒度四何问题模型Fig.1 Fine-grained 4MAT question model

图2 课堂中的细粒度四何问题分布Fig.2 Distribution of fine-grained 4MAT questions in the classroom

基于授新知、知为何、懂如何、会若何的教学过程,布鲁姆将学习目标分为6类:知道、领会、应用、分析、综合和评价,其中前2种类型停留在简单复刻的浅层学习,后4种类型则反映更深层次的认知[22].6类问题目标相互支持,相互促进,共同构成整个课堂教学.启发于布鲁姆教育目标分类法与四何问题模型在培养能力目标和思维构建方面趋于一致,本文借鉴布鲁姆认知目标分类法改进四何问题模型.具体而言,将是何类型问题的高阶思维倾向剥离出来以进行细粒度处理,构建包含2个层级(第1层级分类为是何、为何、如何和若何问题,第2层级分类为是何问题领会型、分析型和创造型的三类细分)的细粒度四何问题模型(图1).细粒度四何问题延续四何模型能力培养模式,倾向培养学习者的记忆性、求知性和创新性3种思维能力.领会型问题对应知识和领会目标,是指初步认知的具体知识和抽象知识,该问题的解决对应着学习者记忆和理解能力的获取,培养学习者的记忆性思维倾向;
分析型问题对应分析和评价目标,是指事物间的逻辑关系和价值评价,该问题的解决对应着问题解决能力的获取,培养学习者的求知性思维倾向;
创造型问题对应创造目标,是指教师运用多种教学方法,提出与学习者经验和实际生活相关的问题等,该问题的解决通常对应着创新和批判能力的获取,培养学习者的创新性思维.

随机选取一节数学课作为研究课例对问题类型和问题倾向性进行分析,结果见图2与表2.课程中,教师采取基于问题的教学方式,即教师抛出问题后,学习者或学习小组自主探究汇报,最后由教师指导修正的探究过程.从“四何”问题来看,虽然教师课堂提问总数不尽相同,但都以低开放性问题为主,是何问题占比70.69%,其他3类高阶问题占比29.31%,4种问题类型接近全国常模数据,其中相差相对较大的是何、为何类问题也相差无几,是何问题(70.69%)略低于常模数据(72.09%),为何问题(15.52%)略高于常模数据(13.06%),这堂课的提问类型处理得当,抓住高阶思维和综合能力培养的关键点,四何问题模型和细粒度四何问题模型都实现了该问题类型方面的观察.由图2中的问题分布情况“领会型占是何问题比例的63.41%,分析型、创造型占比34.15%、2.44%”可知,借助细粒度四何问题模型可进一步分析问题的思维倾向.

进一步利用认知水平分类模型对这节课的思维倾向进行观察,结果见表3.对比表2与表3可以发现:(1)对于同一次课,四何问题模型所观测的问题数要比认知水平分类模型的问题数略少,这是由于四何模型不计入无关课堂内容的问题;
(2)在表2中,记忆性问题即领会型问题26个,占比44.83%,求知性问题29个,占比50%,创新性问题3个,占比5.17%.说明利用细粒度四何问题模型可以分析出教师的关注点(本节课的关注点为基础原理的学习,通过求知性问题来培养学习者的知识迁移能力,并设计适当的创新性问题培养学习者的高阶思维);
(3)两模型的记忆性、求知性(推理性)的问题数量基本一致,由于求知性问题与创新性问题都是倾向于培养学习者发现问题、解决问题的能力,说明细粒度四何问题模型能够准确地实现高低两阶思维倾向的观察.

综上所述,细粒度四何问题分类模型不但延续了四何问题模型的问题分类能力,而且能利用布鲁姆教育目标分类法对教师课堂提问的思维倾向进行挖掘分析,克服了四何模型观察维度单一的不足,可准确地区分课堂提问中的高低阶思维倾向,实现一个模型观察问题类型和问题倾向2个维度的目标.

表3 认知水平分类模型视角下的思维倾向分布Tab.3 Distribution of thinking dispositions in the perspective of cognitive level classification modell

本节将深度学习模型LSTM[23]实验性地应用于教师课堂提问类型分类研究,实现课堂教学中细粒度四何问题的自动化分类.

2.1 数据收集与标注

国家教育资源平台一师一优课等平台备受教育者的青睐,通过迅捷音频录制工具获取课堂教学视频296个,利用迅捷文字转语音、八爪鱼数据采集器等工具将课堂教学视频转换为文本,并采集课堂文本中的教师教学问题,获取课堂问答11 000余条.

为了获得问题类型标签,招募9名大学生参与数据集的标注,每个标注者根据细粒度四何定义标注全部问题,然后根据high-voting机票原则来确定每个问题的类型归属,表4给出了细粒度四何问题的示例.观察者从关键词特征大概率能分类问题,再结合提问背景和四何问题特征完成分类,问题所属类别取志愿者标记数量最多的一类.原始语料经过处理得到10 000条,具体地,是何问题3 000条,为何问题2 500条,如何问题2 500条,若何问题2 000条,细粒度分类中,领会型问题1 550条,分析型问题1 600条,创造型问题1 330条问题.

表4 细粒度四何问题示例Fig.4 Example of fine-grained 4MAT questions

2.2 数据预处理

数据预处理是将最初的问答文本转换成模型可辨认的文本格式.研究从2方面处理数据:去除语气词、停用词和特殊字符;
进行分词操作.

加载停用词是为了保证分词的准确性,停用词通常没有实际含义,针对细粒度四何问题特点,将出现在文本内容中的介词、虚词、或出现频率较高的无用词汇去除,比如“第一”“你们”“吧”,以减少问答文本数据集的噪声.预处理后的语料如图3所示,每句之间用回车作为分割.

图3 预处理后的语料示例Fig.3 Example of pre-processed corpus

问题分类模型主要是对中文课堂进行,中文中单独的字多数不能准确表达含义,因此先要对文本进行分词处理.模型运用jieba分词及精确模式划分成词,jieba分词是基于Trie树结构动态地切分回答文本,而对于未登录词,则采用HMM模型及Viterbi算法处理.

本研究采用Mikolov等[24]提出的word2vec嵌入词,该向量模型是指将问答文本映射为向量空间的实数向量,其向量的相似度用以表示文本语义的相似度.训练所得的词向量含语义信息,常用的词向量训练模型包括CBOW和SkipGram模型,两者的区别在于通过词预测上下文和通过上下文预测词,本文运用SkipGram模型,维度设置为150维.

2.3 LSTM分类器模型

长短期记忆神经网络模型LSTM作为RNN模型的变种模型,引入门结构实现对网络记忆的控制,较好地解决了循环神经网络的梯度爆炸和消失问题,其在处理中长度序列数据方面具备一定的优势,目前LSTM模型已经在自然语言领域广泛应用.

在本文中,记忆单元的输入为课堂问答文本的词向量.记忆单元通过LSTM动态门单元遗忘无用信息,对不同时刻的文本自动加权,输入ht-1和xt信息,输出0到1之间的小数ft,计算得到要遗忘的信息的比例:

ft=σ(Wf[ht-1,xt]+bf),

(1)

式中,σ为激活函数,W为权重矩阵,b为偏置量.特征序列与特征向量的softsign激活函数σ线性组合得到下一时刻的状态.

it=σ(Wi[ht-1,xt]+bi),

(2)

(3)

LSTM单元在门结构的处理过程不断变化,遗忘门过滤、输入门保留控制保留单元的信息,新状态Ct决定旧状态Ct-1的状态变化,其过程表示为:

(4)

单元状态利用新的参数控制输出,t时刻传递给下一单元的特征信息为:

ot=σ(Wo[ht-1,xt]+bo),

(5)

LSTM模块输出的最终特征h为:

ht=ottanhCt.

(6)

确定好模型后,将LSTM模型的输出输入到softmax层计算,得到问答文档向量在各类别维度的概率,根据概率归类教师课堂提问类别.笔者将教师课堂提问的类别以矩阵表示,通过softmax函数计算后,输出教师问答的预测概率,预测公式如下:

p=softmax(Wp+bp).

(7)

与网络流行信息文本不同,课堂教学言语词义较规范,而网络交流文本容易出现歧义.这一特点为模型利用word2vec训练词向量提供了良好的充分性.根据各种问题类型特点制定表达式自动识别细粒度四何文本,提取类别问题核心词,类别词典中的词越多,关系越密切,问题分类才越精确,训练的分类质量才更好.

2.4 评价标准

性能评估是问答文本分类的最后一阶段,本研究使用准确率(Accuracy)对问答文本分类进行评估,并延伸二分类的评价标准应用于多分类,具体计算公式如下:

(8)

式中,TP与TN分别表示被正确分类的正样本数和负样本数,FP与FN分别表示被错误分类的正样本数和负样本数.Accuracy值表示预测正确的样本数所占百分比,代表整个分类器的准确程度.

2.5 实验结果分析

本研究使用2 000条和896条人工标记的问答文本对LSTM问题分类模型进行测试,结果见表5.观察表5可知,基于词特征的实验效果良好,四何问题比较细粒度是何问题效果更佳,该结果可能的原因是四何问题的关键词少而出现频数高,例如“该怎么去解决数据流失的问题?”、“你是如何解决数据流失的?”中“怎么”“如何”作为“如何”问题的高频关键词,更利于“如何”问题的识别.细粒度是何问题分类准确率较低,其原因可能在于,教师提问方式多样,又加之记忆、分析及创造性问题本就辅车相依,分类难度较大;
还可能在于关键词的词性,词性不同代表问题类型不同,例如细粒度分类中,“原命题和他的否命题之间的关系称作?”考量学习者记忆理解能力,为领会型问题,“大家看到题目中a点和b点之间有什么关系?”考量学习者的分析能力,为分析型问题.两句中都存在“关系”关键词,分类却不同,还要结合其他关键词的权重分析类别,故分类准确率较低.此外, LSTM模型在四何、细粒度是何类别训练集中的准确率和Loss值的变化如图4和图5所示.可以看出,该模型在训练问答语料的过程中,准确率和Loss值随着样本训练数据的增加平滑的变化,模型的训练过程表现良好.总体而言,四何问题分类达95%,细粒度四何问题分类达84%,能较大程度地实现教师课堂提问分析的自动化,解决课堂言语观察困境.

表5 LSTM模型分类结果Fig.5 LSTM model classification results

图4 四何类别训练集的准确率和Loss值变化趋势图 Fig.4 Trend of accuracy and Loss value of the training set of the 4MAT question category

图5 细粒度类别训练集的准确率和Loss值变化趋势图Fig.5 Trend of accuracy and Loss value of the training set of the granularity category

本文针对四何问题模型功能单一问题,聚焦教学倾向思维培养,提出细粒度四何问题分类方法,该方法实现细粒度四何问题模型观察提问类型和提问倾向两个维度的目标.课堂观察应用实验中,该模型与认知水平模型相近证实其可实践性.针对课堂问答文本的上下文较长、语义表征联系紧密等特点,引入LSTM神经网络分类模型.实验模型分类的细粒度四何问题结果,证明LSTM模型应用于课堂言语观察的有效性.

未来工作需要扩大收集课堂言语中的其他课堂观察方法的语料,如S-T分析方法、FIAS分析方法等,探索改进深度学习技术应用于其他的课堂观察模型,构建基于课堂观察的教师成长数据库,提升课堂观察智能化水平.

猜你喜欢 细粒度学习者分类 你是哪种类型的学习者学生天地(2020年15期)2020-08-25十二星座是什么类型的学习者意林·少年版(2020年2期)2020-02-18青年干部要当好新思想的学习者、宣讲者、践行者湘潮(上半月)(2019年3期)2019-05-22在线评论情感分析研究综述软件导刊(2018年2期)2018-03-10基于型号装备?角色的IETM访问控制研究现代电子技术(2018年1期)2018-01-20按需分类小天使·一年级语数英综合(2017年11期)2017-12-05基于web粒度可配的编辑锁设计电脑知识与技术(2017年26期)2017-11-20教你一招:数的分类初中生世界·七年级(2017年9期)2017-10-13说说分类那些事少儿科学周刊·儿童版(2017年3期)2017-06-29基于文本挖掘的微博文本情绪分析技术研究科技资讯(2017年7期)2017-05-06

推荐访问:深度 提问 课堂