当前位置:首页 > 生活资讯 > 任子超:高考数学新题型试卷质量分析研究
更新时间:2023-09-03 08:02 信息编号:276831

任子超:高考数学新题型试卷质量分析研究

浏览人气:31
职位MC喊麦    地区
联系人: 电话:


任子超:高考数学新题型试卷质量分析研究

本公众号拥有约300篇优质讲座和课件。 您可以关注公众号查看历史新闻。

推荐阅读:点击下方对应标题可跳转阅读全文

如需下载更多资料,可以加入QQ群。 群内禁止一切无关留言。 由于组内名额有限,初高中组只能加1人。

初中数学解题课题组:

高中数学解题研究组:

2021年全国各地命题研究讲座文章,可点击文末阅读原文、查看,已分享300余场专题讲座,可关注公众号并查看历史新闻。 欢迎转发分享,让全国的师生都能享受到同样的优质教育资源。

引用格式:任子超,陈昂,黄希同,等。 高考数学新试卷质量分析研究[J]. 数学教育学报, 2019, 28(1): 1-7.

作者信息

任子超 1、陈昂 1、黄希同 2、赵轩 1、张民强 2

(1. 教育部考试中心,北京;2. 华南师范大学心理学院,广东广州)

任子超(1961—),男,北京人,教育部考试中心研究员,主要从事数学教育和教育测量研究。

基金项目

2017年全国教育考试与科研规划课题——新高考无文理科后数学命题研究()

概括

新高考不分文理科的改革,改变了数学考试的定位、内容和形式,以及考试组别和级别。 要研究新的题型、试卷结构和难度要求。 根据高考改革要求,数学学科建立了学科评价框架,研究设计了新试卷结构,订购了新试卷,并在广东、山东、广东等地进行了测试。浙江. 针对新高考数学科目的指标和改革方向,对师生进行了问卷调查和访谈。 统计数据分析表明,新试卷质量较高,能够准确区分考生。 问卷和访谈显示,师生认为新试卷的题型、题量和难度基本合理。 今后,数学高考应降低试题难度,减少技巧性,增加适用性。

关键词: 高考改革; 新高考; 高考不分文理科; 新数学试卷; 质量分析

CLC 编号:G632.0 文件代码:A 文章编号:1004–9894 (2019) 01–0001–07

1研究背景及提出的问题

1.1 高考改革

2013年《中共中央关于全面深化改革若干重大问题的决定》为高考改革指明了方向[1],2014年《国家关于全面深化改革若干重大问题的决定》为高考改革指明了方向[1]。 《关于深化考试招生制度改革的意见》(以下简称《实施意见》)进一步明确提出深化高考内容改革的要求,“按照高校人才选拔要求和国家课程标准,科学设计命题内容,强化基础性和综合性,注重培养学生独立思考和运用所学知识分析问题和解决问题的能力”[2]。 而上海、浙江等地启动高考综合改革试点,开展科目改革,“改革考试科目设置。强化高考与高中学习的关联性。水平考试由三项组成”。统考语文、数学、外语科目不变,分值不变。没有文理科,外语科目提供两次考试机会。 2017年、2018年山东、广东等10个省市加入,高考综合改革后,统一考试只有语文、数学、外语三个科目,因此提出了新的要求对于三科统一考试科目的功能定位和区分功能,三科要充分发挥基础科目、普通科目和器乐科目的特点,特别是数学不再分文科和理科,所有考生都使用同样的试卷,数学的考试目标和考试形式亟待改革,以适应高考整体改革和人才选拔的需要。

新一轮考试招生制度改革明确了高考改革的时间表和路线图。 《实施意见》是对科目考试内容和考试要求的总体改革要求,所有科目都要在考试中落实。

1.2 高考评价体系

2016年,教育部考试中心开始高考评价体系开发,明确了“立德树人、培养人才、服务人才、指导教学”的核心职能,考试“基本知识、关键能力、学科素养、核心价值观”的“基础、综合、应用、创新”内容及考试要求[3-4]。 高考数学学科立足高考核心功能,以“一核、四层、四翼”的高考评价体系框架为指导。 构建高考数学学科评价的评价内容框架和指标体系[5]。

随着高考改革的深入和高考评价体系的建立,数学作为统考科目的考试目标、考试内容和考试要求都发生了变化。 准确区分考生,对中学教学起到积极的引导作用。 数学构建学科评价框架,研究设计新试卷结构,开发新题型,订购新试卷,在广东、山东、浙江进行测试,并与试卷统计数据进行系统分析研究与考试目标、题型结构、题型功能等相关的问卷调查结果,对高考数学学科命题改革进行实证分析和理论探索。

2 研究设计

2.1 测试目标

考试设计了完整试卷,考试时间为120分钟。 题型按单选题、选择题、填空题、回答题的顺序排列。 选择题是有多个正确题项的选择题(以下简称选择题)。 所有正确答案得 4 分,错误答案得 0 分,部分答案得 2 分。 填空题包括包含两个空格的填空题,每个正确答案得2分。 采用这样的设计,可以将新题型试题与现行高考中使用的选择题、填空题、回答题进行比较,检验考试效果。 测试的目的是检验新试卷的考试功能和判别功能,听取中学师生对新试卷的反馈意见,完善试题设计和试卷结构,并对新试卷进行理论和实践研究。新高考数学考试改革。

2.2 测试对象

测试于2018年3月至5月进行,受试者为广东、山东、浙江三省高中生。 其中,广东5市18所高中入选(重点高中10所,普通高中8所),共有4745名考生参加测试,其中文科考生2240人,理科考生2505人。 部分参加测试的广东学生还参加了国家试卷I测试,他们的测试结果用于对新试卷进行效度分析和测试。 山东省选拔2所高中(1所重点高中、1所普通高中),共有1031名考生参加考试,其中文科考生411人,理科考生620人。 从浙江省杭州市选取了3所高中(1所重点高中、2所普通高中),共有819名考生参加了测试。 浙江实行了不区分文科和理科的教学和考试改革,因此文科和理科考生没有区别。

完成测试后,考生继续回答匹配的学生问卷,任课教师和阅卷老师完成相应的教师问卷。 然后挑选一些学生和教师代表进行深度访谈。

为了记录考生的答题时间,广东部分考场对单选题和多项选择题采用机考; 填空题和回答题采用电脑呈现题目内容,考生用纸笔作答,然后用高速摄像头拍照上传答案,并记录考生作答时间用于分析考生对每个问题和整篇试卷的回答时间。

2.3 测试工具

试卷是根据新高考要求制定的。 试纸结构如表1所示。

表1 高考新题型结构

选择题有 5 个选项。 每道题给出的选项中,有很多是符合题目要求的。

2.4 问卷调查

问卷分为教师问卷和学生问卷。 教师问卷包括16道新试卷反馈问题和12道高考改革意见问题,共计28个问题。 学生调查问卷包括10道新试卷反馈问题和9道高考改革意见问题,共计19个问题。

2.5 测量理论和数据分析方法

采用了教育心理测量领域的三种重要的测试理论:经典测量理论(CTT)、泛化理论(GT)和项目反应理论(IRT)。 根据三种理论的特点,取其所长,分别从微观和宏观角度对数据进行分析,综合解读测试结果,整合多种评价指标和统计图表,以多元化的方式呈现分析结果,充分体现新试卷的特点质量和考生的能力水平。

运用经典测量理论分析试卷的难度和信度、试题的难度和区分度,比较分析文理科考生答案的差异。 根据考生身份证号,将新题型试卷的测试数据与广东省2018年国一实践考试数据进行效度分析,并使用考生2018年广东省国一实践考试成绩作为分析的标准。 新题型试卷的标准-标准相关效度。

运用泛化理论对试卷的全局方差、泛化系数、信度等指标进行分析。 分析新题型试卷结构,以2018年国卷一为对比依据,运用多元泛化理论对新题型试卷进行分析,为探索各题型最合适的题量提供参考依据通过决策研究确定问题类型。 通过贡献率等衡量指标来比较两卷的结构差异。

题目反应理论用于分析题目难度与考生水平的适应程度、试题的信息量以及试卷的信息曲线。 考试采用“锚”式设计,使试卷质量与考生能力相媲美,为试卷分析提供了多种思路。 一方面从试卷质量的角度验证试卷结构的合理性,另一方面从试卷质量的角度研究新题型试卷对文理科考生的区分功能。考生能力。 研究考生的能力表现,通过新题型测试项目,建立2017年国卷一样题测试数据(2018年1月考试)与2018年国卷一真题(2018年6月考试)数据的联系和比较同一批考生的两篇试卷。

3数据分析

3.1 经典测量理论

3.1.1 新试卷整体质量更好

采用经典测量理论对新试卷的基本测量数据进行统计分析。 表2为2017年、2018年新试卷及全国I卷考试成绩。

表2 2017年、2018年新试卷及国考Ⅰ成绩

表2 2017年、2018年新试卷及国考Ⅰ成绩(续)

注:2017年全国卷一(广东省)数据为新数学试题高中考生抽样数据,并非2017年高考实际考试数据。

新试卷对考生的区分功能是试卷最重要的衡量指标,标准差和变异系数反映了试卷的区分功能。 从表2可以看出,广东和山东所有考生的标准差较高,分别达到22.62和25.36。 对于两省文科考生和浙江省考生,标准差达到20左右,变异系数为0.25。 以上,远高于变异系数0.15的合格水平[6],说明考生分散程度很好,考生区分度满足计量要求。 可能是试卷难度影响了试卷区分文科考生的能力,使得文科考生的标准差稍小一些。 出于同样的原因,广东省和山东省所有考生的试卷信度都在0.8以上,而两省文科考生和浙江省考生的试卷信度都在0.75以上。 新试卷对于三省考生来说有一定难度。 广东和浙江考生最高分仅为128分和123分。 在仍实行文理分离的广东、山东,文科考生与理科考生的差距为15分至30分。 山东理科考生平均分88.31,试卷难度0.58,属于简单水平。 广东和山东文科考生最高分仅为109.5分和112分。 对于文科考生来说,试卷难度较大。 统计数据的偏度和峰度绝对值远小于1,候选者表现出良好的正态分布。 试题难度分布广泛,大部分试题具有良好的区分度。 整篇试卷信息量很大,可以准确衡量大部分考生的能力。

将国卷2017年广东省真考数据与2018年广东省考试数据进行对比发现,考试数据中文理科考生的平均成绩明显高于真考数据中对应分数。 考后面试时,同学们介绍了复习情况,因为广东省高考采用的是国I卷,样本考试考生是2017年高二学生。高考结束后,老师讲解了2017年高考题,同学们还用了2017年国I卷子。 试卷用作练习题。 因此,考生接受了专门的辅导,有一定的练习效果。

3.1.2 新试卷标准相关效度较高

为探究新题型试卷的外部效度,将广东省考生新题型考试数据与2018年全国试卷一实践考试数据进行匹配。 以2018年国卷一实践考试成绩为标准,计算两组。 数据的皮尔逊积差相关系数。 考生国卷一与新试卷成绩高度一致,文科相关系数达到0.76,理科相关系数达到0.78(见表3)。 文理科考生样本结果均表明新题型具有良好的外部效度。 新试卷在所有考生、文科考生、理科考生中具有较高的信度和效度。

表3 新题型试卷的标准相关效度(以2018年全国文理科试卷I为标准)

3.1.3 文理科学生数学水平存在明显差异

广东理科考生平均分比文科考生高15分左右,山东理科考生平均分比文科考生高30分左右。 从考试内容来看,立体几何和统计学、概率的成绩差异最大。 从能力成分来看,空间想象力和创新应用得分差异最大。 详细信息请参见表 4。

表4 广东省文理科考生各考试内容及能力项目得分率差异

对比文科考生和理科考生各考试内容和能力分量的得分率,发现理科考生各维度得分率均高于文科考生,但各维度得分率差异为不同的。 得分率差异(理科生得分率-文科生得分率)排名如下。

文理科考生不同考试内容得分率差异由大到小依次为:立体几何、概率统计、三角函数、解析几何、代数。

文理科考生不同能力成分得分率差异由大到小依次为:空间想象能力、创新应用能力、数据处理能力、计算与解决能力、逻辑思维能力。

3.2 泛化理论

3.2.1 多元广义统计数据

新试卷四种题型的多重泛化研究结果如表5所示。方差分量最大的题型是解答题(3.90),其次是填空题(0.40) )、单选题(0.37)和多项选择题(0.30)。 由于方差分量反映了试卷中不同题型的作用,因此在新题型试卷中,答案题的作用最大,其次是填空题、单项选择题和多项选择题。 -选择题。 同时,四种题型之间的相关系数均较高。

表5 新试卷四种题型的多元泛化研究

注:主对角线元素为各维度的方差分量估计,对角线下方为维度间协方差分量估计,对角线上方为维度间相关系数估计。

3.2.2 多重泛化决策研究成果

根据4种题型试题占比确定权重系数,综合4种题型的总分,即可得到决策研究结果,如表6所示。总分系数(类似于常模参照测试的信度)和信度指数(类似于标准参照测试的信度)分别为0.83和0.72,相对误差和绝对误差均较低。 从各题型来看,解答题的泛化系数和信度指数最高,其次是单选题、填空题和多项选择题。 全局总分的泛化系数和信度指数均高于四种题型的泛化系数和信度指数,说明全局总分的综合是有意义的。

表6 四类新试卷多重泛化决策研究

根据多元泛化决策研究的结果,可以获得四种问题类型对领域内总分的贡献比例(即对全局方差的贡献)。 参见表7。四种题型对全局方差的贡献比例以及原命题时的作业。 分数(即分数比)基本接近。

表7 新试卷四种题型对本领域总分的贡献率

题型比较合理,但题量分布有待优化。 表 7 泛化分析结果显示,新试卷中四类题型(单选题、多选题、填空题、回答题)综合得分总分是有意义的,并且结果对于每种问题类型都很重要。 ,考生的答案与命题老师期望的考试权重比较一致,即四种题型的设置较为合理,但各题型的题数分布还有优化的空间。 通过数据分析发现,增加选择题数量对于提高整体测量可靠性效果最好。

3.2.3试卷结构合理

从泛化分析结果可以看出,新题型试卷中,全局总分的泛化系数和信度指数均高于四种题型的泛化系数和信度指数,说明新题型试卷的综合全局总分是有意义的. 试卷中,四种题型占该领域总分的贡献比例基本接近于命题分配的分值比例。

增加四种题型的题数有利于提高泛化系数和信度指数。 其中,增加选择题,可靠性的增加更为明显。 通过对试卷结构的优化分析发现,为了在保持考试时长和分数稳定的前提下提高泛化系数和信度指标,单选题数量增加至10道,数量选择题数量增加到3道,填空题数量减少。 当题数为4,答题数维持在6时,整体测量信度比较理想,有助于提高考生的得分率。 详细信息请参见表 8。

表8 新题型信度变化

3.3 项目反应理论

3.3.1参考候选人能力比较

为了比较参加新题型考试的三个省份考生的能力差异,利用软件进行同步估算,得到三个省份考生的能力。 结果如下: 从三省所有考生的平均能力成绩来看,浙江省平均能力最高,山东省平均能力最高。 全省排名第二。 从广东省和山东省文理科考生的平均能力成绩来看,山东省文理科考生的平均能力较高。 同时,广东省和山东省理科考生的平均能力高于相应的文科考生。 考生平均能力(见表9)。

表9 3个省份考生平均能力比较

3.3.2 测试信息量

根据IRT试题信息内容结果(见表10)和考试信息内容结果(见图1至图3),除广东省文科考生样本外,新题型试卷均符合预期信息内容在其他不同的候选样本中。 出题比例超过70%,说明新试卷信息量较高,能够更准确地衡量大部分考生的数学能力(注:根据ETS标准,IRT中5的考试信息量对应CTT CTT 度为 0.80,文献来源:YOUNG JW, R, P, et al. the test and item for the toefl ® test. Ets, 2013 (1): 1–27.)。

表10 三省份新试卷信息量概况

图1 广东省新试卷考试信息曲线(所有考生)

图2 山东省新试卷考试信息曲线(所有考生)

图3 浙江省新试卷测试信息曲线

4 问卷调查统计结果分析

问卷调查内容包括对新试卷的反馈以及对新高考数学科目改革的建议。

4.1 对新试卷的反馈

4.1.1 试卷总体评价

从表11可以发现,大多数考生认为新试卷的难度和技巧较高,而大多数教师认为试卷的难度和技巧适中; 从试卷涉及的知识点来看,考生和老师都认为试卷涉及的知识点范围合适,试卷测试的能力比较全面。

表11 试卷评价统计

the new paper has the test paper , may not be able to adapt to the new test paper, to think that the and skill of the test paper are high, but the has not much, so think that the and .

In terms of the and skill of the test paper, with the , most think that the and skill of the test paper are . This may be have for the of the test paper after the of the new and are not by the of the test paper.

4.1.2 Test paper and of of each type

It can be found from Table 12 that most that the total of and the of each type in the paper were . , in terms of types, about one-third of the that the of fill-in-the-blank and - was too high, and half that the of was too large, and most that the size of the test paper and the of each type were .

Table 12 of each type and

with the time (Table 13), it can be seen that can the test paper and the the time, and the time ratio and score ratio of each type are close to each other. Among them, since the - are used to test basic , their time is lower than their score . take the most time to , much more than other types, and also than their score ratio. Since to write down the in order to score , it takes more time for to , which leads to think that the are too many. In post-exam , about the why they the of fill-in-the-blank was too large. Since the new paper has one more than the , and the fill-in-the-blank do not have to check the like the - , so After the fill-in-the-blank , they need to be again, to think that the of fill-in-the-blank is too high.

Table 13 of time for types in arts and

4.1.3 in the test paper

It can be found from Table 14 that the that and to the in the test paper is with the score rate of . Among the in the test paper, and that and are more , by and data , and is given the .

Table 14 Score rate and of each

Note: ① The is the score by or to the of each , and the score range is 1 to 5 ; ② The score rate is the test paper score/total score.

4.2 and on the of the new

4.2.1 after arts and in the

It can be found from Table 15 that the from and that the of the test paper be the arts paper and the paper. Among them, the of who the of the paper is more than the of who the of the arts paper.

Table 15 of the arts and of the

4.2.2 up new types after arts and in the

From Table 16, it can be found that from and that there is no need to add new types after the arts and in the . This may be the that had their own have been using for three years. and have to the . by the of , they do not want to add new types to the test . When new types are added, open and Logic have more .

Table 16 Is it to add new types after the arts and in the ?

4.2.3 for of

It can be found from Table 17 that most and that the of the test in the needs to be . This may be based on the that the level of the will be after the are . They that the the of the to suit the level of all . . For the same , half of the and hope to the of to the of ' . More than half of the and that the of in the test paper is , but one-third of the and think that the of be . About half of the and that the of test be , and and have very on this point. The more are to the of . One-third of the that be , and one-third of the think that be . This may the in among in arts and . 心理。 hope to their so that they can stand out, while arts hope to their to their test . and agree with the size, , , and of the test paper, and that there is no need for . the from and , it can be seen that have a of and do not want major to the .

Table 17 on of test

4.3

4.3.1

It can be found from Table 18 that and are not about ' , but hope to about , and .

Table 18 that want to know

4.3.2 form

Table 18 and Table 19 show that with such as and for the whole paper, are more in their in , , , small and lost, etc., that pay more to the and of their own level.

Table 19 How to score for

and

(1) The of the new paper is good, but there are in the of in arts and . The new type test paper has high and among all , arts , and . The ' on the Paper I and the new type test paper are ( 0.77 for arts, 0.76). The of the test is , and most of the test have good . The paper a large of and can the of most . Among them, the score of is more than 15 than that of arts . In terms of test , the in is solid and and . In terms of , the in is and . In the , we will the on the level of after the "arts and are not into " in order to the of the test paper and the of the test , and a basis for the of the new .

(2) The types are set , but the of needs to be . The of the show that the total score from the four types of (- , - , fill-in-the-blank , and ) in the new paper is , and in each type, the ' It is more with the test by , that is, the of the four types is more , but there is room for in the of the of for each type. data , it was found that the of - has the best on the .

(3) - are to the score rate of the paper and to . The of needs to be . with - , will have more modes when - . from the of - , a of get (2 ), which means that - make it for to get basic , which is to the score rate of the paper. At the same time, the total of and the of in - will the 's time and rate. , with - of the same (4 ), - have more total (5 ), and take to ; among - with the same total of , the of The more, the the score rate of the . In the of "arts and are not into ", the multi-level model of - is to the of low-level and high- . , it is to - in the new , but the The be .

(4) There are in the by arts and on the new . the time of in arts and on types, test and and with , it can be found that there are in the of in arts and . more time to with that test , and adopt a ; arts more time to with lower that test basic , and adopt a score- . 战略。 It is to to carry out the of in , in-depth on its laws and , and the .

(5) More data is to the of . When the test was , the of in was large, and the were and could the level of the . , the of in and is small and the are not , so the of the is to a . , more data is still when the of .

The new test the of the . It is based on the and the of the new . It the , key and , the , and the of of and . The test and for the of the , data and , and laid a solid for the of the of the .

参考

[1] of the of the Party of China on Major [M]. : 's House, 2013.

[2] State . of the State on the of the and [M]. : 's House, 2014.

[3] Jiang Gang. and build the and the of the [N]. China News, 2016-10-11 (3).

[4] Yu Han. Stay true to our and the of the new to build a for the [J]. China , 2018 (3): 17-22.

[5] Ren . on the and of the of the New [J]. ·· , 2018, 38(6): 21-25.

[6] Ren , Guan , Chen Ang. on the of of [J]. China , 2017 (10): 7-12.

on of New Test in

REN Zi-zhao1, CHEN Ang1, HUANG Xi-tong2, ZHAO Xuan1, ZHANG Min-

(1. , , China; 2. of , South China , , China)

: The new had been of arts and . The , and form of the test in CEE, as well as the group and level had . It was to study new types of , paper and . to the of the of , the test in CEE had a , the new of the , made the new type , them in , and .

Focus on of the new type and test , and were among and . The of the data that the of the new test paper was high, and it could the. The of the test paper was. The - with more than one the of the test and to the.

and that and that the new type of , the of items in test paper and the were . In the , the test in CEE the and skill of and the .

Key words: ; 新的 ; is no into arts and ; new type of test paper;

From: of JME. For more high- , you can the and check the news. was by Sun from Xi'an, to focus on high- for and high , to: and all over the to enjoy the same high- . by the are for , , and for . The will the 's name and . If it is , add a at the end of the for . If it is , the . This : The of (ID:) high , and who love to , any to is . your name or name and work unit when a . , only in word are . the to and , and that it is . You are for the .文稿可发在QQ邮箱或添加文末微信直接发给我,感谢各位朋友的鼓励与支持。

更多讲座视频,可点击下方相应标题阅读

往期精选文章回顾

近期优质文章汇总,点击相应标题即可阅读文章

一:高中数学

二:初中数学

三:小学数学

四:学习方法

五:数学之美

点上方蓝字即可阅读相关文章

长按并识别下方二维码,即可关注此公众号,主要分享一些初,高中数学好题,学习方法,由于时间有限,初高中文章交替更新,关注后可在对话框回复数字:1 有小惊喜等着您呢

长按下方二维码即可识别,添加作者“微信”添加时请备注:地区身份,欢迎各位朋友,相识即是缘,感恩遇见

同城信息网

提醒:请联系我时一定说明是从娱乐之家人才站上看到的!
发布者所在地区(仅供参考),IP:60.247.148.23
三个小贴士:求职如何简单的识别信息的真假[?]
本信息来源于娱乐之家人才站 www.ylzjrcz.com
1、打电话/QQ咨询时,应第一时间询问清楚具体的情况。例如:询问具体的场所名字/具体地址/等等常规的信息问题。
2、询问得到的信息,可发给各大QQ群/朋友进行询问,以及多方面/多网站/多渠道进行参考求证,综合各方面考察清楚。
3、内容只供参考,一切三思而后行。如发现此信息涉及虚假,违规等内容问题,请第一时间向本站进行举报! 本文来自:娱乐之家人才站(夜场首选平台)
友情提醒:友情提醒 :凡是以各种理由向你收取费用,均有骗子嫌疑,请提高警惕,不要轻易支付。娱乐之家资讯网www.ylzjrcz.com
特别提示:求职请提高警惕,谨防网络诈骗

帮助中心

用户名:   注册
密  码:
娱乐之家资讯网
当前位置:首页 > 生活资讯

任子超:高考数学新题型试卷质量分析研究

发布时间:2023-09-03 08:02:15
  • 联系人:
  • 电话:

任子超:高考数学新题型试卷质量分析研究

本公众号拥有约300篇优质讲座和课件。 您可以关注公众号查看历史新闻。

推荐阅读:点击下方对应标题可跳转阅读全文

如需下载更多资料,可以加入QQ群。 群内禁止一切无关留言。 由于组内名额有限,初高中组只能加1人。

初中数学解题课题组:

高中数学解题研究组:

2021年全国各地命题研究讲座文章,可点击文末阅读原文、查看,已分享300余场专题讲座,可关注公众号并查看历史新闻。 欢迎转发分享,让全国的师生都能享受到同样的优质教育资源。

引用格式:任子超,陈昂,黄希同,等。 高考数学新试卷质量分析研究[J]. 数学教育学报, 2019, 28(1): 1-7.

作者信息

任子超 1、陈昂 1、黄希同 2、赵轩 1、张民强 2

(1. 教育部考试中心,北京;2. 华南师范大学心理学院,广东广州)

任子超(1961—),男,北京人,教育部考试中心研究员,主要从事数学教育和教育测量研究。

基金项目

2017年全国教育考试与科研规划课题——新高考无文理科后数学命题研究()

概括

新高考不分文理科的改革,改变了数学考试的定位、内容和形式,以及考试组别和级别。 要研究新的题型、试卷结构和难度要求。 根据高考改革要求,数学学科建立了学科评价框架,研究设计了新试卷结构,订购了新试卷,并在广东、山东、广东等地进行了测试。浙江. 针对新高考数学科目的指标和改革方向,对师生进行了问卷调查和访谈。 统计数据分析表明,新试卷质量较高,能够准确区分考生。 问卷和访谈显示,师生认为新试卷的题型、题量和难度基本合理。 今后,数学高考应降低试题难度,减少技巧性,增加适用性。

关键词: 高考改革; 新高考; 高考不分文理科; 新数学试卷; 质量分析

CLC 编号:G632.0 文件代码:A 文章编号:1004–9894 (2019) 01–0001–07

1研究背景及提出的问题

1.1 高考改革

2013年《中共中央关于全面深化改革若干重大问题的决定》为高考改革指明了方向[1],2014年《国家关于全面深化改革若干重大问题的决定》为高考改革指明了方向[1]。 《关于深化考试招生制度改革的意见》(以下简称《实施意见》)进一步明确提出深化高考内容改革的要求,“按照高校人才选拔要求和国家课程标准,科学设计命题内容,强化基础性和综合性,注重培养学生独立思考和运用所学知识分析问题和解决问题的能力”[2]。 而上海、浙江等地启动高考综合改革试点,开展科目改革,“改革考试科目设置。强化高考与高中学习的关联性。水平考试由三项组成”。统考语文、数学、外语科目不变,分值不变。没有文理科,外语科目提供两次考试机会。 2017年、2018年山东、广东等10个省市加入,高考综合改革后,统一考试只有语文、数学、外语三个科目,因此提出了新的要求对于三科统一考试科目的功能定位和区分功能,三科要充分发挥基础科目、普通科目和器乐科目的特点,特别是数学不再分文科和理科,所有考生都使用同样的试卷,数学的考试目标和考试形式亟待改革,以适应高考整体改革和人才选拔的需要。

新一轮考试招生制度改革明确了高考改革的时间表和路线图。 《实施意见》是对科目考试内容和考试要求的总体改革要求,所有科目都要在考试中落实。

1.2 高考评价体系

2016年,教育部考试中心开始高考评价体系开发,明确了“立德树人、培养人才、服务人才、指导教学”的核心职能,考试“基本知识、关键能力、学科素养、核心价值观”的“基础、综合、应用、创新”内容及考试要求[3-4]。 高考数学学科立足高考核心功能,以“一核、四层、四翼”的高考评价体系框架为指导。 构建高考数学学科评价的评价内容框架和指标体系[5]。

随着高考改革的深入和高考评价体系的建立,数学作为统考科目的考试目标、考试内容和考试要求都发生了变化。 准确区分考生,对中学教学起到积极的引导作用。 数学构建学科评价框架,研究设计新试卷结构,开发新题型,订购新试卷,在广东、山东、浙江进行测试,并与试卷统计数据进行系统分析研究与考试目标、题型结构、题型功能等相关的问卷调查结果,对高考数学学科命题改革进行实证分析和理论探索。

2 研究设计

2.1 测试目标

考试设计了完整试卷,考试时间为120分钟。 题型按单选题、选择题、填空题、回答题的顺序排列。 选择题是有多个正确题项的选择题(以下简称选择题)。 所有正确答案得 4 分,错误答案得 0 分,部分答案得 2 分。 填空题包括包含两个空格的填空题,每个正确答案得2分。 采用这样的设计,可以将新题型试题与现行高考中使用的选择题、填空题、回答题进行比较,检验考试效果。 测试的目的是检验新试卷的考试功能和判别功能,听取中学师生对新试卷的反馈意见,完善试题设计和试卷结构,并对新试卷进行理论和实践研究。新高考数学考试改革。

2.2 测试对象

测试于2018年3月至5月进行,受试者为广东、山东、浙江三省高中生。 其中,广东5市18所高中入选(重点高中10所,普通高中8所),共有4745名考生参加测试,其中文科考生2240人,理科考生2505人。 部分参加测试的广东学生还参加了国家试卷I测试,他们的测试结果用于对新试卷进行效度分析和测试。 山东省选拔2所高中(1所重点高中、1所普通高中),共有1031名考生参加考试,其中文科考生411人,理科考生620人。 从浙江省杭州市选取了3所高中(1所重点高中、2所普通高中),共有819名考生参加了测试。 浙江实行了不区分文科和理科的教学和考试改革,因此文科和理科考生没有区别。

完成测试后,考生继续回答匹配的学生问卷,任课教师和阅卷老师完成相应的教师问卷。 然后挑选一些学生和教师代表进行深度访谈。

为了记录考生的答题时间,广东部分考场对单选题和多项选择题采用机考; 填空题和回答题采用电脑呈现题目内容,考生用纸笔作答,然后用高速摄像头拍照上传答案,并记录考生作答时间用于分析考生对每个问题和整篇试卷的回答时间。

2.3 测试工具

试卷是根据新高考要求制定的。 试纸结构如表1所示。

表1 高考新题型结构

选择题有 5 个选项。 每道题给出的选项中,有很多是符合题目要求的。

2.4 问卷调查

问卷分为教师问卷和学生问卷。 教师问卷包括16道新试卷反馈问题和12道高考改革意见问题,共计28个问题。 学生调查问卷包括10道新试卷反馈问题和9道高考改革意见问题,共计19个问题。

2.5 测量理论和数据分析方法

采用了教育心理测量领域的三种重要的测试理论:经典测量理论(CTT)、泛化理论(GT)和项目反应理论(IRT)。 根据三种理论的特点,取其所长,分别从微观和宏观角度对数据进行分析,综合解读测试结果,整合多种评价指标和统计图表,以多元化的方式呈现分析结果,充分体现新试卷的特点质量和考生的能力水平。

运用经典测量理论分析试卷的难度和信度、试题的难度和区分度,比较分析文理科考生答案的差异。 根据考生身份证号,将新题型试卷的测试数据与广东省2018年国一实践考试数据进行效度分析,并使用考生2018年广东省国一实践考试成绩作为分析的标准。 新题型试卷的标准-标准相关效度。

运用泛化理论对试卷的全局方差、泛化系数、信度等指标进行分析。 分析新题型试卷结构,以2018年国卷一为对比依据,运用多元泛化理论对新题型试卷进行分析,为探索各题型最合适的题量提供参考依据通过决策研究确定问题类型。 通过贡献率等衡量指标来比较两卷的结构差异。

题目反应理论用于分析题目难度与考生水平的适应程度、试题的信息量以及试卷的信息曲线。 考试采用“锚”式设计,使试卷质量与考生能力相媲美,为试卷分析提供了多种思路。 一方面从试卷质量的角度验证试卷结构的合理性,另一方面从试卷质量的角度研究新题型试卷对文理科考生的区分功能。考生能力。 研究考生的能力表现,通过新题型测试项目,建立2017年国卷一样题测试数据(2018年1月考试)与2018年国卷一真题(2018年6月考试)数据的联系和比较同一批考生的两篇试卷。

3数据分析

3.1 经典测量理论

3.1.1 新试卷整体质量更好

采用经典测量理论对新试卷的基本测量数据进行统计分析。 表2为2017年、2018年新试卷及全国I卷考试成绩。

表2 2017年、2018年新试卷及国考Ⅰ成绩

表2 2017年、2018年新试卷及国考Ⅰ成绩(续)

注:2017年全国卷一(广东省)数据为新数学试题高中考生抽样数据,并非2017年高考实际考试数据。

新试卷对考生的区分功能是试卷最重要的衡量指标,标准差和变异系数反映了试卷的区分功能。 从表2可以看出,广东和山东所有考生的标准差较高,分别达到22.62和25.36。 对于两省文科考生和浙江省考生,标准差达到20左右,变异系数为0.25。 以上,远高于变异系数0.15的合格水平[6],说明考生分散程度很好,考生区分度满足计量要求。 可能是试卷难度影响了试卷区分文科考生的能力,使得文科考生的标准差稍小一些。 出于同样的原因,广东省和山东省所有考生的试卷信度都在0.8以上,而两省文科考生和浙江省考生的试卷信度都在0.75以上。 新试卷对于三省考生来说有一定难度。 广东和浙江考生最高分仅为128分和123分。 在仍实行文理分离的广东、山东,文科考生与理科考生的差距为15分至30分。 山东理科考生平均分88.31,试卷难度0.58,属于简单水平。 广东和山东文科考生最高分仅为109.5分和112分。 对于文科考生来说,试卷难度较大。 统计数据的偏度和峰度绝对值远小于1,候选者表现出良好的正态分布。 试题难度分布广泛,大部分试题具有良好的区分度。 整篇试卷信息量很大,可以准确衡量大部分考生的能力。

将国卷2017年广东省真考数据与2018年广东省考试数据进行对比发现,考试数据中文理科考生的平均成绩明显高于真考数据中对应分数。 考后面试时,同学们介绍了复习情况,因为广东省高考采用的是国I卷,样本考试考生是2017年高二学生。高考结束后,老师讲解了2017年高考题,同学们还用了2017年国I卷子。 试卷用作练习题。 因此,考生接受了专门的辅导,有一定的练习效果。

3.1.2 新试卷标准相关效度较高

为探究新题型试卷的外部效度,将广东省考生新题型考试数据与2018年全国试卷一实践考试数据进行匹配。 以2018年国卷一实践考试成绩为标准,计算两组。 数据的皮尔逊积差相关系数。 考生国卷一与新试卷成绩高度一致,文科相关系数达到0.76,理科相关系数达到0.78(见表3)。 文理科考生样本结果均表明新题型具有良好的外部效度。 新试卷在所有考生、文科考生、理科考生中具有较高的信度和效度。

表3 新题型试卷的标准相关效度(以2018年全国文理科试卷I为标准)

3.1.3 文理科学生数学水平存在明显差异

广东理科考生平均分比文科考生高15分左右,山东理科考生平均分比文科考生高30分左右。 从考试内容来看,立体几何和统计学、概率的成绩差异最大。 从能力成分来看,空间想象力和创新应用得分差异最大。 详细信息请参见表 4。

表4 广东省文理科考生各考试内容及能力项目得分率差异

对比文科考生和理科考生各考试内容和能力分量的得分率,发现理科考生各维度得分率均高于文科考生,但各维度得分率差异为不同的。 得分率差异(理科生得分率-文科生得分率)排名如下。

文理科考生不同考试内容得分率差异由大到小依次为:立体几何、概率统计、三角函数、解析几何、代数。

文理科考生不同能力成分得分率差异由大到小依次为:空间想象能力、创新应用能力、数据处理能力、计算与解决能力、逻辑思维能力。

3.2 泛化理论

3.2.1 多元广义统计数据

新试卷四种题型的多重泛化研究结果如表5所示。方差分量最大的题型是解答题(3.90),其次是填空题(0.40) )、单选题(0.37)和多项选择题(0.30)。 由于方差分量反映了试卷中不同题型的作用,因此在新题型试卷中,答案题的作用最大,其次是填空题、单项选择题和多项选择题。 -选择题。 同时,四种题型之间的相关系数均较高。

表5 新试卷四种题型的多元泛化研究

注:主对角线元素为各维度的方差分量估计,对角线下方为维度间协方差分量估计,对角线上方为维度间相关系数估计。

3.2.2 多重泛化决策研究成果

根据4种题型试题占比确定权重系数,综合4种题型的总分,即可得到决策研究结果,如表6所示。总分系数(类似于常模参照测试的信度)和信度指数(类似于标准参照测试的信度)分别为0.83和0.72,相对误差和绝对误差均较低。 从各题型来看,解答题的泛化系数和信度指数最高,其次是单选题、填空题和多项选择题。 全局总分的泛化系数和信度指数均高于四种题型的泛化系数和信度指数,说明全局总分的综合是有意义的。

表6 四类新试卷多重泛化决策研究

根据多元泛化决策研究的结果,可以获得四种问题类型对领域内总分的贡献比例(即对全局方差的贡献)。 参见表7。四种题型对全局方差的贡献比例以及原命题时的作业。 分数(即分数比)基本接近。

表7 新试卷四种题型对本领域总分的贡献率

题型比较合理,但题量分布有待优化。 表 7 泛化分析结果显示,新试卷中四类题型(单选题、多选题、填空题、回答题)综合得分总分是有意义的,并且结果对于每种问题类型都很重要。 ,考生的答案与命题老师期望的考试权重比较一致,即四种题型的设置较为合理,但各题型的题数分布还有优化的空间。 通过数据分析发现,增加选择题数量对于提高整体测量可靠性效果最好。

3.2.3试卷结构合理

从泛化分析结果可以看出,新题型试卷中,全局总分的泛化系数和信度指数均高于四种题型的泛化系数和信度指数,说明新题型试卷的综合全局总分是有意义的. 试卷中,四种题型占该领域总分的贡献比例基本接近于命题分配的分值比例。

增加四种题型的题数有利于提高泛化系数和信度指数。 其中,增加选择题,可靠性的增加更为明显。 通过对试卷结构的优化分析发现,为了在保持考试时长和分数稳定的前提下提高泛化系数和信度指标,单选题数量增加至10道,数量选择题数量增加到3道,填空题数量减少。 当题数为4,答题数维持在6时,整体测量信度比较理想,有助于提高考生的得分率。 详细信息请参见表 8。

表8 新题型信度变化

3.3 项目反应理论

3.3.1参考候选人能力比较

为了比较参加新题型考试的三个省份考生的能力差异,利用软件进行同步估算,得到三个省份考生的能力。 结果如下: 从三省所有考生的平均能力成绩来看,浙江省平均能力最高,山东省平均能力最高。 全省排名第二。 从广东省和山东省文理科考生的平均能力成绩来看,山东省文理科考生的平均能力较高。 同时,广东省和山东省理科考生的平均能力高于相应的文科考生。 考生平均能力(见表9)。

表9 3个省份考生平均能力比较

3.3.2 测试信息量

根据IRT试题信息内容结果(见表10)和考试信息内容结果(见图1至图3),除广东省文科考生样本外,新题型试卷均符合预期信息内容在其他不同的候选样本中。 出题比例超过70%,说明新试卷信息量较高,能够更准确地衡量大部分考生的数学能力(注:根据ETS标准,IRT中5的考试信息量对应CTT CTT 度为 0.80,文献来源:YOUNG JW, R, P, et al. the test and item for the toefl ® test. Ets, 2013 (1): 1–27.)。

表10 三省份新试卷信息量概况

图1 广东省新试卷考试信息曲线(所有考生)

图2 山东省新试卷考试信息曲线(所有考生)

图3 浙江省新试卷测试信息曲线

4 问卷调查统计结果分析

问卷调查内容包括对新试卷的反馈以及对新高考数学科目改革的建议。

4.1 对新试卷的反馈

4.1.1 试卷总体评价

从表11可以发现,大多数考生认为新试卷的难度和技巧较高,而大多数教师认为试卷的难度和技巧适中; 从试卷涉及的知识点来看,考生和老师都认为试卷涉及的知识点范围合适,试卷测试的能力比较全面。

表11 试卷评价统计

the new paper has the test paper , may not be able to adapt to the new test paper, to think that the and skill of the test paper are high, but the has not much, so think that the and .

In terms of the and skill of the test paper, with the , most think that the and skill of the test paper are . This may be have for the of the test paper after the of the new and are not by the of the test paper.

4.1.2 Test paper and of of each type

It can be found from Table 12 that most that the total of and the of each type in the paper were . , in terms of types, about one-third of the that the of fill-in-the-blank and - was too high, and half that the of was too large, and most that the size of the test paper and the of each type were .

Table 12 of each type and

with the time (Table 13), it can be seen that can the test paper and the the time, and the time ratio and score ratio of each type are close to each other. Among them, since the - are used to test basic , their time is lower than their score . take the most time to , much more than other types, and also than their score ratio. Since to write down the in order to score , it takes more time for to , which leads to think that the are too many. In post-exam , about the why they the of fill-in-the-blank was too large. Since the new paper has one more than the , and the fill-in-the-blank do not have to check the like the - , so After the fill-in-the-blank , they need to be again, to think that the of fill-in-the-blank is too high.

Table 13 of time for types in arts and

4.1.3 in the test paper

It can be found from Table 14 that the that and to the in the test paper is with the score rate of . Among the in the test paper, and that and are more , by and data , and is given the .

Table 14 Score rate and of each

Note: ① The is the score by or to the of each , and the score range is 1 to 5 ; ② The score rate is the test paper score/total score.

4.2 and on the of the new

4.2.1 after arts and in the

It can be found from Table 15 that the from and that the of the test paper be the arts paper and the paper. Among them, the of who the of the paper is more than the of who the of the arts paper.

Table 15 of the arts and of the

4.2.2 up new types after arts and in the

From Table 16, it can be found that from and that there is no need to add new types after the arts and in the . This may be the that had their own have been using for three years. and have to the . by the of , they do not want to add new types to the test . When new types are added, open and Logic have more .

Table 16 Is it to add new types after the arts and in the ?

4.2.3 for of

It can be found from Table 17 that most and that the of the test in the needs to be . This may be based on the that the level of the will be after the are . They that the the of the to suit the level of all . . For the same , half of the and hope to the of to the of ' . More than half of the and that the of in the test paper is , but one-third of the and think that the of be . About half of the and that the of test be , and and have very on this point. The more are to the of . One-third of the that be , and one-third of the think that be . This may the in among in arts and . 心理。 hope to their so that they can stand out, while arts hope to their to their test . and agree with the size, , , and of the test paper, and that there is no need for . the from and , it can be seen that have a of and do not want major to the .

Table 17 on of test

4.3

4.3.1

It can be found from Table 18 that and are not about ' , but hope to about , and .

Table 18 that want to know

4.3.2 form

Table 18 and Table 19 show that with such as and for the whole paper, are more in their in , , , small and lost, etc., that pay more to the and of their own level.

Table 19 How to score for

and

(1) The of the new paper is good, but there are in the of in arts and . The new type test paper has high and among all , arts , and . The ' on the Paper I and the new type test paper are ( 0.77 for arts, 0.76). The of the test is , and most of the test have good . The paper a large of and can the of most . Among them, the score of is more than 15 than that of arts . In terms of test , the in is solid and and . In terms of , the in is and . In the , we will the on the level of after the "arts and are not into " in order to the of the test paper and the of the test , and a basis for the of the new .

(2) The types are set , but the of needs to be . The of the show that the total score from the four types of (- , - , fill-in-the-blank , and ) in the new paper is , and in each type, the ' It is more with the test by , that is, the of the four types is more , but there is room for in the of the of for each type. data , it was found that the of - has the best on the .

(3) - are to the score rate of the paper and to . The of needs to be . with - , will have more modes when - . from the of - , a of get (2 ), which means that - make it for to get basic , which is to the score rate of the paper. At the same time, the total of and the of in - will the 's time and rate. , with - of the same (4 ), - have more total (5 ), and take to ; among - with the same total of , the of The more, the the score rate of the . In the of "arts and are not into ", the multi-level model of - is to the of low-level and high- . , it is to - in the new , but the The be .

(4) There are in the by arts and on the new . the time of in arts and on types, test and and with , it can be found that there are in the of in arts and . more time to with that test , and adopt a ; arts more time to with lower that test basic , and adopt a score- . 战略。 It is to to carry out the of in , in-depth on its laws and , and the .

(5) More data is to the of . When the test was , the of in was large, and the were and could the level of the . , the of in and is small and the are not , so the of the is to a . , more data is still when the of .

The new test the of the . It is based on the and the of the new . It the , key and , the , and the of of and . The test and for the of the , data and , and laid a solid for the of the of the .

参考

[1] of the of the Party of China on Major [M]. : 's House, 2013.

[2] State . of the State on the of the and [M]. : 's House, 2014.

[3] Jiang Gang. and build the and the of the [N]. China News, 2016-10-11 (3).

[4] Yu Han. Stay true to our and the of the new to build a for the [J]. China , 2018 (3): 17-22.

[5] Ren . on the and of the of the New [J]. ·· , 2018, 38(6): 21-25.

[6] Ren , Guan , Chen Ang. on the of of [J]. China , 2017 (10): 7-12.

on of New Test in

REN Zi-zhao1, CHEN Ang1, HUANG Xi-tong2, ZHAO Xuan1, ZHANG Min-

(1. , , China; 2. of , South China , , China)

: The new had been of arts and . The , and form of the test in CEE, as well as the group and level had . It was to study new types of , paper and . to the of the of , the test in CEE had a , the new of the , made the new type , them in , and .

Focus on of the new type and test , and were among and . The of the data that the of the new test paper was high, and it could the. The of the test paper was. The - with more than one the of the test and to the.

and that and that the new type of , the of items in test paper and the were . In the , the test in CEE the and skill of and the .

Key words: ; 新的 ; is no into arts and ; new type of test paper;

From: of JME. For more high- , you can the and check the news. was by Sun from Xi'an, to focus on high- for and high , to: and all over the to enjoy the same high- . by the are for , , and for . The will the 's name and . If it is , add a at the end of the for . If it is , the . This : The of (ID:) high , and who love to , any to is . your name or name and work unit when a . , only in word are . the to and , and that it is . You are for the .文稿可发在QQ邮箱或添加文末微信直接发给我,感谢各位朋友的鼓励与支持。

更多讲座视频,可点击下方相应标题阅读

往期精选文章回顾

近期优质文章汇总,点击相应标题即可阅读文章

一:高中数学

二:初中数学

三:小学数学

四:学习方法

五:数学之美

点上方蓝字即可阅读相关文章

长按并识别下方二维码,即可关注此公众号,主要分享一些初,高中数学好题,学习方法,由于时间有限,初高中文章交替更新,关注后可在对话框回复数字:1 有小惊喜等着您呢

长按下方二维码即可识别,添加作者“微信”添加时请备注:地区身份,欢迎各位朋友,相识即是缘,感恩遇见

同城信息网

推荐阅读

更多

发现更多资讯 >>

友情链接:

娱乐之家资讯网

COPYRIGHT © 2021 娱乐之家资讯网 版权所有

有什么问题加客服微信咨询:zx81024163

浙ICP备2021028673号

浙公网安备 33010202001912号