- · 《高考》栏目设置[06/28]
- · 《高考》收稿方向[06/28]
- · 《高考》投稿方式[06/28]
- · 《高考》征稿要求[06/28]
- · 《高考》刊物宗旨[06/28]
基于 LSTM 的高校高考录取分数预测研究
作者:网站采编关键词:
摘要:一、引言 在高考志愿填报中,精准预测一所高校的录取分数可以有效避免志愿填报的盲目性。由于历年高考试题在难易度上有所不同,高考分数也会随之上下浮动,因此无法根据某高校
一、引言
在高考志愿填报中,精准预测一所高校的录取分数可以有效避免志愿填报的盲目性。由于历年高考试题在难易度上有所不同,高考分数也会随之上下浮动,因此无法根据某高校前几年度录取分数直接估计出当年录取分数。目前,各省考试院都会公布诸多高考数据,包括分批次、分文理科的高校录取最低分、平均分、录取人数信息、分文理科一分一档表、省控线信息等。目前比较流行的高校录取分数预测方法包括线差法、等效分法、平均排位法等,都是通过对高考信息的某种线性变换实现的。然而高校录取人数的变化、历史数据年份的长短等因素以某种不可预知的非线性关系也在影响高校录取分数,因此需要一种能够充分吸纳这些非线性因素的新预测方法,以实现更为精准的高校高考录取分数预测。
二、相关研究
目前对高校高考录取分数预测的主流方法包括线差法、等效分法、平均排位法、修正的平均排位法、组合预测模型、神经网络等。
线差法是用“当年省控线+上年录取分与省控线的差值(线差)”作为预测录取分数的一种方法。该方法计算简便,但预测精度较低,尤其是距离省控线越远预测精度越低。等效分法首先根据上年一分一档表将上年录取分映射为排名,再根据当年一分档表将排名反向映射成预测录取分的一种方法。该方法预测准确度相对较高,但未考虑考生总容量和省控线变化对预测的影响。平均排位法是一种改进的等效分法,它使用前n-1 年最低录取分排名平均值预测第n 年的录取分,同样存在预测精度不高、受考生总容量和省控线变化的影响等问题。修正的平均排位法使用上年高校排名和当年录取人数增减变化修正平均排位法结果,能够部分提升排名靠前的高校录取分预测精度。
组合预测模型是通过各种不同的单项预测模型所组成的一种模型。周帆①将三种不同的单项预测模型组合在一起,通过最小二乘法运算得出所需要的最优变权重的系数,最后再利用常用的误差平方和做对比验证。通过2002——2008 年重庆市文科二批录取分数实验得出,组合模型的预测精度高。但此模型并未能解决高考分数线受题目难易程度的影响等因素。李敬文②等采用能用数学思维阐述不分明现象的模糊数学和需要较少观测数据的灰色预测模型相结合的方式构建模糊灰色模型,此模型综合考虑省控线、招生计划人数、学生对学校的喜好程度等因素。通过兰州大学和兰州交通大学2006——2011 年的数据进行分析检验,得出此模型的预测精度相对较好,但此模型所选取的实验数据较为单一,不能更好说明模型预测的精准度。贾妮③采用神经网络模型,将三年西安工业大学数据进行处理,通过主成分分析进行降维来实现影响因素的归一化处理,最终由BP 反向传播算法计算最佳的权重值,提高了预测精度,此方法依旧存在测试样本集较少问题,不具有代表性。
综上,只有充分考虑历年分数、排名、省控线、招生人数等因素以及相互之间的非线性影响,才能更为精确地预测高校高考录取分数。
三、模型设计
1. 线上百分位。线上百分位是一种综合考虑省控线和排位的录取水平测度,其取值在0%到100%之间。0%表示录取分与省控线相同;100%表示录取分达到上一批次省控线(本科二批或高职专科批)或全省排名第一(本科一批)。
设r=f(c,s,k,y)为成绩映射为排名的函数,c=g(r,s,k,y)为将排名反向映射为成绩的函数,其中,r 为考生排名,c 为考生成绩,s 为考生所在省份,k 为文理科,y 为高考年份。在s,k,y 相对固定的情况下(后续内容均在此假设基础之上),上述映射可以简化为:r=f(c),c=g(r),可通过查询当年一分一档表获得。
设c1为本科一批分数线,c2为本科二批分数线,则考生成绩c 对应的一本线上平均百分位或二本线上平均百分位分别为:
使用线上百分位作为高校高考录取分数高低的测度可以有效的化解因考试题目难易程度而引起的分数不同问题,同时也间接实现了LSTM模型数据输入前的归一化问题。
2.平均排位法。平均排位法是通过对高校前n-1 的投档分数对应的全省排名的平均值所对应的分数即为这一年度高校录取投档分。
3. 长短时记忆(LSTM)神经网络。长短时记忆网络(long short term memory,LSTM)作为一种特殊存在的循环网络④结构,它能够较好的处理神经网络中的长期依赖情况。由Sepp Hochreiter 和Jurgen Schmidhuber 在1997 年提出。LSTM⑤链式结构示意图,如图1。
文章来源:《高考》 网址: http://www.gkzzs.cn/qikandaodu/2020/0724/452.html