从文本复杂性视角考察美国分级阅读研究

引用| 收藏 |打印|下载word

作　　者：

慕君

作者简介：

慕君，南通大学教育科学学院教授（南通 226019）。

原文出处：

全球教育展望

内容提要：

目前影响最为广泛的分级阅读研究是美国分级阅读框架体系，分级种类繁多，分级维度不一。美国英语课程标准将文本复杂性理论写入框架，以定量维度、定性维度以及读者与任务维度作为文本复杂性分析的三大维度，体现了分级阅读研究的最新进展。三个维度的文本复杂性分析框架也为我国分级阅读研究提供了重要启示，我们需要构建定量与定性相统一的文本难度评价标准，确立文本—读者—任务一体化的阅读能力评估模型，打造课内外融通的分级阅读资源开发系统。

期刊代号：G391

分类名称：小学语文教与学

复印期号：2025 年 01 期

关键词：

文本复杂性美国分级阅读启示

字号：大中小

　　分级阅读研究在国内外已经取得丰硕成果，目前影响最为广泛的是美国分级阅读框架体系，其分级种类繁多，分级依据多样。美国《共同核心州立课程标准（英语语言艺术）》（以下简称“美国英语课程标准”）将文本复杂性理论（Text Complexity）写入框架，以定量维度、定性维度以及读者与任务维度作为文本复杂性分析的三大维度，体现了分级阅读研究的最新进展。美国英语课程标准针对不同年级文学文本和信息文本的阅读标准提出了“阅读范围和文本复杂程度”这一指标，并指出测量文本复杂性有三个要素，即文本的定性评价、文本的定量评价以及将读者与文本和任务相匹配。“文本的定性评价”包括“意义、结构、语言的惯例和清晰度以及知识的需求”；“文本的定量评价”包括“可读性测量和文本复杂性的其他分数”；“将读者与文本和任务相匹配”包括“读者变量（如动机、知识和经验）和任务变量（如目的及由分配任务和提出问题所产生的复杂性）”。[1]下面将从文本复杂性理论所主张的三个分级维度梳理美国分级阅读研究的经验，以期为我国分级阅读研究提供启示。

　　一、定量维度的分级

　　文本复杂性分级思想首先考虑的是定量因素。定量因素指的是字长、字频、句子长度等可以通过数据进行统计的方面，这些因素通常可以用计算机软件来计算。“定量分析是指借助可读性公式（readability formula）衡量文本的‘可读性’，即文本难度，通常可以给出所评阅读材料难易程度方面的数值得分，并按其难易程度进行排序。”[2]现以美国具有代表性的量化分级工具蓝思（Lexile）测评系统和文本评价工具TextEvaluator为例进行分析。

　　（一）蓝思测评体系

　　针对不同类型文本进行可读性分析的公式有很多，其中最具公信力且应用非常广泛的是MetaMetrics公司开发的Lexile系统。蓝思阅读测评系统从读者和文本两个维度进行测量：读者测量体现的是其阅读能力；文本测量主要依据蓝思量表上文本的难度值，难度值由低到高表示文本难度由易到难，难度值通常在200L至1700L之间。[3]蓝思阅读测评体系拥有一套自己的计算公式和分析软件，通过这些公式和软件可以确定读者阅读水平和文本难度，而且由于使用的是同一个指标，读者可以根据自己的蓝思值选择合适的文本。比如，一个读者经过测量的阅读能力是800L，那么他选择难度值750L至900L的文本是最恰当的。在分级表达方面，Lexile将读者阅读能力与文本难度测量值统一在一个标尺中（见下页图1），该标尺体现了二者由低到高的数据变化，其优点在于可以依据学生的阅读水平进行文本匹配，并能随着学生年龄的增长跟踪其阅读水平发展情况，达到持续提供合适文本的目的。

　　蓝思测评系统在进行学生阅读能力度量时，会借助学术阅读量表（Scholastic Reading Inventory，简称SRI）与蓝思量表配合使用，采用计算机测评的方式衡量学生的阅读理解。蓝思测评体系将学生文本理解水平达到75%作为达到相应蓝思水平的标准。而蓝思测评系统主要从语义难度和句法复杂性两方面来衡量文本难度。在评估文本的语义难度方面，主要是测量读者在文本中遇到该单词的频率。如果这个单词出现的频率较高，那么即使像“television”这样的长词也很容易理解，这个文本也相对简单；如果这个单词出现的频率较低，那么即使像“ague”这样的短词也会很难理解，这个文本难度也就越高。在评估文本的句法复杂性方面，研究人员发现句子的长度是判断文本难度一个很好的指标，较长的句子需要更长的阅读时间、更多的注意力才能理解。因为句子越长，包含多个短语和从句的可能性就越大，读者阅读起来就越困难，文本难度就越高。[5]蓝思测评系统通过这种可量化的方式来衡量文本难度的做法已被证明是比较科学合理的。

　　蓝思测评体系的独特之处在于，将读者的阅读能力与文本难度相匹配并进行度量，能够使读者根据其阅读能力进行阅读材料的选择，从而获得个性化阅读体验。同时，蓝思测评体系为教材编写和教师开发阅读资源提供了量化标准。但需要注意的是，蓝思测评体系并不能衡量文本意义和语言结构特点，也无法体现文本对读者的知识需求等指标，这就需要借助定量以外的因素进行文本分析。

　　（二）文本评价工具

　　文本评价工具TextEvaluator也是一种定量的分级阅读标准，主要是针对文本难度进行分级，它提供了一种全自动的方法来对选择的阅读文本的复杂性特征进行量化的数据分析。TextEvaluator主要是对经过专业人员编辑的连续性文本进行评分，包括信息文本、文学文本以及信息与文学相结合的文本，它不对非连续性文本和欠规范的连续性文本进行评分，比如表格、列表、诗歌、学生作文等。

　　TextEvaluator对文本的评分分为四个步骤。第一步是组建两个语料库，一个用于模型开发，一个用于模型验证。在构建语料库时需要考虑两个问题：一是不同的文本长度是否能够对应读者在现实生活中所面临的理解挑战；二是相应因变量是否能够反映人工评判员在评估文本时所考虑的更深层次与结构相关的文本变化因素。TextEvaluator语料库通过训练有素的人工评判员提供材料来解决这些问题，每篇文章类似于学生在学校和家庭阅读中可能得到的材料类型，以证明学生的阅读理解能力。第二步是从每个文本提取基于认知的特征得分向量。Text-Evaluator认为，在对一个文本创建连贯的心理表征过程中，有四种类型的认知过程至关重要：（1）理解构成文本的单个单词，包括从长期记忆中检索词语定义，并根据上下文推断单词含义；（2）利用句法知识定义有意义的论点，并将论点组合成句子，再推断单个句子的含义；（3）使用可观察的文本线索（如重复的实词、明确的连接词）填补空白，并推断跨句子和更大篇幅的文本部分之间的连接；（4）利用先验知识和经验开发更完整、更连贯的关于文本的心理表征，也称为情境模型。在此基础上，TextEvaluator构建了旨在自动检测这些特征的自然语言处理（National Language Processing，简称NLP）工具，并分析了所得特征分数与人工评级之间的关系。第三步是检验文本特征之间的相互关系。由于预计许多保留的特征是中度或高度相关的，因此TextEvaluator主要从多个相关特征中进行实证分析。在每种情况下，TextEvaluator都提出了两步解决方案。首先，利用基于语料库的多维度技术对具有高簇内相关性和低簇间相关性的特征簇进行定位。其次，将根据确定集群定义的线性组合应用于文本表征。这样，将多个相关特征得到的结果进行组合，使复杂性评估模型的度量更加稳定。第四步是建立人工评判文本复杂性的模型。这一步的主要目标是提供一个预测模型，将通过上述特征提取过程获取的结果转化为对真实、不可观察的文本复杂性级别的有效、无偏见的评估。在这个过程中，读者和任务相关因素很关键，因为读者在阅读信息文本和文学文本时需要考虑的文本特征存在显著差异。TextEvaluator提供了针对信息文本、文学文本和混合文本优化的三种不同的复杂性模型。[6]

共11条结果上一页12 3 4 5 6 下一页全部展开

AI赋能如何转化为育人实效　　

窦桂梅

小学语...2026年第01期
跨文化视野中的语文建设

陆志平

小学语...2026年第01期
生成式人工智能赋能创意表达：角色、场景与...

赵梓如

小学语...2026年第01期
写作助手智能体支持的小学生写作行为、认知...

赵姝

小学语...2026年第01期
作文智能评改系统的运用与反思　　

李奎艳

小学语...2026年第01期

从文本复杂性视角考察美国分级阅读研究

相关文章：