e-Assessment协会

专业术语

电子评估协会正在专门为电子评估制定新的更新术语表。请评论,建议修改或补充。这是一个正在进行的项目,因为术语总是在演变,新的术语经常被引入。下面有76个术语,包括许多类型的问题。

通过联系我们网站联系方式或通过电子邮件给我们[电子邮件受保护]


学期 定义
自适应反馈 给予评估项目上学生的反馈,其中根据学生的回答修改反馈,特别是响应被标记为不正确的情况,并且通常旨在为答案错误提供指导。
先进的问题类型 高级问题类型是高于标准问题类型的级别。它们通常需要复杂的设置和/或标记,或者它们包含复杂的标记算法。另外,项目内的交互水平也可能超过标准问题类型的相互作用,因此它们可以被视为测试内的单独应用程序。
应用程序接口 一台计算机程序使其功能和数据可用于另一台计算机程序的软件机制。例如,测试标记程序可能使用API​​来从项目库程序中请求正确的标记密钥。API广泛用于网络应用程序,其中程序分布在不同的服务器上(例如在多供应商系统中)。
评估 仪器(例如屏幕检查)用于判断学习,技能获取或教育准备或针对一组预先确定的标准。评估文书包括考试和测试,还包括投资组合和基于观察的判断方法。
评估交付系统 软件,硬件和通信组件的组合,以及管理电子评估的端到端过程的人为进程。注意:这包括将测试包提供给中心,支持考试管理功能,向候选人提供评估,恢复其答复,管理标记和核查流程,设定标准和提供评估结果。它通常不包括评估的写作和生产。
评估引擎 在计算机上进行电子测试的软件应用程序。引擎通常由通用组件(如网络服务器)和专有软件(如特定的电子评估程序)组成。一个电子评估系统通常由一个评估引擎、一个题库和一个项目和测试创建系统组成。
音频捕获问题类型 音频问题类型允许捕获候选人创建的声音。可以是语言测试中的口语句子,也可以是表演中的音乐。音频问题类型有时可以作为问题工作流的一部分自动开始,或者作为证据捕获的一部分由候选人控制。如果作为语言测试的一部分,将音频捕获问题与屏幕上的文本或声音文件结合起来是合适的。屏幕上的视觉反馈很重要,这样候选者才能清楚地知道捕获已经开始并正在录制音频。捕获可以是开放的,但是这会产生更大的文件大小。考虑文件大小很重要,因为语言测试可能是在网络或电力不稳定的地方进行的。使用屏幕上的化身有时可以帮助提高对话的质量,如果候选人觉得他们是在和一个真实的人说话,那么音频的质量就不太可能受到影响。给候选者回放捕获的机会也很有用。音频质量会受到候选人的信心、麦克风的质量或其他候选人的背景噪音的影响。 Simple techniques of placing candidates completing an audio capture section of a test next to candidate undertaking a written component can be good ways of reducing background interference. The more practice a candidate has with this type of question, the better they will perform. Classed as an Advanced Question Type, audio capture questions are not typically auto-marked.
创作工具 用于为电子评估创建项目和测试的软件。注意:该术语更广泛地使用,以涵盖用于在屏幕上创建任何内容的工具(例如电子学习,通用网页等)。
古典测试理论(CTT) CTT是与测试中的物品的性能以及测试本身的表现有关的一系列统计措施,并用于提供有关测试质量和其内部物品的证据。CTT’s most commonly used measures include facility (the difficulty of a question), discrimination (the extent to which candidates’ performance on a question mirrors their performance on the test as a whole) and Internal Reliability (the extent to which the test assesses a single construct). CTT is relatively easy to implement and understand, but it cannot distinguish between facets of the candidates and the questions (eg whether a question is hard or a candidate cohort is weak), and for this reason Modern Test Theory, including Latent Trait Theory, Rasch and Item Response Theory are increasingly widely used.
基于能力的评估 基于关于判决的证据收集的评估过程关于满足描述能力的固定绩效标准的进展。注意:个人的能力评估尚未考虑在被评估的更广泛组中的其他人的表现(正如规范参考评估所在的情况),并且通常限于通行/失败评分(也称为掌握/非掌握)。能力测试通常用于练习评估的许可证(例如,医生,飞行员等)。
计算机自适应测试 CBA测试,其中选择了测试中的连续项目,用于通过主要用于项目的属性和内容的计算机算法绘制,以及测试接受者对以前的项目的响应。自适应测试通常用于总结测试,其中可以针对给定的测试持续时间(或可以提供较短的测试)来确定更准确的测试结果(与线性测试相比)。为了诊断目的,自适应测试允许在考试的特定时间内更详细地探索测试接受者的知识,以便进行测试。自适应测试的两个主要特征是(a)测试员一旦他们搬到(b)测试后,就无法返回问题并将测试者对物品的回答必须是计算机标记的。
基于计算机的培训 来自20世纪80年代的术语描述了由计算机调解的学习(通常是独立计算机)。Note: the modern term ‘e-learning’ differs in that there is an expectation with e-learning that more of modern computing’s capabilities (rich media, interactivity, etc.) will be used, as well as the computer’s connection to internal networks and the internet.
计算机辅助评估 计算机辅助评估(或“计算机辅助评估”)描述了在计算机的帮助下提供的评估。这包括在计算机上开发的屏幕上交付的评估,但在纸上交付,标记在屏幕上或以电子方式(例如使用OMR)。
基于计算机的评估 是CAA的一个子集,面试者会在屏幕上看到问题,然后用电脑回答问题。
内容管理系统 用于管理和维护网站的技术和编辑内容的软件工具的一般网络术语。注意:在电子评估设置中,它描述了一种用于管理评估内容(项目和测试)的软件工具,通常包括创作工具/系统和项目库。
运输方式 递送方法是指候选人拍摄的测试方式,这可以在线,离线,安全锁定或打开书籍。
交付平台 在客户端设备上使用的平台,例如运行windows的PC,运行Ubuntu的Linux,运行Android的智能手机,运行iOS或windows的苹果Mac等。
诊断测试 非认证的评估用作学习计划的一部分,以确定学习者的优势和劣势,以便提供适当的学习计划。一般在计划开始时进行,因此诊断评估需要评估学习者在相关知识,技能和理解范围内的现有程度,以便提供人性化学习。
数字日志 在评估的实践经验和技能的在线记录。日志通常会补充正式的考试。
拖放问题类型 拖放问题类型需要候选人将答案选项拖到相关的丢弃区域;这对于许多问题场景来说非常有用.Drag和删除项目可以是文本,视频或基于图像的。被归类为标准问题类型,可以使用此问题自动标记。
电子评估 电子评估描述了一系列技术用于增强教育评估过程的一些或所有元素。常见的活动是屏幕上的测试(候选人读取并在屏幕上答案),电子标记(屏幕上的标记标记 - 扫描候选脚本或屏幕响应),远程媒体(屏幕上拍摄)测试被远程损失),项目银行(测试问题存储在数据库中并以电子方式组装成测试),而E-POSTFOLIO(候选人组装他们学习技能评估的数字证据)。
电子产品组合 电子产品组合包含数字项目 - 在网上捕获的思想,证据,反思,反馈等,有人可以向选定的受众呈现为他们的学习和/或能力的证据。
电子产品组合管理系统 电子产品组合评估系统使得许多个人的学习和技能能够在线捕获和评估。
任何/或问题类型 任何/或问题类型都需要候选人从两个不同的答案选项中选择正确的答案,最常用于选项为真/假或是/否的问题。被归类为标准问题类型,可以使用此问题自动标记。
终点评估 在学生雇主签署学生后,英国改革学徒的最终评估为准备评估。通常,评估被评分和旨在表明学生在学徒期间所涵盖的技能和知识范围都有能力。
公式条目问题类型 等式条目问题类型提供具有等式创建工具的候选者,其允许它们在答案框中进入复杂的方程。被归类为标准问题类型,自动标记取决于方程的复杂性和技术的功能。
论文样式问题类型 一篇论文问题要求候选人在回答问题时编写扩展的回复。通常,该问题类型将提供具有文本格式特征的候选者,有时能够插入诸如方程或符号之类的符号信息。由于候选人可能花费的时间长度可以花在这个问题上,重要的是,他们的响应是以规则的间隔安全地存储,以防止由于计算机错误而丧失数据。允许的响应长度周围的选项通常可以设置为控制候选者提供的信息量。重要的是,候选人能够查看通过扩展窗口或滚动提供的所有信息。被归类为标准问题类型,因此无法使用此问题而无法实现自动标记。
扩展匹配题型 扩展匹配问题类型允许项目作者创建候选人需要通过在两个选项列表之间进行正确的链接来响应候选问题。此问题类型中有许多链接选项可用:这些链接包括一对一的关系,一个到多个或多个。被归类为标准问题类型,可以使用此问题自动标记。
熟悉的测试 候选人或中心使用的测试。候选人将使用该测试来模拟实际评估,以便它们可以熟悉交付界面,问题类型和测试结构。中心可以使用该测试在考试日之前突出任何技术或过程问题。
文件附上问题类型 文件附加问题类型允许测试提供商用文件呈现候选人,该文件可以在上传回到标记的测试之前更改或编辑。此问题类型非常适合任何需要候选人使用外部软件的评估,例如Microsoft Word或Microsoft Excel。可以使用信息预先填充文件,也可以留空。可以安全地启动文件以防止候选人访问其他文件或其他应用程序。通常,候选设备和标记的设备都需要对文件类型的软件进行许可,否则可能无法访问查看或编辑文件。被归类为标准问题类型,使用此问题类型通常不可能自动标记,因此需要人为标记。
填写空白问题类型 填充空白问题类型需要候选人在文本的通过中填补空格。可以在文本段落中为多个空格设置多个答案选项。填写空白可用作使用从列表问题类型中选择的替代方案。为响应提供的空间通常扩展到给出的答案,以免将候选人提供给所需的响应。被归类为标准问题类型,可以使用此问题自动标记。
热点问题类型 热点问题要求候选人选择图像中的一个或多个区域。这一点的变体包括提供单点答案,其中包含用于在该点周围标记容差的选项。多个点也可以与区域映射一起使用。在大多数情况下,期望候选人选择精确像素是不合理的,因此通常建议使用标记公差。被归类为标准问题类型,可以通过此问题进行自动化。
互操作性 计算机系统组件的特征,其允许组件根据技术标准对信息进行交互,这些标准定义对用户有用的功能。IMS QTI规范是电子评估域内的互操作性规范的示例。IMS QTI允许将测试问题(及其相关元数据)从一个系统转移到另一个系统。
项目响应理论 IRT是一种常用的现代测试理论统计方法来衡量候选人和测试问题的表现。Part of a wider group of Latent Trait Theory approaches (including Rasch analysis) it is based on the idea that the probability of a correct response to a question is a mathematical function of both the candidate’s ability and the item’s difficulty (in contrast to CTT where the difficulty of a question is fixed). IRT analysis is more complex to implement and interpret but provides analysts with information to distinguish between the ability of a candidate and the difficulty of an item, thereby allowing comparisons of different candidate groups and/or different tests.
李克特规模问题类型 通常与调查相关联,李克特量表问题类型为候选人提供了根据规模(例如“非常同意,同意,中立,不同意,非常不同意”)的方法。这些问题类型通常用于调查。尺度可以具有固定点,因此是水平MCQ,或者具有可变点,因此需要一定程度的标记公差。被归类为标准问题类型,可以使用此问题自动标记。
锁定 锁定是指评估期间使用的递送方法。锁定模式的评估应防止候选人在评估期间不允许访问应用程序或不允许的互联网站点。
手动测试生成 从项目库中生成测试实例(测试表格)的手册(人类)过程(根据可能涉及选择算法和随机化的正式或非正式规则集)。注意:这是广泛应用于电子评估设置,其中候选人并非所有的同时进行测试,因此需要各种测试(以降低测试和问题曝光的可能性),但是在需要之间的已知可比性测试以便可以给出公平的结果。另请参阅自动测试生成,越来越多地使用需要大量的测试实例。
元数据 一项信息(例如一项评估项目)的参考数据,使该信息能够根据各种选择标准系统地存储在数据库(例如一个题库)中,并从数据库中检索。在评估的上下文中,元数据通常指诸如资格或测试规范、课程内容和性能统计等方面。注意:元数据在符合开放标准时最有用,例如IMS LOM或QTI。
移动学习 使用移动ICT设备进行学习的一种电子学习(例如,PDA,手机或智能手机,手持电脑等)。手持便携式设备的可用性和普及导致了一些研究使用M学习技术进行电子评估。
多项选择问题类型 一个多选题(MCQ)给了考生很多答案选项(“干扰选项”),只有一个答案是正确的(“关键”)。这些是在计算机测试中最常见的屏幕上的问题类型。文本通常用于答案选项,但图像或方程式也可以使用。在某些版本的MCQ测试中,可能会要求考生提供所选答案是否正确的置信水平,然后将其用作计分计算的一部分。通常情况下,答案都是随机选择的,以减少评估失误,但必须注意不要只在最后一个选项上使用标点符号,如果是为了随机选择答案顺序,也可以使用“以上所有选项”这样的术语。因为正确的答案会显示在屏幕上,所以在写答案的时候就需要考虑如何避免正确的答案脱颖而出,例如,考生有时可以使用作者在答案中明确的逻辑来猜测“最长的答案”。这类问题也可以使用加权评分,其中一个选项的奖励可能大于另一个选项。被归类为标准问题类型,可以使用此问题自动标记。
多重响应问题类型 多个响应问题类似于多项选择问题,除了多个答案选项除外是正确的,可以要求候选人通过选择所有正确选项来响应。此类问题有时可以使用图像或方程式。变型还可以包括对可以给出多少响应的组合响应和控制。被归类为标准问题类型,可以使用此问题自动标记。
导航 在电子评估上下文中,在屏幕评估中从屏幕移动到屏幕的屏幕按钮和其他控件(通常从问题到问题),并提供对其他非问题特定功能的访问- 屏幕帮助,打印功能,退出等)。它们通常与有关具体问题的控制视觉上分开。
Non-question物品 非问题项目包括:在测试开始时看到的介绍页;信息页,考生在考试过程中可能会看到;并完成页面,候选人提交他们的测试和提交他们的回答后看到。非问题项目不会被分配一个标记。典型的非问题项目可能在测试的计时部分之外可见。
非获得问题 非评分项目是一个问题(任何类型),该问题已被列入收集性能数据的测试中,但不会影响候选人测试的分数或结果。例如,它是一种常见的做法,可以在实时测试中嵌入新的问题,但在试点项目上的分数不计入候选人的分数。
数字条目问题类型 数值输入问题允许候选人只输入数字作为对问题的响应。这可以是精确值,或者在项目作者设置的范围内。应考虑与答案预期的任何符号进行考虑,例如$,£或€。考虑国际交货时,应考虑使用逗号或小数。被归类为标准问题类型,可以使用此问题自动标记。
客观问题 测试项目,其中响应评估客观标准。这可能是一个单一简单的响应,例如在一个多项选择项中,标准是学生是否已经选择了正确的选择。可能是学生的答复有一定的属性,可以客观地建立。在CAA中,这通常是自动完成的。
离线评估 在测试期间不使用互联网连接的屏幕评估(尽管互联网连接可能用于在测试开始之前将测试传送到客户端计算机,并且在测试完成后上传候选响应)。
关于方案评估 在英国改革学徒的评估,在学徒学习计划期间发生,并且在学生之前由雇主签署的终点评估
按需评估 用于公共考试。在可以提供测试以适应学生或其学习计划的日期和时间的评估,以适应学生或他们的学习计划(尽管它可能不一定包括所有的日子,时间和日期)。与许多传统评估相比,在固定日期和时间(或有限的日期和时间)。
屏幕评估 将候选人交付给计算机屏幕上的评估,以及候选者在屏幕上提供响应(例如通过键入或单击正确的响应)。
在线评估 在测试期间依赖于Internet连接的屏幕评估,以下载后续问题并上传候选答案。有时被称为“在互联网上进行测试”。
在线/离线评估申请 当Internet连接无法使用时,捕获和评估电子产品组合的学习和技能证据的能力,并且在建立Internet连接一旦建立Internet连接,将添加到电子产品组合中的证据和评估。
开源电子产品组合 这是一个与社交网络混合的个人学习环境,允许个人收集,在他们控制的空间中反思并在线分享他们的成就和开发。
开放标准 共享,可自由提供和国际商定的计算机系统标准,旨在实现通信和互操作性。
光学字符识别 光学字符识别(OCR)是计算机可以识别已扫描的纸张上的手写响应中的文本和其他标记的手段,并将其转换为数字格式。OCR通常用于评估以电子标记对多项选择测试的纸张响应(例如,在泡沫纸上)
光学标记读者 扫描基于纸张的测试的设备,并将学生用笔或铅笔转换为数字数据的标记。
参数化项目类型 根据问题内嵌入的公式生成问题的一个项目。这种随机化通常使用公式动态进行,因为测试或向学生传递给学生,与使用随机化参数在创作期间生成项目变体的克隆。术语参数是指公式用于创建项目实例的变量。许多不同类型的问题(例如MCQ,GAP填充等)可以使用参数化。
个性化 学生配置IT系统以满足他们的个人需求(例如,选择优选的字体大小和颜色,音频等尺寸,音量等级)。还指的是用户体验更复杂的自定义,以满足个人学习需求。
多元物品 具有两个以上响应类别的项。例如,一个5分的Lykert类型量表,项目可以得分为0、1、2、3、4,或者一个部分信用问题,考生可以得分在0到4分之间。多位点是一个典型的与IRT和其他形式的潜在特征分析相关的术语。
投资组合评估 评估学生组合工作组合的评估被评估。这种类型的评估与测试不同(在单个场合施用)
实用性 在运营效率和可行性方面评估的可行性。由于携带它所需的成本或时间,有效和/或可靠的评估可能并不实际。高质量的评估有效,可靠和切实可行,尽管在这三个测试质量的关键要素之间通常会进行权衡。
专有软件 需要许可证(通常为您的费用)来自特定公司的软件。
心理测试 提供候选人的人格特质的一个或多个措施。它是最常用的,作为就业过程的一部分,或支持职业指导。通常,它试图根据他们的优选行为或适用于与他人合作,管理压力,首选工作环境和思维风格的各个方面的候选人。
qti lite. QTI技术互操作性规范的更简单的测试版本,用于测试和项目,允许在一个系统中开发的测试将在其他系统上传送到候选者(目前在1.2版本中)。查看www.imsglobal.org/question/index.cfm#version1.2Lite.
问题和测试互操作性 测试和项目的技术规范,其允许测试和测试要在多个系统上互换的测试和测试项目。它具体涉及内容提供商(即,问题和测试作者和发布者),创作和内容管理工具,评估交付系统和学习系统的开发人员。它旨在促进系统之间评估内容的互操作性。
丰富的反馈意见 反馈超出为项目提供正确或模型答案,以及对为什么学生所选响应错误的简单解释。丰富的反馈通常是个性化的候选人的响应,旨在处理潜在的误解。
从列表问题类型中选择 从列表问题类型中的选择需要通过从答案选项的下拉列表中选择来从文本的段落中选择丢失的单词。从列表中选择选项通常可以在文本段落中多次使用。可以启用答案选项的随机排序,以帮助防止评估期间的弊端机会。被归类为标准问题类型,可以使用此问题自动标记。
简短答案问题类型 简而言之,答案问题将允许候选人与测试作者指定的单词或短语响应问题。可以提供多个答案变体,并且可以包括诸如静脉敏感的设置。被归类为标准问题类型,可以通过此问题进行自动标记,但有些响应可能需要是人为标记的。
源材料 源材料是诸如图像,PDF或可编辑材料之类的文件,其在评估期间可用于候选者(例如包含读数材料,公式等)。候选者能够通过制作笔记或突出显示部分与这种材料进行交互是有用的。
电子表格问题 电子表格问题类型在会计评估中是常见的。通过在问题中嵌入电子表格,候选人无需访问第三方应用程序。可以将问题预先填充数据,以待候选人静态可见或启用候选人的编辑。问题也可以作为空白提供给候选者,以便它们可以以被视为合适的形式呈现它们的数据。电子表格问题类型允许格式化文本和数据,并支持包含公式和其他常见电子表格功能。电子表格问题还可以提供候选人,其能够与注释证明他们的回复。被归类为先进的问题类型,可以通过基于逻辑的标记规则来实现自动标记,可以标记完全正确的答案或计算正确的答案,但源数据不正确。
标准问题类型 标准问题类型通常是QTI支持的项目;但是,定义不同。在某些位置,可以考虑拖放等标准问题类型。定义标准问题类型的优选方法是创作和标记不需要复杂编码的位置,并且该项目通常可以由计算机自动标记,或者在没有对复杂标记工具的情况下标记的人。
表问题 表通常用于呈现数据的呈现或提供候选者可以以表格形式记录其响应的方法。表问题类型可以由测试作者创建,然后作为候选的静态信息呈现,或者作为候选人编辑的部分完成表。问题类型也可以作为响应选项作为响应选项,如图形和图表等其他选项。表格问题还可以具有格式的文本和单元格对齐。被归类为标准问题类型,可以使用此问题类型自动播放。
测试包 评估系统中的电子文件包,包括测试内容以及任何嵌入式应用程序、资源,有时还有测试播放器,它被传送到客户端PC上供学生承担。测试包可能已经从颁发机构/认证机构的中央服务器,到测试中心的本地服务器,然后到客户端PC,在高风险的评估情况下,将受到相当大的文件和通道安全。
测试玩家或测试驱动程序 A piece of software which resides on the client PC and “runs” the test content package, i.e. displays the questions on-screen, collects the student responses, controls the exam clock, and access to other resources, etc. Some test players are considerably more complex than others. For example, a test player for MCQ items may be little more than some scripts embedded in standard HTML pages, whereas the test player for innovative items or a sophisticated test made up of simulations and embedded applications would be a substantial computer application in itself. Sometimes test players are pre-installed on client PC’s and sometimes they are delivered to the client PC along with the test content itself.
视频捕获问题类型 视频捕获问题类型可以捕获音频和视频。与基于循证的评估相关联,文件可以直接记录到评估中或附加证据。被归类为高级问题类型,通常通过人类标记在屏幕上进行标记。
基于网络的评估 通过Internet或Intranet(例如中心或教育权限内联网)从服务器提供的评估以及候选使用标准浏览器访问评估。如果基于互联网,则评估可以在线与候选响应实时交付给服务器的候选响应,以便自动标记和立即反馈。