type
status
date
slug
summary
tags
category
icon
password
实验草稿
这是一个预实验,现在健康者身上进行测试,再在卒中患者身上测试,这里主要设计健康人身上的实验,用于检验信度和安全性等。
验证混合现实场景下,被试的运动模仿能力有提升,动作理解的反应时间更短,执行动作的标准度更高,使用过程中的心理状态(眩晕感,意愿)更良好,潜在的功能提升(运动想象能力,空间能力等),系统重测信度良好等
实验意义:通过虚拟示教手进行各种动作的演示,被试需要复现动作,沉浸式环境的示教可以提升运动表现,使得评估的天花板效应和地板效应得以缓解
实验设备:视频的动作教学,VR的动作教学,MR的动作教学
找到一篇关键支撑文献,学习实验中对于新方式的论证
主任务绩效 对照实验任务绩效
患者 MMSE 评估认知功能 | Brunnstrom 评估上肢功能 | FMA 评估上肢功能 | ARAT 评估
动机调查(如IMMS) 心理旋转能力改变
统计方法:t/f/卡方检验/方差分析
统计结果,两因素及以上设计先写交互,再写主效应,要是自变量水平大于2,要进行事后检验
参考文献
1
Henssen等人(2020)的研究比较AR与传统横断面方法在神经解剖学学习中的效果,发表于《Anat Sci Educ》Neuroanatomy Learning: Augmented Reality vs. Cross‐Sections - Henssen - 2020 - Anatomical Sciences Education - Wiley Online Library。
采用双臂、多阶段设计,分层随机抽样
基于性别和心理旋转测试(MRT)得分
空间认知能力至少包括空间视觉化能力和空间关系能力两个重要的内容,其中空间视觉化能力指的是心理上加工视觉图形的能力。心理旋转(mental rotation)就是一种空间视觉化能力,它让我们在头脑中对物体或图形的表象进行旋转操作,以达到相应的认知目的。例如,你不需要旋转屏幕,就可以知道下图旋转180°之后的样子,这就依赖于心理旋转。

实验具体设计
一、准备阶段
被试招募与筛选
制定招募标准:18-65岁健康成人,排除有运动或认知功能障碍者。
通过线上/线下渠道发布招募公告(如社交媒体、大学论坛、社区医院等)。
筛选符合条件的被试(电话或面谈确认健康状况)。
签署知情同意书(需伦理审批通过)。
实验设备调试
确保视频、VR、MR设备正常运行(检查硬件连接、软件版本)。
校准运动捕捉系统(如Vicon系统),确保数据准确性。
测试三种条件下的动作演示是否流畅(速度、视角一致性)。
准备备用设备(如备用头显、备用屏幕)以防突发故障。
实验任务设计
确定FMA简单动作(肩屈曲、肘伸展、前臂旋前)的具体执行细节。
确定ART复杂动作(抓握大物体、捏取小物体、物体转移)的演示方式。
设计探索性连续动作(如伸手-旋转-放下的动作序列)。
制作标准化任务脚本(包括演示顺序、提示语、错误处理)。
伦理审批与文件准备
提交实验方案至伦理委员会审批(附知情同意书、SSQ问卷等)。
准备实验手册(流程说明、设备操作指南、紧急处理预案)。
二、实验阶段
实验流程管理
每位被试实验总时长控制在 45-60分钟(含前测、任务执行、后测、问卷)。
按拉丁方设计分配条件顺序(避免顺序效应)。
示例:被试1:视频-FMA → VR-ART → MR-探索性
被试2:VR-ART → MR-探索性 → 视频-FMA
(需提前生成随机顺序表)
任务执行监控
实验员需全程观察被试表现,记录异常行为(如眩晕、困惑)。
确保被试理解任务要求(演示前进行简短培训)。
记录被试对设备的适应时间(如VR/MR首次使用需额外指导)。
心理状态评估
实验后立即发放SSQ问卷(评估眩晕感、恶心、眼疲劳)。
发放定制问卷(评估使用意愿、舒适度)。
确保问卷填写环境安静,避免干扰。
重测信度测试
随机选择10-15名被试,在 1周后重复实验流程。
保持任务顺序与首次实验一致,确保条件可控。
三、数据收集与处理
数据记录
实时保存运动捕捉系统的轨迹数据(三维坐标、关节角度、动作时间戳)。
记录反应时间(演示结束信号到动作开始的时间间隔)。
导出问卷数据(SSQ和定制问卷的电子/纸质记录)。
数据预处理
使用Python/R脚本清洗数据(剔除设备故障或中途退出的无效数据)。
标准化动作轨迹(对齐时间轴,计算RMSE、DTW指标)。
校准反应时间(根据运动捕捉系统时间戳校正)。
数据分析
运动模仿能力:
使用重复测量方差分析(ANOVA)比较三种条件的动作标准度(DTW)、反应时间。
若数据非正态分布,改用Friedman检验。
心理状态:
分析SSQ得分(眩晕感)和定制问卷得分(使用意愿)。
使用ANOVA或非参数检验比较条件差异。
功能提升:
用配对t检验比较前测与后测的心理旋转测试得分。
重测信度:
计算ICC值(组内相关系数),验证两次实验的指标一致性。
结果输出
生成统计结果报告(均值、标准差、p值、效应量)。
制作可视化图表(动作轨迹对比图、反应时间柱状图、心理状态雷达图)。
总结结论(验证MR是否提升运动表现、系统信度是否良好)。
四、其他注意事项
时间分配
每位被试实验时间需预留 1小时(含缓冲时间)。
重测信度测试需安排在 1周后,避免短期记忆影响。
风险控制
提供急救措施(如被试眩晕时的应急处理)。
确保VR/MR设备无安全隐患(如防碰撞区域设置)。
文档管理
所有数据需备份(本地+云端存储)。
保留实验录像(如需复核被试表现)。
实验流程表
阶段 | 步骤 | 具体内容 | 时间分配 |
准备阶段 | 1. 被试招募与筛选 | 纳入标准:18-65岁健康成人;排除标准:无影响运动或认知功能的疾病或损伤。 | 1周 |
ㅤ | 2. 实验设备调试 | 确保视频、VR、MR设备正常运行;运动捕捉系统校准;问卷工具准备。 | 1天 |
ㅤ | 3. 实验任务设计 | FMA(3个简单动作)、ART(3个复杂动作)、探索性连续动作(1个)。 | 2天 |
实验阶段 | 1. 前测(心理旋转测试) | 使用标准化心理旋转测试评估被试的空间能力。 | 5分钟 |
ㅤ | 2. 任务执行(三种条件) | 每种条件(视频、VR、MR)分别完成对应任务:FMA、ART、探索性连续动作。 | 每种条件5-7分钟 |
ㅤ | 3. 后测(心理旋转测试) | 重复前测任务,评估功能提升。 | 5分钟 |
ㅤ | 4. 心理状态评估 | 填写SSQ问卷(眩晕感)和定制问卷(使用意愿、舒适度)。 | 5-10分钟 |
ㅤ | 5. 重测信度测试(部分被试) | 10-15名被试在1周后重复实验流程。 | 1周后重复实验 |
数据收集 | 1. 动作执行数据 | 通过运动捕捉系统记录轨迹、关节角度、动作完成时间等。 | 实时记录 |
ㅤ | 2. 反应时间数据 | 通过信号触发和运动捕捉系统检测动作开始时间。 | 实时记录 |
ㅤ | 3. 问卷数据 | SSQ和定制问卷的评分结果。 | 实验后立即记录 |
数据处理流程表
阶段 | 步骤 | 具体内容 | 方法/工具 |
数据预处理 | 1. 数据清洗 | 去除无效数据(如设备故障、被试中途退出)。 | 自定义脚本(Python/R) |
ㅤ | 2. 动作轨迹标准化 | 对齐动作轨迹时间轴,计算RMSE、DTW等指标。 | 运动捕捉系统软件(如Vicon Nexus) |
ㅤ | 3. 反应时间校准 | 根据信号触发时间计算反应时间。 | 运动捕捉系统时间戳 |
数据分析 | 1. 运动模仿能力分析 | 比较三种条件(视频、VR、MR)的动作标准度(DTW)、反应时间。 | 重复测量方差分析(ANOVA) |
ㅤ | 2. 心理状态分析 | 比较三种条件的眩晕感(SSQ得分)和使用意愿(定制问卷得分)。 | 重复测量方差分析(ANOVA)或非参数检验 |
ㅤ | 3. 功能提升分析 | 比较前测与后测的心理旋转测试得分。 | 配对t检验 |
ㅤ | 4. 重测信度分析 | 计算同一被试两次实验的ICC(组内相关系数)。 | ICC计算(SPSS/R) |
结果输出 | 1. 统计结果报告 | 包括均值、标准差、p值、效应量(Cohen's d/η²)。 | SPSS/R软件 |
ㅤ | 2. 可视化图表 | 动作轨迹对比图、反应时间柱状图、心理状态雷达图等。 | Python(Matplotlib/Seaborn) |
ㅤ | 3. 结论总结 | 总结三种条件的优劣,验证假设(MR是否提升运动表现)。 | 文字描述+统计结果 |
实验目的
这是一个预实验,现在健康者身上进行测试,再在卒中患者身上测试,这里主要设计健康人身上的实验,用于检验信度和安全性等。
验证混合现实场景下,被试的运动模仿能力有提升,动作理解的反应时间更短,执行动作的标准度更高——使用过程中的心理状态(眩晕感,意愿)更良好,潜在的功能提升(运动想象能力,空间能力等),系统重测信度良好等
实验意义
通过虚拟示教手进行各种动作的演示,被试需要复现动作,沉浸式环境的示教可以提升运动表现,使得评估的天花板效应和地板效应得以缓解。实验设备:视频的动作教学,VR的动作教学,MR的动作教学
动作选择
实验中将演示哪些具体动作?这些动作是标准化的,还是需要特别设计?
实验中将演示以下三种任务的动作:
FMA中的3个简单上肢动作:这些动作来自Fugl-Meyer Assessment(FMA),是标准化的康复训练动作,用于评估上肢运动功能。具体的动作可能包括:
肩部屈曲(shoulder flexion)
肘部伸展(elbow extension)
前臂旋前(forearm pronation)
ART量表里的3个复杂动作:这些动作来自Action Research Arm Test(ART),也是标准化的康复评估动作,侧重于手的复杂功能。可能的动作包括:
抓握大物体(如抓握木块)
捏取小物体(如捏取螺母)
物体转移(如将物体从一处移到另一处) (注:同样需要您确认具体动作名称或描述。)
1个探索性连续动作:这是一个非标准化的动作,可能需要根据实验目标特别设计。例如,一个连续的动作序列,如“伸手拿起物体、旋转手腕、放下物体”。具体动作需根据实验目的进一步定义。这些动作中,FMA和ART的动作是标准化的康复训练动作,而探索性连续动作则可能需要根据实验目标定制。请提供具体动作名称或描述,以便进一步明确。
- 动作呈现一致性:三种条件(视频、VR、MR)下,动作的呈现方式如何保持一致?
为了确保三种条件(视频、VR、MR)下动作呈现的一致性,以下是设计方案:
速度:所有条件下,动作的演示速度保持一致。这是您明确提出的要求,可通过预录制或实时控制确保动作节奏相同。
视频条件:通过50英寸屏幕播放,提供多个视角(如正面、侧面、45度角)作为补偿,增强被试对动作的理解。
VR条件:佩戴VR头显,被试从第一人称视角观察虚拟化身执行动作,沉浸感更强。
MR条件:佩戴MR头显,在现实环境中观察虚拟手执行动作,同样以第一人称视角为主。 视角的差异被视为各条件的设计特征,而非一致性要求。
清晰度:根据您的指示,清晰度不纳入考虑范围,因此不做统一调整。
通过速度一致性和视角特征的结合,三种条件在动作呈现上既有可控性,又能体现各自优势。
实验时长
每位被试完成所有条件和评估的总时长预计是多少?
您希望每位被试完成所有条件和评估的总时长为30分钟。这个时间包括:前测(心理旋转测试),三种条件下的任务执行(每种条件一种任务),后测
问卷调查
然而,30分钟可能较为紧张。假设每种条件任务需5-7分钟(包括设备适应和动作模仿),加上前测、后测和问卷(约10-15分钟),总时长可能接近45分钟。为确保数据质量,建议将时长调整至45-60分钟。如果必须限制在30分钟,可简化问卷或减少任务重复次数,但这可能影响结果的可靠性。请确认是否接受延长。
条件顺序
如何平衡三种条件的呈现顺序,以避免顺序效应干扰结果?
为避免顺序效应,特别是学习效应的干扰,您提出每个人在每种条件下只完成一种任务。这是减少学习效应的有效策略。具体实施方法如下:
设计类型:采用组内设计,每位被试体验所有三种条件(视频、VR、MR)。
任务分配:三种任务(FMA简单动作、ART复杂动作、探索性连续动作)分别分配给不同条件,每人只在特定条件下完成一种任务。
顺序平衡:使用拉丁方设计(Latin Square Design),确保条件和任务组合的顺序在被试间平衡。
被试1:视频-FMA,VR-ART,MR-探索性
被试2:VR-ART,MR-探索性,视频-FMA
被试3:MR-探索性,视频-FMA,VR-ART
通过拉丁方设计,每种任务在每种条件下都被等量测试,减少顺序效应的干扰。
准确度测量
动作执行的标准度将使用哪些具体指标?
动作标准度的测量将综合考虑空间和时间维度。以下是具体指标和方法:
空间一致性:
累计坐标均方根(RMSE):测量被试运动轨迹与标准运动轨迹的空间偏差,提供动作的空间一致性。动态时间规整(DTW):计算两个动作序列之间的最小距离,评估整体相似性,特别适合时间不对齐的情况。关节角度相似性:比较被试与标准动作在关键关节(如肩、肘)的角度变化。
时间一致性:
动作完成时间:测量被试完成动作的时间与标准时间的差异。
推荐方法:
主要使用DTW,因为它同时考虑空间和时间维度,适合全面评估动作一致性。
辅助使用关节角度相似性和动作完成时间,提供更细致的分析。
这些方法均为运动分析领域常用指标,无需特别开发,可通过运动捕捉系统实现。
指标类别 | 指标名称 | 描述 | 计算方法/工具 | 适用场景 |
空间一致性 | 累计坐标均方根(RMSE) | 衡量被试运动轨迹与标准轨迹的空间偏差,反映动作轨迹的精确性。 | 通过运动捕捉系统获取三维坐标数据,计算被试与标准轨迹的均方根误差(RMSE)。 | 适用于轨迹对齐良好的动作(如肩部屈曲、肘部伸展)。 |
ㅤ | 动态时间规整(DTW) | 计算两个动作序列之间的最小距离,评估整体相似性,适合时间不对齐的场景。 | 使用DTW算法对齐被试与标准动作的时间轴,计算最小累积距离。 | 适用于复杂或连续动作(如物体转移、探索性连续动作)。 |
ㅤ | 关节角度相似性 | 比较被试与标准动作在关键关节(如肩、肘)的角度变化,反映关节运动模式的匹配度。 | 通过运动捕捉系统提取关节角度数据,计算被试与标准动作的角度差异(如均方根误差或最大偏差)。 | 适用于需要精确关节控制的动作(如前臂旋前、捏取小物体)。 |
时间一致性 | 动作完成时间 | 测量被试完成动作的时间与标准时间的差异,反映动作的节奏控制能力。 | 通过运动捕捉系统记录动作开始和结束时间,计算与标准时间的差值。 | 适用于对时间敏感的动作(如抓握大物体、快速转移)。 |
反应时间测量
如何精确测量动作理解的反应时间?
为精确测量反应时间(演示结束到被试动作开始的时间间隔),设计如下方案:
开始信号: 在动作演示开始前,通过视觉信号(如屏幕倒计时“3-2-1”)或听觉信号(如“开始”提示音)告知被试。演示结束后,立即发出明确信号(如“现在开始”或蜂鸣声),标记被试应开始模仿的时间点。
动作开始标志:
使用运动捕捉系统检测被试手部移动超过某一阈值(如5厘米)的时间点,作为动作开始的标志。
反应时间:
定义为从演示结束信号发出到被试动作开始的时间间隔。实验前需对被试进行简短训练,确保他们理解信号和动作开始的定义,提高测量精度。
心理状态评估
将使用哪些问卷或量表评估眩晕感和使用意愿?
为评估VR和MR体验的眩晕感和使用意愿,建议使用以下工具:
模拟器晕动症问卷(Simulator Sickness Questionnaire, SSQ):
评估VR/MR使用后的不适感,包括眩晕、恶心、眼疲劳等。
实施:被试在实验后填写16项症状评分(0-3分)。
定制问卷:
评估使用意愿和舒适度。例如:
“您对使用这种教学方法的意愿有多高?”(1-5分)
“您觉得这种教学方法舒适吗?”(1-5分)
实施:实验后立即填写,问题简短(3-5题)。
……
这些工具结合使用可全面评估心理状态,SSQ为标准化量表,定制问卷针对实验需求。
被试标准
除了健康状态外,是否有特定的纳入或排除标准?
您提到纳入标准暂不急。在预实验阶段,建议如下基本标准:
纳入标准:18-65岁健康成人,无影响运动或认知功能的疾病或损伤。排除标准:暂无特定要求,可在正式实验中细化。后续可根据目标人群(如康复患者)调整标准。
重测信度
系统重测信度的测试计划是什么?
重测信度指同一被试在重复实验中运动表现的一致性。测试计划如下:
重复内容:选择10-15名被试在一周后重复整个实验(所有条件和任务)。
测量指标:比较两次实验的动作准确度(DTW)和反应时间。
分析方法:计算组内相关系数(ICC),ICC值接近1表示重测信度高。
此方法可验证系统的稳定性和可靠性。
数据分析
计划如何分析数据?将使用哪些统计方法比较三种条件,预期效应量是多少?
以下是数据分析计划:
运动模仿能力、反应时间、动作标准度:
统计方法:重复测量方差分析(Repeated Measures ANOVA),比较三种条件的效果。若数据非正态,使用Friedman检验。
心理状态:
统计方法:计算问卷得分的均值和标准差,若比较条件差异,使用Repeated Measures ANOVA或Friedman检验。
功能提升:
统计方法:配对t检验(Paired t-test),分析前测与后测得分变化。
重测信度:
统计方法:ICC,评估两次实验指标一致性。
预期效应量:
由于为预实验,暂无先验数据。假设MR相较视频在动作标准度上有中等提升,可设Cohen's d为0.5。根据效应量(0.5)、α=0.05、功率=0.80,样本量约需30人(可通过G*Power计算)。
需要绘制的图……
