采用人工神经网络对肌肉痉挛进行定量评估
现代康复 2000年第5期第4卷 康复医学中人体信息检测技术研究进展
作者:王广志 张立群
单位:王广志(清华大学电机系生物医学工程研究所,北京100084);张立群(RehabilitationInstituteofChicago,Illinois)
关键词:神经网络;痉挛;定量评估;腱反射
摘要 利用系统辨识方法研究脊髓多节段硬化病人与正常对照组的髌韧带反射特性,抽取一系列系统特征参数。在此基础上,探讨利用人工神经网络对测量的系统参数进行分级和评定的方法及效果,证明这种方法对腱反射特征的定量评估是行之有效的。
中图分类号 R496 文献标识码 A 文章编号 1007-5496(2000)05-0647-03
Quantitative assessment of muscle spasticity using artificial neural network
WANG Guang-zhi
(Biomedical Engineering Institute, Tsinghua University, Beijing 100084,China)
ZHANG Li-Qun.
(Biomedical Engineering Institute, Tsinghua University, Beijing 100084,China)
Abstract Patellar tendon reflexes were studied in normal subjects and multiple sclerosis (MS) patients. The input- output properties of the system were characterized using several system parameters. Based on those parameters, an artificial neural network was used to assess the severity of spasticity. The results indicate the potential values of this method in clinical practice as an approach towards quantification of the tendon jerk, a key clinical measure of spasticity.
Key words neural network;spasticity;quantitative assessment;tendon jerk
1 前言
肌肉痉挛(Spasticity)是一种伴随上运动神经元损伤,如脊髓损伤、脊髓多节段硬化、中风以及帕金森病等出现的并发症。其表现包括肌张力升高、肌肉僵硬、抽搐性痉挛等临床症状,影响患者的日常活动能力。目前对肌肉痉挛的评估尚无公认的有效方法,影响了对疾病的准确诊断和对病情以及药物作用的准确判断。在临床和生物医学工程领域,人们一直在探讨对肌肉痉挛程度的客观评价方法,目前常用的方法包括:临床分级测评、摆动实验、肌肉反射与腱反射等,其中只有临床分级测评比较广泛地得到应用。但是,临床分级评估方法是主观标准,不够精确和敏感,不易重复,且不同评测者间难于统一标准,这些因素阻碍了它在量化评估方面的作用。
2 髌韧带反射的特征参数
髌韧带反射是一种常见的运动神经反射,也是对运动神经控制特性评价的重要指标,当用叩诊锤敲击髌韧带时,绝大多数人会产生反射,表现为股四头肌收缩,小腿伸展。髌韧带反射特性变化与肌肉痉挛有密切关系[1~3],但目前尚未见对其定量关系的具体描述。为研究髌韧带反射与肌肉痉挛程度的关系,对不同程度脊髓多节段硬化病人(13例)和正常对照组(13例)的反射特性进行了测量,测量采用自制的测试系统[4,5]。测量中受试对象坐在测试椅上,通过调节座椅位置,将膝关节屈伸轴线与6分量力传感器的轴线重合,并在一定关节角度下将该位置锁定,然后在等长条件下利用装有力传感器的小锤叩击测试对象的髌韧带,由体表电极测量股四头肌反射收缩的肌电(EMG)信号,由力传感器测量膝关节反射力矩。对每一个受试者重复测试20~30次,实验中对叩击力、股四头肌的肌电信号和反射力矩信号进行采集,采样频率为500Hz,对采集到的肌电信号全波整流和低通滤波后进行归一化处理,对力和力矩信号进行低通滤波和解耦处理,并进行了坐标转换[4,5]。
在上述实验基础上采用两种系统辨识方法得到系统的冲击响应函数(Impulse Response Function,IRF),方法一是将重复测量得到的输入输出序列,利用相关分析(Correlation Analysis)方法辨识系统的冲击响应函数;另一种方法是将叩击力量考虑为冲击输入,用输出反射力矩对叩击力进行归一化处理,近似得到每次敲击所对应冲击响应。对上述测量数据,可以分析响应的平均值、方差等参数,以及参数变异情况[5~7]。
对辨识得到的系统冲击响应曲线,为得到定量的评价指标,需要抽取其特征参数。研究中从系统冲击响应曲线上选取了6个特征参数:腱反射增益(Gtr),即系统冲击响应的峰值反射环路延时(Td),收缩时间(Tc),半恢复时间(Thr),收缩率(Rc),半恢复率(Rhr),此外还考虑了测量的系统输出参数,即力矩峰值(Mp)和肌电峰值(EMGp)。图1给出了典型IRF曲线和各特征参数的含义。
图1 IRF曲线与特征参数的含义
为验证上述特征参数是否能作为评价肌肉痉挛的指标,对各参数进行了统计分析处理,利用方差分析(ANOVA)和假设检验(t-test)方法对估计得到的两个对照组的上述8个特征参数进行了对比。为了解上述参数与临床评价指标的相关程度,计算了各组参数的皮尔森相关系数(pearson product-moment correlation coefficient)。
方差分析和假设检验证明,在上述6个特征参数中,Gtr,Td、Thr、Rc、Rhr这5个参数在对照组间存在显著性差异(置信度99%),而Tc的差异则不显著[7,8]。由于大多数参数在对照组间存在显著性差异,表明这些参数可以作为区分对照组的指标。
通过计算各组参数的皮尔森相关系数,对比测量参数与临床指标(Ashworth指标和Reflex指标)的相关程度,可以看到部分系统参数(如Gtr、Rc、Rhr等)与临床评价指标有较强的相关性,而且各参数之间也具有较强的相关性[7,8]。因此提取的特征参数有可能成为一种客观定量的评价指标,作为对病情精确评价的依据。
虽然上述研究表明系统测量参数可以区分不同测试对象组间的显著性差异,测量参数与临床分级指标有较强的相关性。但从这些参数尚无法直接得到对痉挛程度的评价,其主要原因包括:(1)虽然从统计意义上,不同样本组的参数有显著性差异,但具体到每个测试对象,各参数的表现是很复杂的,无法直接根据参数值进行评定。(2)反射特征参数与肌肉痉挛程度之间尚不具备直接确定的关系,无法以特征参数表示病情的程度。(3)肌肉痉挛程度的评价应是病人运动系统功能的综合描述,利用个别测量特征参数难以表示复杂的病情。因此需要探讨如何综合特征参数,对病情进行分类。研究证明,有可能利用测量参数与临床指标样本作为训练集,训练神经网络进行分级工作。利用神经网络可以综合分析测量参数,作出总体的判断,同时,利用神经网络的泛化能力,有可能在较少病例基础上建立对病情较精确的分级系统,且可以随着病例的积累,不断训练和完善网络,达到更好的性能。
3 利用人工神经网络进行分类
3.1 人工神经网络[9,10] 人工神经网络是在对大脑生理研究成果基础上,模拟大脑的某些机理与机制而发展起来的。生理学研究表明,人脑记忆与思维的最基本单位是神经元,神经元间通过突触形成网络,传递彼此间的兴奋与抑制。全部大脑神经元构成及其复杂的网络群体,并由这一网络群体实现记忆与思维。人工神经网络与此对应,是由处理单元经过加权有向连接而构成的网络。其中处理单元是对生理神经元的模拟,而有向连接则对应神经的轴突-树突连接,权值代表了处理单元间影响的强弱。在人工神经网络中,全部加权有向连接构成的互联强度矩阵对应于人脑中信息的长期记忆,而处理单元通常用非线性函数实现单元输入与输出的非线性映射,对应短期记忆。
人工神经网络的研究始于20世纪40年代,经过初期的缓慢发展,中期的衰落,到80年代以后的大发展,已经取得了很大成就。目前提出的神经网络已经有近40种,广泛涉及计算机视觉、语音识别、理解与合成、优化计算、智能控制以及复杂系统的决策等方面。利用神经网络的非线性处理和网络综合能力,可以对复杂问题进行处理,解决传统处理方法无法处理的问题。神经网络应用中的关键问题主要包括:网络类型与结构的选取或设计、处理单元的选取、网络的学习训练、网络性能的评价等,在处理实际问题时应根据目标进行设计。
3.2 网络类型及结构的选取 上述临床分级问题,实际是一个模糊识别的问题,研究的目标是选择和训练神经网络,根据髌韧带反射特征参数对肌肉痉挛程度进行分级工作。许多神经网络都可以完成模式识别和模式分类的工作[9,10],例如感知器、线性神经网络、多层前向网络、自组织特征映射网络等。在研究中对多种网络结构和不同的算法进行了试验,对其训练效率、分类性能、泛化能力等方面进行了对比。
神经网络的输入向量具有8个分量,输出为临床分级指标(即Ashworth指标),分为0~4级。为确定这些向量是否线性可分,首先采用具有多个神经元的单层感知器网络进行了试算。结果表明,上述向量不是线性可分的,感知器神经网络无法找到正确的分类方案。因此需采用较为复杂的多层网络。研究中主要考察了两类网络,即多层前向网络(MLFN)和自组织特征映射(SOFM)网络。实践证明,采用多层前向网络具有比较好的效果。
在处理中考虑到输入向量中的分量值差异很大[8],若对其进行归一化(Normalization)处理,可能会收到好的效果,同时对输出向量也可以进行归一化处理。多层前向网络的输出为连续变量,通过训练网络,可以将输入向量映射在一定范围内。根据研究目标,首先要求网络能够正确分类,为此将输出向量经过一个竞争层传递函数,并比较通过竞争层之后的输出向量,判断其分类是否正确,网络结构如图2所示。
图2 具有输出竞争层的多层前向网络
构造上述网络后,可以对网络性能进行考察,通过调整网络结构(神经元数目、类型),优化训练集的选取和预处理,并对网络的推广能力进行试验,可以对网络性能作出评价。
3.3 训练集与测试集 髌韧带反射特征参数中可以形成训练集的输入数据包括:(1)利用相关分析(Correlation Analysis)方法辨识系统得到IRF而导出的8个特征参数。(2)利用归一处理,近似得到的每一次敲击对应的系统IRF导出的特征参数(每个测试对象有20~30组)。(3)各次系统响应特征参数的平均值。形成训练集的输出数据为临床医生对受试者的分级评价。这些数据在前面的工作中已经获得[4,5,7,8],因此可将上述数据组合构造训练集。为了解网络的泛化能力,需采用训练集之外的输入数据作为测试集对网络性能进行分析。
3.4 网络学习方法 多层前向网络的学习算法有许多种,在研究中使用了MatLabTM的人工神经网络工具箱[11],其中提供了多种算法,包括传统的BP学习算法、BP+惯量算法(动量BP算法)、动量+学习率调整算法、以及建立在优化方法基础上的Levenberg-Marquardt算法等。实践证明,在用BP算法处理离线问题时,动量+学习率调整算法是一种较好的算法,该算法采用了动量法和学习率自调整两种策略,通过动量学习算法,降低了网络对于局部误差细节的敏感性,有效地抑制了迭代计算过程中陷于局部极小点的问题;通过自适应调整学习率,可以缩短学习时间。
上述两种措施的综合运用提高了学习速度和算法的可靠性。
对于选用的自组织特征映射(SOFM)神经网络,是将其作为分类器使用,采用LVQ学习算法进行训练。试验表明其学习效率是很高的。同时,网络神经元数目的选取对分类性能会有较大的影响,因此其泛化能力相对较差。
3.5 综合训练 如前所述,可以选用多组样本数据构造训练集,在试算中发现用特定训练集得到的网络参数对某些测试集的分类效果好,而对另外一些测试集的分类效果则较差,说明特定训练集可能无法涵盖所有模式。通过交叉利用不同的训练集对网络进行训练,并利用交叉有效法对网络性能进行评价,收到了比较好的效果,使网络对训练集和测试集的误差都比较小,说明其泛化能力比较强。
4 初步结果
通过选择和训练神经网络,证明采用神经网络方法,根据髌韧带反射特征参数对肌肉痉挛病情进行分级工作是一种可行的方法,这对于利用工程方法对临床问题作出定量评价有一定意义。下面给出一些初步的结果。
4.1 神经网络的分级性能 试验结果表明,考察的几种网络的分级性能有一定差异。采用自组织特征映射(SOFM)类型的神经网络,可以将其直接作为分类器使用,通过LVQ学习算法形成聚类,从而完成分类工作。通过选取合适的神经元数目,系统可以达到较好的分类性能,但系统参数的选取对性能有较大影响,测试集有时会出现误分的情况,其原因可能是神经网络参数与泛化性能的问题,也可能来自于测试样本,即特征参数指标介于两个分级之间,人工的分级会具有一定误差。在试验中还发现,选取较多的神经元会使训练误差得到改善,但系统的泛化能力会相应下降。
试验证明,通过选取合适的多层前向网络结构和适当的训练,可以达到较好的分类性能,且网络具有较好的泛化能力,其中性能最好的是图2所示的网络结构。该网络采用两层sigmoid型神经元,并通过一个竞争层传递函数处理输出向量。网络的隐层取5~8个神经元,通过综合训练可以达到较好的分类性能。
4.2 能否利用神经网络更精确地分级 从测试得到的特征参数可以看到,一些特征参数的取值范围很大[8],如与临床分级相关性很大的参数Gtr和Rtr,其变化范围均在20倍以上。这种结果表明,临床采用的分级是比较粗的,从测试得到的特征参数出发,有可能进行更细致的分级,这对临床评价和对治疗效果的细致跟踪是有意义的。可以考虑通过神经网络对测试得到的特征参数进行某种量化映射,得到该特征向量对应的分级指标,并在此基础上对临床问题给出判断。从结果来看,人工神经网络可以在一定程度上达到这样的目的。通过综合训练,网络对训练集和测试样本均有较好的精度,说明训练样本的选取对优化系统误差和提高系统泛化能力都有很大影响。
由上述结果可以看到,利用神经网络,可根据输入的特征参数向量,给出对应的分级指标,并具有一定的精度和较强的泛化能力。因此采用神经网络对特征参数进行较精确的分级是完全可能的。存在的困难是由于训练集的输出向量的分级不够细致,因此训练的网络在很大程度上将输入向量映射到训练向量对应的级别上,脱离该分级的偏移被视为误差。由于神经网络具有学习和记忆能力,通过反复训练网络,积累病例,有可能训练出能更精确处理分级问题的网络,从而通过神经网络得到较为精确的客观量化分级。
另外一种可行的方法是将上述测试的特征参量作为衡量病情的指标,并通过神经网络得到由这些参量表示的综合指标,通过积累病例,得到这种指标的评价标准,并将其作为对病情进行判断的依据。这需要结合临床工作积累病例和经验。
4.3 能否由单次实验辨识参数分级系 统冲击响应的特征参量是在20~30次的敲击反射数据基础上得到的,具有较好的信噪比和特异性。如果能够利用单次测量(或少数测量)数据进行系统分级,是有实际意义的。为考察这一问题,从各敲击辨识的特征值中随机抽取部分特征值为神经网络输入进行测试。结果表明,在信号较好的情况下,利用单次敲击反射特征参数进行分级是有可能的,试验中对17名测试对象取10次反射较强的数据(共170组测试向量),进行分级试验,其结果偏离目标向量的共有16组,并且最多偏离目标级别1级。但当随机抽取测试向量时,分级误差显著增加。这表明测试信号的信噪比对分级精度有很大的影响。当测试信号较好时,有可能利用单次(少数次)试验辨识的特征参数进行分级。
5 讨论
通过利用髌韧带反射特征参数对肌肉痉挛病情进行分级工作的尝试,感到还有许多可以探讨的问题。
首先,在神经网络的类型和结构的选取方面,对于特定问题,尚无指导性理论,而网络结构、神经元数目和神经元类型的选取,直接影响网络的性能。本试验的问题虽然比较简单,但在比较各种网络的性能时,也很难给出明确的结论。因此有必要探讨如何选取和评价网络,达到好的效果。
第二,好的网络性能依赖于好的训练集和合理的评价。在这方面需要结合实际问题进行细致的工作。由于临床的分级比较粗,评价也是采用与临床分级比较的结果。如果能够有更细致的训练样本,相信可以得到更细的分级。另外,在处理问题时可以结合统计处理和假设检验等方法,从概率的角度处理问题。相信采用模糊神经网络处理问题也可能有好的效果,但问题的建立和处理有一定难度,需要进一步的工作。
第三,在研究中采用了系统冲击响应特征参数作为网络的输入向量,这样使问题比较简单,便于处理。上述特征参数仅仅是作为量化问题的一种手段,并不能描述系统的全部特征。更好的途径可能是根据系统冲击响应函数的波形进行分类处理,这样可以更充分地利用系统的信息。在生物医学信号处理研究中,人们已经将人工神经网络用于对脑电(EEG)和心电(ECG)波形的特征提取和分类,并收到一定效果。目前面临的问题是,如何建立波形与分级间的联系,即如何得到训练集。一种可能的途径是通过积累病例而达到。在此过程中如果充分利用神经网络处理问题,可能大大加快病例积累的进程。希望下一步能在这方面开展进一步的工作。
第四,本问题处理的病例比较少。积累病例的困难在于,首先要找到合适的病人,在采集试验数据的同时,应由有经验的医生对病例给出比较准确的评估,这需要临床医生与工程人员的密切配合。
总之,通过对肌肉痉挛定量分级评价的初步探讨,结果表明有可能达到较好的效果,由于肌肉痉挛程度的客观评价在病情的评估,药物与治疗效果的评价等方面有重要意义,希望通过研究,发展更为客观、容易操作的评价体系。
作者简介 王广志(1959-),男,副教授,硕士。主要研究方向:人体关节运动的生物力学和神经肌肉控制,人体运动信息检测分析。
参考文献
[1]Levin MF,C Hui Chan.Are H and stretch reflexes in hemiparesis reproducible and correlated with spasticity[J]? J Neurol,1993, 240: 63~ 71
[2]Simons DG, Lamonte RJ. Automated system for the measurement of reflex responses to patellar taps in man[J]. Am J Phys Med,1971, 50:72~ 79
[3]Toft E, Sinkjaer T, Rasmussen A. Stretch reflex variation in the re-laxed and the pre- activated quadriceps muscle of normal humans[J], Acta Neurol Scan, 1991, 84:311~ 315
[4]Zhang LQ, Huang H, Nishida T, et al.Quantification of tendon reflex in normal and spastic limbs Proc[R]. 19th Ann Int Conf IEEE EMB Soc, 1997,19:1958~ 1961
[5]Zhang LQ, Huang H, Sliwa J, et al.System identification of tendon reflex dynamics[J]. IEEE Trans Rehab Eng, 1998,7:193~ 203
[6]Ljung L. System Identification: Theory for the user[M]. New Jersey Prentice- Hall, 1987.168~ 197
[7]Zhang L,Wang G.Dynamics of patellar tendon reflex in spastic multiple sclerosis patients [R].Proc 20 th Ann Int Conf IEEE EMB Soc,1998, 20:2 313~ 2 316