论文阅读笔记---Classification of ECG signals using Machine Learning Techniques
作者:互联网
Classification of ECG signals using Machine Learning Techniques: A Survey
- INTRODUCTION
- BACKGROUND KNOWLEDGE
- ISSUES IN ECG CLASSIFICATION
- SURVEY OF ECG CLASSIFICATION
- ECG CLASSIFICATION
- CONCLUSION
摘要
心电图(ECG)信号的分类在心脏病的诊断中起着重要的作用。准确的心电图分类是一个具有挑战性的问题。本文对心律不齐的心电图分类进行了调查。早期和准确的心律失常类型的检测对于检测心脏病和为患者选择适当的治疗非常重要。不同的分类器可用于心电图分类。在所有分类器中,人工神经网络已变得非常受欢迎,并广泛应用于心电图分类。本文讨论了心电图分类所涉及的问题,并详细调查了预处理技术、ECG数据库、特征提取技术、分类以及解决上述问题的性能措施。本文还对分类器的输入节拍选择和输出分类进行了详细的分析。
关键词—ECG分类;预处理;神经网络;MIT-BIH数据库;特征提取;pan-Tompkins算法
INTRODUCTION
心电图(ECG)是一种医学测试,通过测量心脏产生的电活动来检测心脏异常。心脏产生微小的电脉冲,通过心肌传播。这些脉冲可以通过心电图机器检测到。ECG 机器记录心脏的电活动,并在纸张上显示此数据作为痕迹。然后,该数据由医生解释。心电图有助于发现症状或胸痛的原因,也有助于检测异常的心脏节律或心脏(心脏)异常。
正常健康心脏的心电图具有特征。心脏节律的任何不规则或对心肌的损伤都可以改变心脏的电活动,因此心电图的形状就会改变。医生可能会为因心脏病、吸烟、超重、糖尿病、高胆固醇或高血压的家族史而有心脏病风险的患者推荐心电图。使用心电图可以检测到的心脏疾病包括异常的心脏节律、心脏病发作和心脏扩大。
心电图是心跳的电性记录,已成为心脏病诊断的重要工具之一。由于心脏病死亡率高,早期发现和精确分类心电图信号对患者的治疗至关重要。使用机器学习技术对心电图信号进行分类可以为医生提供大量输入,以确认诊断结果。心律失常类型的分类和检测有助于识别患者心电图信号中的异常。发现异常后,可以发现心脏病,并更好地治疗患者。准确分类为心律失常类型提供了足够的信息来检测心脏病,并帮助医生找到最好的治疗治疗患者。
由于分类过程中涉及的问题,ECG信号的分类是一个具有挑战性的问题。ECG分类中的主要问题是心电图特征缺乏标准化,心电图功能的变异性,心电图模式的个体性,心电图波的遗传力,以及患者心电图波形的变异性。开发能够实时分类心律失常的最合适的分类器也是心电图心律失常分类中的一个问题。ECG信号分类的应用是检测异常类型和诊断新患者比手动更精确。它也用于心脏病的诊断和治疗患者。
ECG 分类包括预处理、特征提取、特征规范化和分类等步骤。本文还对分类器的输入节拍选择和输出分类进行了详细的分析。这项工作对于其他研究人员在识别心电图分类中的问题和分析研究领域非常有用。ECG分类的详细分析和基础知识可以帮助初学者了解研究领域。
本文讨论了心电图和心电图分类的基本介绍(第2节)、心电图分类中的问题(第3节)、心电图分类的详细调查(第4节)和数据库——可用于心电图分类的技术(第5节)。最后,本文提出了结论(第6节)。
BACKGROUND KNOWLEDGE
一个心电图信号由多个心电图节拍组成,每个心电图节拍包含P波、QRS复合波和T波。ECG信号的每个峰值(P、Q、R、S、T 和 U)、间隔(PR、RR、QRS、ST 和 QT)和段(PR 和 ST)都有其正常振幅或持续时间值。这些峰值、间隔和段称为 ECG 特征。图1显示了一个心脏循环的ECG特征,表一中介绍了这些特征及其描述和持续时间。
图1 正常的ECG波形
表1 ECG特征及其正常的持续时间
心电图信号分类在心脏病临床诊断中起着重要的作用。使用心电图诊断心脏病的主要问题是,正常心电图可能因人而异,有时一种疾病对不同患者的心电图信号有不同的迹象。此外,两种不同的疾病对正常心电图信号的影响可能大致相同。这些问题使心脏病的诊断复杂化。因此,利用模式分类器技术可以改善新患者心律失常的诊断。ECG 分类问题是包含诸如普通、LBBB和RBBB等类的多类分类问题。ECG数据可分为两种方式:(i) 心电图信号的分类,(ii) 单个心电图节拍的分类。一个心脏循环由P、Q、R、S、T和U波组成,它们定义了一个心电图节拍。一个心电图信号包含数千个这样的节拍。
预处理、特征提取、归一化和分类是ECG分类的主要的顺序步骤。心电信号可能含有多种噪声(如基线漂移噪声),这些噪声会影响分类的特征提取。因此,预处理是去除噪声的必要步骤。提取不同的心电特征需要特征提取步骤,这些特征作为分类模型的输入。
在噪声去除方面,采用低通线性相位滤波器、线性相位高通滤波器等技术。对于基线调整,采用中位滤波器、线性相位高通滤波器、均值中值滤波器等技术。特征提取技术有离散小波变换(DWT)、连续小波变换(CWT)、离散余弦变(DCT)、S-变换(ST)、离散四维变换(DFT)、主分量分析(PCA)、多贝西小波(Db4)、Pan-Tompkins算法、独立分量分析(ICA)等。对于特征的归一化,使用Z得分和统一标准差(SD)等技术。使用的分类技术有多层感知神经网络(MLPNN)、模糊C-means聚类(FCM)、前馈神经模糊、ID3决策树、支持向量机(SVM)、量子神经网络(QNN)、径向基础函数神经网络(RBFNN)、Type2模糊聚类神经网络(T2FCNN)和概率神经网络(PNN)分类器等。
ISSUES IN ECG CLASSIFICATION
在本节中,我们将讨论 ECG 分类中涉及的问题。提出的问题将有助于初学者了解心电图分类所涉及的挑战。这些问题如下所述:
- ECG特征缺乏标准化:ECG波的边界在时间和振幅域上没有固定的标准。特征提取方法暂时选择ECG特征,因此该方法的准确性取决于这些检测到的特征。这些特征值的小变化可能会导致对大型数据集的分类错误。
- 心电图特征的变异性:个人心率根据当前的生理和心理状况而变化。压力、兴奋、锻炼和其他工作活动可能会改变心率。心率的变化相应地改变了 RR 间隔、PR 间隔和 QT 间隔等功能。这些特征值需要仔细转换,需要消除不同心率的影响。
- ECG 模式的个性化:ECG 模式的个性化是指在 ECG 数据中观察到的测试模式的类内相似性和类间变异性的可能性。它显示了 ECG 模式在足够大的数据集中可扩展的程度。
- 不存在心电图分类的最佳分类规则:对于ECG分类,不存在有助于分类过程的最优分类规则。
- 患者可能有不同的心电图波形:不同患者的心电图可能有不同的信号、时序和振幅斜移,从而改变心电图波形。因此,分类过程需要仔细分类ECG信号。
- 单个心电图中的节拍变化:单个心电图可能包含数千个节拍,这些节拍可能是不同类型的(即心律失常类型)。因此,需要对分类模型进行训练,使其在测试数据集上产生较小的误差。
- 找出最合适的分类器:找出能够实时分类心律失常的分类器是一个问题,因为分类的准确性取决于许多参数,如心律失常类型、心律失常多样性、选择心律失常数据库、所选特征提取技术等。
SURVEY OF ECG CLASSIFICATION
表III显示了对分类器的输入拍选择和输出的详细分析。
①提取多少个拍用于分类(D代表根据类决定,N表示未提及)
②类的数量(即心律失常类型)
③选择节拍的方法(R代表随机,S代表序列,N代表未提及)
④类的节拍比例和分类的类型(B代表节拍,S代表信号,N代表未提及)
该表有助于初学者和其他研究人员选择输入拍比,选择合适的拍数和分类器的输出个数。
表II和表III还表明,为了得到异常类型作为输出,哪些类型需要作为分类器的输入。
ECG CLASSIFICATION
本节讨论了不同的心电图数据库、特征提取技术和基于神经网络的心电图分类。
ECG Database
研究人员用于心电图心律失常分类的数据集有:UCI心律失常数据集和MIT-BIH心律失常数据集(mitdb)。
MIT-BIH数据库包含48条记录(即100至109条、111至119条、121至124条、200至210条、212至215条、217条、219至223条和228至231条记录)。每个记录的持续时间为30分钟,包括两个导联,即modified limb lead II(MLII)和one out of modified leads V1、V2、V4或V5。数据库包含超过109000个单独标记的节拍,属于可能的15种节拍类型之一。数据库包含三个文件,即信号.dat, 批注.atr以及标题.hea. 这个信号.dat二进制文件包含ECG信号。这个批注.atr文件描述了记录中的事件,如心跳。将信号.dat以及批注.atr转换为.txt格式提供在线PhysioBank服务(PhysioBank是一个日益增长的生理信号数据库),即PhysioBank ATM(PhysioBank ATM允许你在Web浏览器中查看PhysioBank中的任何记录和注释)。
Feature extraction technique
研究人员使用的特征提取技术有DWT、CWT、DCT、Db4、Pan-Tompkins算法等。对于使用小波的特征提取,使用的分解级别是2、3、4或8。使用小波变换的缺点是,随着分解层次的增加,特征提取过程的复杂度增加,为了用特征提取去除噪声,需要使用更高层次的分解。
Pan-Tompkins算法是由Pan和Tompkins开发的。该算法包括带通滤波、微分、平方、动窗积分和阈值调整五个步骤。带通滤波降低了心电信号的噪声。微分算子利用高斜率将R峰与其他ECG波区分开来,并抑制P波和T波的低频成分。平方运算是对心电信号逐点进行平方运算。用于进一步增强高频分量,抑制由P波和T波引起的微小差异。积分将平方波形下的面积在适当的间隔内求和。它提取R波的斜率。心电信号经过带通滤波器后,信噪比增大。因此,进行了阈值调整,提高了算法的灵敏度。与其他可用的特征提取技术相比,使用Pan-Tomkins算法的优点是灵敏度和效率都在99%以上。计算工作量也较少。它包括噪声消除和基线消除步骤,因此不需要单独使用其他技术。
Classification of ECG using neural network
许多研究者使用不同类型的神经网络对心电信号进行分类。人工神经网络具有数据驱动、自适应、非线性、快速、准确等特点。它对噪声也有很强的鲁棒性,并且易于扩展。神经网络的优点是:1)利用sigmoid等激活函数提供输入输出之间的非线性映射,解决心电信号分类等非线性问题。2) 它可以获得与统计或确定性方法相似或更好的结果。统计方法对线性问题有很好的效果,但对非线性问题却不能产生很好的效果,因为统计方法是基于给定线性时间序列的假设发展起来的。3) 人工神经网络可以自适应地对心电信号的低频段进行建模。4) 人工神经网络消除了心电信号的时变和非线性噪声特性。
人工神经网络存在的问题有:1)人工神经网络的训练算法不能保证达到全局最小值;2)它不一定能给出整个12导联心电图分类过程的最优解。
采用MLPNN、RBFNN、QNN、PNN等对心电信号进行分类。所有这些神经网络本质上都是静态的、前馈的,没有任何延迟或反馈回路,并且像心电信号一样具有时间序列数据作为输入。利用MLPNN可以更准确地识别和分类心电信号。MLPNN的准确率随隐神经元数目的增加而增加。MLPNN执行静态映射,没有内部动力学。若要添加动力学,请通过动态连接添加静态突触权重,或在隐藏层中添加循环。在MLPNN中,有时可能会出现过拟合问题。为了克服过度拟合的问题,我们需要early stopping策略。反向传播训练的MLPNN收敛速度慢,收敛速度慢,权值初值随机设置,导致输入输出映射不好。在RBFNN中,如果新的输入值集落在所有现有类之外,则这些输入值可以被分类为除现有类之外的其他类。在RBFNN的设计中,需要对隐层中每个径向基函数的中心位置和半径进行设置。RBFNN需要其他技术来寻找这些中心,如k-mean或PSO技术,以提高分类的准确性或性能。与MLPNN相比,RBFNN的误分类误差略有增加。PNN只需要少量的训练或不需要任何训练,只需要进行传播优化。PNN的实验仅限于很小的数据集。随着训练数据量的减小,PNN的性能略有下降。
Performance measures for neural network classifier
在对神经网络分类精度的评价中,人们采用了许多方法。对于心跳分类,使用的度量是sensitivity、specificity、accuracy、MSE、误分类率(RMC)和MCN等。对于信号分类,使用的度量是sensitivity、specificity、accuracy、ROC曲线、MSE、训练时间等。此外,研究人员还使用混淆矩阵作为性能度量。由混淆矩阵计算出的评价指标有sensitivity、specificity和accuracy。
CONCLUSION
本文详细介绍了心电分类中的各种问题、可用于心电数据的数据库、可用于去噪的各种预处理技术、可用于心电数据分类的各种分类器以及评价分类器精度的性能指标。从这项调查中我们可以得出结论,心电图数据分为两种方式,即心电图心跳分类和心电图信号分类。目前对信号分类的研究较少,与心跳分类相比难度更大,因为每个人的正常心电信号可能不同,有时一种疾病在不同的心电信号上有不同的体征,两种不同的疾病对心电信号的影响可能大致相同。在预处理和特征提取方面,主要采用小波分析和Pan-Tompkins等算法。与小波技术相比,在这些方法中,应该使用算法进行预处理和特征提取,因为使用小波提取特征和去除噪声应该使用更高级别的分解。此外,小波技术更为复杂和耗时。此外,对于分类,研究人员使用了不同的技术,如不同的神经网络和支持向量机。然而,据调查,神经网络在训练和测试数据集的分类精度方面更适合于心电信号的分类。大多数研究者都使用灵敏度、特异性和准确性来评价分类器的性能。为了计算这些性能指标,应该使用混淆矩阵。特别是对于心跳分类,许多研究者使用MIT-BIH心律失常数据库和神经网络作为分类器。此外,调查发现MLPNN对ECG搏动分类有很好的准确性。
标签:ECG,Machine,心电图,分类,signals,特征提取,心律失常,分类器 来源: https://blog.csdn.net/qq_39594939/article/details/112431949