本站小编为你精心准备了张量分析在脑医学图像的应用参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
【摘要】医学影像中的CT、MRI图像诊断是目前医生确诊疾病的重要依据。另一方面,大脑作为人类最复杂也是最重要的器官之一,对于脑部图像的特征提取和分类具有重要意义。传统上对图像特征提取习惯从向量的角度出发,这样忽略了图像结构特点。为了解决这个问题,本文结合高维空间数据结构,以数据张量化为重点将传统的PCA算法升级为Tensor-PCA,并选择当下最流行的SimulatedBrainphantomDatabase数据集作为本文的仿真对象,经过实验证明,数据张量化的方法在提取图像的特征上具有良好的适用性。
【关键词】张量模型;脑部医学图像;主成分分析;特征
提取随着脑成像技术和计算机的快速发展,使得人们能够更加深入的探索大脑奥秘。MRI成像技术已成为当代最佳的辅助工具之一,帮助了医生对病情诊断的同时也提供给学者们作为最佳的实验选择对象,从而获得了相关领域的关注。但由于MRI成像技术复杂,存在着相当大的数据运算量,传统算法很难解决这一难题,本文以数据张量化的方法来打开突破口[1]。张量是目前能够解决此类问题的主要方法之一,其最大的特点是能表达高维空间的数据特性,因此,如何将医学图像进行数据张量化,并将张量化方法进行有效的推广,是本文的主旨所在[2]。
1张量代数
1.1张量的概念
张量(tensor)是一个多线性函数,其可以被直观的理解为一个多维数组,它是由标量和向量扩展而来,标量、向量、矩阵是张量的特殊形式。标量可以理解成0阶张量,向量是1阶张量,而矩阵为2阶张量[3]。
1.2高维图像的张量表示
由张量概念可知,二维图像可以用二阶张量进行描述,而高维图像需要用三阶张量来表示。第一阶表示了图像的宽度,第二阶表示图像的长度,而第三阶则表示图像的矢量维数[4]。1.3张量模型首先要定义张量模型数学框架,为了表达简洁,以二阶张量的代数为例,它很容易拓展到高阶张量。定义1.张量加法:给定尺寸均为的张量At和Bt,两者之和Ct=At+Bt是相同尺寸的张量,其中表示二阶数组Ct的(i;j)的元素,R则代表实数域。
2张量的主成份分析(Tensor-PCA)
在传统运算(PCA)的基础上,推广到张量的变体TPCA[6]。
3实验
3.1实验来源
为了评估TPCA的性能,本文所使用的数据集是关于脑部医学的开放数据库:SimulatedBrainphantomDatabase,brainWeb网站提供了模拟数据操控台可以对脑图像数据进行仿真,此数据库是用于对脑部MRI图像做定量脑部分析所使用的数据集是一个3D立体脑部图像卷。对于本实验来讲,数据集包涵有“groundtruth”,并且数据集将脑部结构分为10类。除了实验背景外,选用剩下的9类进行分类实验,同时选取数据集中的脑横断位上的第90帧图像作为本实验的仿真对象。3.2实验数据处理在图像的预处理上,首先利用Matlab软件提取出数据集(BPD)的脑横断面第90帧,图像尺寸大小为217181,像元大小为1mm1mm1mm,无噪声,且识别率极高一帧图像。
3.2.1PCA本文选取图像数据集上的第90帧图像,其每个位置的体素是一个样本,每个样本属于9类结构中的一种,具体见表1所示。除去图像背景外,一共有28043个像素点,现将图像的像素点扩展成为33邻域,此时图像大小为3×3×28043,随机抽取20%作为训练集(5607个样本),其余的作为测试样本(22436个)。将所分好的数据带入PCA进行特征提取处理,最后选用KNN(最近邻)分类器对其分类。
3.2.2TPCA同理,在PCA的基础上,我们将数据张量化,在每个标量上再找一个3×3的邻域,经过实验验证后3×3的邻域为最佳,大的邻域效果并不明显,反而邻域过大会出现过饱和现象。扩充出来的位置用0来代替,此时数据集的大小为3×3×9×28043,这样就完成了数据张量化,能够带入TPCA中进行特征提取。由于TPCA的运算是循环卷积,由于计算量过大,这里将数据带入快速傅里叶变换(2DFFT)中进行,这样就大大的降低了运算时间。
3.3实验结果
首先由于NN分类器的局限性,还处理不了张量数据,这里我们将TPCA所得到结果进行切片操作,这样就可以用NN分类器进行分类了。表2、表3分别给出了PCA和TPCA在NN分类器得到的分类混淆矩阵的对比。从主对角线上黑白程度上对混淆矩阵进行分析可以看出,在采用NN分类器进行分类时,PCA这种算法对于图像上相似的类别仍有一定的错分现象[7]。反观TPCA算法,其主对角线黑色程度较深,说明准确率高,而且在其他分错的类别上,百分比较低。
4结论
本文的主要工作是将磁共振大脑结构数据通过张量化的方法将其张量化,并利用基于循环卷积的张量模型,将大脑结构图像进行有监督的分类对比,其主要工作如下:(1)首先BrainWeb在网上提供了一套现实的模拟脑MR的图像卷,允许受控。(2)本文结合张量模型的优点将主成分分析(PCA)算法进行了全面的升级,传统的PCA算法在对数据进行压缩时,必须首先要将数据转为向量,这对于图像来说就破坏了数据的内在结构,因此从PCA的基本角度出发,我们将经典的PCA(主成分分析)算法升级为张量变体,称为TPCA(张量主成分分析)。通过大量的仿真实验后发现,基于循环卷积的张量代数框架下的TPCA算法具有非常优秀表现,实现了对张量数据的主成份分析,从而可以扩展到高维图像数据。(3)结合TPCA算法获得具有张量结构的数据特征,为了兼容已有的分类器,在TPCA的分类过程中还进行了切片操作,使得张量化后的数据能够被一般分类器接受,这既体现了张量算法的优势,也能够扩展其应用范围。
作者:廖亮;叶海昌;王新强 单位:中原工学院电子信息学院