其他分享
首页 > 其他分享> > 【汉字识别】SVM汉字识别【Matlab 766期】

【汉字识别】SVM汉字识别【Matlab 766期】

作者:互联网

一、简介

支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。
1 数学部分
1.1 二维空间
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2 算法部分
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、源代码

clc,clear,close
for i=1:5
    imp=imread(['.\字库',num2str(i),'.jpg']);
    create_database(imp,i);
end
load templet pattern;
aa=imread('example_1.png');
[word cnum]=get_picture(aa);
%cc=imresize(aa,[120 90]);
for i=1:cnum
    class=bayesBinaryTest(word{i});
    Code(i)=pattern(class).name;
end

figure(3);
imshow(aa);
tt=title(['识别文字: ', Code(1:cnum)],'Color','b'); 
function y = bayesBinary(sample)
%基于概率统计的贝叶斯分类器
%sample为要识别的图片的特征(1列100行的概率)
clc;    %清屏
load templet pattern;   %加载汉字特征
sum = 0;                %初始化sum
prior = [];             %先验概率
p = [];                 %各类别代表点
likelihood = [];        %类条件概率
pwx = [];               %贝叶斯概率
%%计算先验概率
for i=1:12
    sum = sum+pattern(i).num; %特征总数
end
for i=1:12
    prior(i) = pattern(i).num/sum;  %出现每个汉字的可能性(先验概率)
end
%%计算类条件概率
for i=1:12   %12个汉字
    for j=1:100 %100个模块
        sum = 0;
        for k=1:pattern(i).num %特征数
            if(pattern(i).feature(j,k)>0.05)  %概率大于阈值0.05则数量+1
                sum = sum+1;
            end 
        end
        p(j,i) = (sum+1)/(pattern(i).num+2);%计算概率估计值即Pj(ωi),注意拉普拉斯平滑处理
    end
end
for i=1:12
    sum = 1;
    for j=1:100
        if(sample(j)>0.05)
            sum = sum*p(j,i);%如果待测图片当前概率大于0.05认为特征值为1,直接乘Pj(ωi)
        else
            sum = sum*(1-p(j,i));%如果待测图片当前概率小于0.05认为特征值为0,乘(1-Pj(ωi))
        end
    end
    likelihood(i) = sum;  %将类条件概率赋值给likelihood
end
%%计算后验概率
sum = 0;
for i=1:12
    sum = sum+prior(i)*likelihood(i);  %求和即得P(X)
end
for i=1:12
    pwx(i) = prior(i)*likelihood(i)/sum;  %贝叶斯公式
end

三、运行结果

在这里插入图片描述

四、备注

完整代码或者代写添加QQ 912100926

标签:SVM,end,pattern,sum,likelihood,汉字,12,识别,概率
来源: https://blog.csdn.net/m0_54742769/article/details/116265426