”周至说道。
“你讲你讲。”麦明川现在看着小子一百个的顺眼,理论上这小子已经将大家的思路给打开了,也将最难的水磨功夫都做了,现在就剩下一个入库和编码的问题。
而这两样,国家在编写gb2312和gb13000的时候,已经有了长足的经验。
“其实我们还可以反向操作。”
“什么反向操作?”
“开发一个文字识别软件。”周至说道:“一个能够识别汉字,将汉字加工成点阵字,再将之按照偏旁部首等一定的规则,给汉字自动赋予编码,将之放入字库码位的软件。”
“设计思路有吗?”李红江的这下兴趣来了,中文识别,好东西呀。
“这个程序的设计思路是这样的。”周至说道:“因为汉字本身是有一定组织规则的,以方块字为主,因此我们可以利用这些规则去扫描它,对其进行分析。”
“理论上每个汉字,尤其是印刷体,其重心位置,中宫收放等特征,在一本典籍当中都是同一的,我们可以通过广泛采样,得到均值,再将这些均值作为汉字的字体设计参数,赋给已有的点阵字,产生与典籍一样的字体。”
“如果反过来思考,我们可以认为,每一个典籍上的文字,都是被字体算法计算出来的图形,而这个图形,本身是全覆盖其点阵字的所有边界的。”
“如果我们对其按照之前扫出的参数进行反耦合,也就是做减法,理论上是完全可以将文字图形,减缩成标准点阵字的。”
56710471
二子从周提醒您:看完记得收藏【文学书院】 www.wxhqjs.net,下次我更新您才方便继续阅读哦,期待精彩继续!您也可以用手机版:m.wxhqjs.net,随时随地都可以畅阅无阻...