学科分类
/ 25
500 个结果
  • 简介:    摘要:OCR文字识别技术是图像文字、视频文字识别中常用的一种光学字符识别技术,这项技术主要将光学技术与现代计算机技术相结合,根据每个字符的光学特点来确定具体形状,而后翻译成文字。在网络化技术水平持续发展阶段,文字识别技术也得到了更新与完善,智能化和数字化水平有所提升,在基于OCR识别技术中的获奖证书、知识产权证明文件等关键信息提取上做了部分实践应用,为能够提高该技术的应用效果,还应掌握相关技术要点,实现对文字的高精度识别,提高文字识别水平。

  • 标签:     OCR文字识别技术 图像预处理 字符识别 后处理
  • 简介:有些用户用Office2003的“MicrosoftOfficeDocumentImaging”识别图片中的文字,不过将这些文字复制到Word中有时会出现乱码。这是因为其默认设置造成的。在软件的中文版中,软件默认的OCR语言是“中文(简体)”,我们应该在识别之前将其更改为英文。单击“工具一选项“菜单项,在对话框的”OCR”标签下将“OCR语言”改成“英语”.确定后再执行OCR操作.这样将文字复制到Word中就不会出现乱码了。

  • 标签: OFFICE2003 图片文字 识别 Microsoft Document 误码
  • 简介:摘要在社会交流信息化、办公技术数字化的时代背景下,教师在备课时常需要借鉴或引用一些不可编辑的文档,采用逐字录入的方式效率较低。为此,可以采用文字识别工具,对常见格式文档进行可编辑处理。经实践验证,OCR文字识别工具可以明显提高工作效率,节省可观的录入时间。

  • 标签: 文字识别系统(OCR) PDF虚拟打印机 分辨率
  • 简介:【 摘要 】 : 文章通过基于 App Inventor 2 编程开发工具的环境下介绍一款文字识别 APP的制作流程,让学生在手机 APP开发的过程中对人工智能中的文字识别有一个大致的了解和熟悉,进而引起孩子们学习人工智能的兴趣并使学生深入认识身边的人工智能。

  • 标签: 文字 识别 App Inventor 2 手机 APP
  • 简介:摘要文字识别就是利用计算机自动识别字符的技术,文字识别是模式识别应用的一个重要领域。主要是在生产和生活中,人们要处理大量的文字、报表和文本。文字识别可以减轻人们的劳动,并且提高处理效率,在50年代的时候开始探讨一般文字识别方法,研制出了光学字符识别器。到了60年代研制出了采用磁性墨水和特殊字体的实用机器。而到60年代后期时候,出现了多种字体和手写体文字识别机,这时候的识别精准度和机器性能都有了一定的提高。

  • 标签: 背景 方法 内容及步骤
  • 简介:摘要:近年来,社会进步迅速,我国的数字化建设的发展取得了明显的成效。随着互联网和计算机技术的发展与普及,许多传统的信息处理方式在实际应用中被淘汰,如原本以纸质文档存储的文本信息,被磁盘存储的数字信息所替代进行传递,极大地提升了信息的存储及传输效率。目前,生活中各种信息总量呈现出爆炸式增长,但具有价值的信息量并未随信息总量同比增长,具有价值的信息在信息规模爆炸的情况下反而更加难以获取。而传统的信息检索方法无法有效地帮助使用者分析和理解规模巨大的文本数据,因此如何从文本中获取信息成为了研究重点。本文以档案管理的应用环境,详细分析了目前档案管理工作所面临的问题,重点阐述了目前解决其问题的主流方法和技术:文字识别技术,从而助力档案进一步走向智能化、数字化,解放档案管理工作人员,推进档案管理走向智能化。

  • 标签: 文本信息 数字信息 信息检索 信息提取技术 档案管理 应用
  • 简介:为解决采用深度学习方法研究满文识别中训练样本匮乏的问题,提出一种使用数据增广方法扩展训练样本集的技术框架。该框架包括字体几何结构变形与图像质量变换两个模块,采用仿射变换、弹性形变等9种数据生成方法,分别模拟满文字符图像的笔画粗细变化、扭曲变形、光照不均、不同视角及背景等情况下的采集效果。在满文识别的研究中,采用该方法将每个类别的字符数据量扩展到7万个。实验表明,该方法生成的数据在一定程度上弥补了训练样本不足的问题,是解决训练样本匮乏问题的有效技术手段。

  • 标签: 光学字符识别 满文识别 数据增广 数据生成
  • 简介:文字和符号的识别是当今人工智能与模式识别的一个重要研究方向。当前的识别技术主要问题之一是识别的速度不够高。本文采用雷达信号处理中的Krylov子空间方法FDR来识别文字和符号。该方法无需生成协方差矩阵的估计,也无需对样本协方差矩阵求逆,在保证识别正确率不变的情况下使算法的识别速度得到加快。本文用实测数据验证了该方法性能的有效性。

  • 标签: KRYLOV子空间 最优文字与符号识别 矩阵求逆
  • 简介:通过研究视频汉字识别问题,提出了关于视频中汉字跟踪及分割算法。首先,提取视频样本特征,采用K均值算法进行聚类作为第1次分类,之后,采用多个BP(backpropagation)神经网络进一步细分一次分类后的结果作为二次分类。最后,对以上算法进行了实验验证,结果证明这些算法是有效的,多层分类器较单一的BP神经网络分类器识别率更高。

  • 标签: 汉字分割 汉字跟踪 K均值聚类 BP神经网络
  • 简介:汉王OCR5.0增强版是北京汉王科技公司推出的一款汉字表格OCR软件、该软件支持市场上销售的TWAIN标准的扫描仪,支持24位彩色、256级灰度扫描识别功能,提供识别完毕后的图文并存的彩色版面恢复,支待RTF、HTML的输出,不仅能识别众字体,还支持简繁混排汉字的识别、纯英文的识别、自动区分“横版”或“竖版”,还支持简体、繁体和英文。

  • 标签: 文字识别软件 增强版 TWAIN标准 中文 汉王科技公司 OCR软件
  • 简介:利用卷积神经网络在图像识别方面的优势,提出了一种基于深度卷积神经网的哈萨克手写字母识别方法(DCNN-KLR),成功建立了一种哈萨克手写文字识别模型。与传统的方法(SVM+HOG)相比,不仅训练方便、速度快,而且提高了哈萨克手写文字识别率。在5708个数据样本上进行训练和测试,将样本分为33类和100类,正确识别率分别达到93.29%和92.38%。

  • 标签: 卷积神经网络 哈萨克文字母 字符识别
  • 简介:摘要基于图像文字识别技术和安卓平台开发软件,改进光纤定检数据的录入方式,省去手写、电脑录入等环节,提高数据录入效率,并使通信定检数据存储方便、提取与调用更加便捷,并为进行数据挖掘提供可能。

  • 标签: 图像文字识别 纤芯定检 电力通信
  • 简介:一、引言朝鲜认为神志文字是五千年以前檀君朝鲜(古朝鲜)时期实际存在和使用的朝鲜文字的原始祖,早已传播到邻国称之为“朝鲜人的文字”,后来称“仓颉文字”。还说道:“训民正音,渊源于自檀君建立的古朝鲜以来沿用的我国文字。”朝鲜还列举了古文献中有不少有关朝鲜在创制训民正音以前已使用的本国文字的记载。

  • 标签: 朝鲜文字 古文献 韩语 语言学 学习方法 阅读知识
  • 简介:单层感知器的有噪声训练网络的识别出错率为6.6%,而有噪声训练的BP网络的识别出错率为2.1%,无噪声训练网络对字符进行识别

  • 标签: 三种人工 工神经网络 用于英文字母
  • 简介:北京时间2014年6月18日9时23分。柯尔瑟刚下飞机就见到了来接他的中国好友——李玄鸿警官。他俩好久没见,所以一见面就聊得热火朝天,从小鸟到马航,从游泳到水怪……仿佛三天三夜也说不完。

  • 标签: 小学生 作文 语文学习 阅读知识
  • 简介:学术研究中理论很重要,在当今语言研究领域,语言学理论的研究尤显重要.我们呼吁语言研究中的理论意识、问题意识、融通意识.融通,是多学科的综合和交叉,也包括汉语研究和外语研究的对接.事实上,无论是汉语研究还是外语研究,理论研究都亟待加强.需要特别说明的是,强化理论意识并不是说可以削弱对材料的重视程度.理论与材料二者本应互相“融通”:脱离材料的理论一定会站不住脚;没有理论的材料,即使堆砌得很多。

  • 标签: 语言学 文字 学术研究 问题意识 强化理论 材料
  • 简介:文字是一种令人窒息的东西。它凝聚了作者最深刻的感动,如一次心灵的旅程。由荒芜到繁华的邂逅,释放一次最绚丽的激情。忘了有谁说过:阅读,使我拥抱作者的灵魂。文字,在我胸口凝聚了太多,不把它们写下,它们便会飘散天涯,流离失所。于是,我一句一句将他们找回,可感觉却不如初。文字总是真实的才能打动别人,太过华丽空虚,只是格式化的堆砌,终将消逝不见。

  • 标签: 文字 格式化 作者 凝聚
  • 简介:美国机会木头说,ipad是内容收费最后的机会了。看到连线杂志上线第一天,就以4.99美金卖掉了八万本,大家都很感慨。但是无论如何,我也不敢想象国内有人敢这么干。美国人脑袋是方的。让他们付钱,第一时间就付钱。中国人脑袋是圆的,比如烂人这样的鸡贼,第一时间想的是破解。

  • 标签: 美国人 机会 大城市 脑袋 木头 星相
  • 简介:文字是有脚的。刘备手下有个名士,曾经和来访的东吴使臣坐而论道。说到天是有耳朵的,不然的话,怎么会有“声闻于天”的说法?他说得对,因为我觉得这说法和文字是有脚的一样。昨天,和一个有些年没见的朋友通话,他说看到了我写的一个序,在一本北京出的书上。

  • 标签: 中学生 语文学习 阅读知识 课外阅读