首页 >>  正文

计算机表格图片

来源:baiyundou.net   日期:2024-09-23

今天下午,小米创办人雷军介绍了小米自研的一套表格识别算法,该算法高效准确地将图片中的表格转化为可编辑的Excel文件,大幅提升使用体验。

表格识别是指将图片中的表格结构和文字信息识别成计算机可以理解的数据格式,在办公、商务、教育等场景中有着广泛的实用价值,也一直是文档分析研究中的热点问题。

围绕这个问题,小米研发了一套表格识别算法,该算法高效准确地提取图片中的表格,转化为可编辑的Excel 文件。目前算法已经成功落地于小米10S系列、MIX Fold 2等旗舰机型,大家可以从相册-更多-表格识别,或者扫一扫进入体验。

表格检测算法

小米表示,表格检测算法主要是从图片中准确的提取表格区域,并对表格进行矫正,得到平整的表格图片以便下一步的表格识别;

表格识别算法主要是从图片中提取表格结构和表格文字内容,然后将这些信息有效的结合在一起,输出可编辑的Excel表格。

表格检测有以下难点:一方面是手机上的算法和内存有限,另一方面是对表格检测结果要求非常高,表格周围往往包含其他文字,如果检测结果不准,会对后面的识别结果造成负面影响。

小米的表格检测算法会同时检测到表格区域和表格的四个角点,通过透视变换和我们自研的抗扭曲算法得到只有表格区域的平整表格,效果如图所示。

由于算法运行在手机端,需要保证运行速度和模型大小,小米采用了一个非常轻便的一阶段检测框架,backbone采用shuffleNetV2;

在检测出表格框的同时,回归出关键点信息,便于表格的透视矫正,并用Wing loss代替L1 loss让关键点回归更加准确;

数据方面,用算法低成本地从公开数据中挖掘大量表格检测数据,显著性地提高表格检测效果。最终模型大小为1M左右,顺畅地运行在小米手机上。

表格识别算法

表格识别算法在服务端运行,主要包含的模块有:文本检测、文本识别、表格结构预测、单元格匹配、对齐算法、Excel导出。

目前主流的方法是将表格用HTML的超文本表示,然后对HTML进行编码,预测HTML序列和对应的坐标信息。

该方法在开源数据集上取得了不错的效果,中国平安科技和百度也采用了这种方案,但是HTML 的标签过多导致表格结构识别容易出错。

针对该方法的不足,我们对表格采用全新的编码方式,仅用四个标签就能表示任意结构的表格,极大地提高了表格结构识别准确率。

表格识别在部署过程中,采用Fastertransformer推理框架进行加速,官方称小米的推理速度提升了大约20倍,明显改善用户体验。

总结

该算法能高效方便地从图片中提取表格,极大地提高办公效率。小米表示,工程师们将持续提升小米手机中文档类图片的识别体验。

","force_purephv":"0","gnid":"99ab8e55cdaf1954d","img_data":[{"flag":2,"img":[{"desc":"","height":"325","title":"","url":"https://p0.ssl.img.360kuai.com/t016c1ff28a79d85736.jpg","width":"600"},{"desc":"","height":"266","title":"","url":"https://p0.ssl.img.360kuai.com/t01fc8acfa642a32b86.jpg","width":"600"},{"desc":"","height":"268","title":"","url":"https://p0.ssl.img.360kuai.com/t01e95f341e06550651.jpg","width":"600"},{"desc":"","height":"400","title":"","url":"https://p0.ssl.img.360kuai.com/t01a21674a95e43cf90.jpg","width":"600"}]}],"original":0,"pat":"xmc,art_src_3,fts0,sts0","powerby":"hbase","pub_time":1662212580000,"pure":"","rawurl":"http://zm.news.so.com/21f34e07b3141b8cdad798ecd2247ca4","redirect":0,"rptid":"bdd5bae6d06f3a18","s":"t","src":"驱动之家","tag":[{"clk":"kdigital_1:excel","k":"excel","u":""},{"clk":"kdigital_1:小米手机","k":"小米手机","u":""},{"clk":"kdigital_1:小米","k":"小米","u":""}],"title":"小米自研新技术落地:能将图片中的表格转化成Excel文件

秋连昏732如何用电脑制作表格与图表 -
支帘樊17651014593 ______ 《》以实用工作中人们经常需要用表格组织数据,用图表展现数据为背景,深入浅出地介绍了利用Word和Excel制作表格和图表的方法,内容涉及如何用Word制作各类文字表格,如:普通有线表,带复杂斜线表头的有线表、省线表以及它们的编...

秋连昏732电脑上excel工作表在哪 - 电脑excel表格在哪里
支帘樊17651014593 ______ 电脑excel表格在哪里1.切换到目标工作表.2.点击“文件”选项卡.3.然后点击“选项”,就会出现Excel选项的弹框.4.选择“高级”.然后界面往下移动,找到“此工作...

秋连昏732电脑上怎么样制作报表 -
支帘樊17651014593 ______ 我们只做电脑表格的时候,首先要有电脑办公的工具,大家可以随便下载一个即可,不过现在电脑一般都会有,现在我们说一下主要的制作步骤,首先我们要打开【Excel】表格编辑器. 步骤阅读 2 然后我们要开始制作了,大家要先做出基本框...

秋连昏732这是一张照片,我如何让他形成电脑上的word表格形式,主要是图片太暗了 想处理下 -
支帘樊17651014593 ______ 如果一定要这样的原件样式,把这个图插入到WORD中,然后在图上点一下,出现“图片工具栏”(如果没有,在工具》自定义》工具栏 里点上图片) 然后用图片工具栏里的“颜色”,把它设置为“黑白”,然后调整对比度、亮度(也在图片工具栏上),到自己基本满意为止.试了一下,基本看清的话,上部、下部太黑.如果会其他的图片处理软件(PS等,可能能调整得更好)

秋连昏732电脑表格日期怎么设置 -
支帘樊17651014593 ______ 方法/步骤首先,选中单元格,按ctrl+;(冒号)键,就输入了当天的日期.请点击输入图片描述 请点击输入图片描述按ctrl+shift+; 键,就输入了当前时间;请点击输入图片描述如果要日期和时间同时显示,先按ctrl+;键,输入日期,再按下空...

秋连昏732请各位哥哥姐姐怎么能让电脑中的图片成为WORD表格的背景图片 -
支帘樊17651014593 ______ 如果是屏幕中可以完整显示的表格,可以在打开这一表格后,按键盘上的“printscreen”键,然后打开画板,选择粘贴,这就把表格保存为了图片的形式.再打开word选择“格式——背景——填充效果”然后选择图片选项卡,在那里浏览到刚才保存的表格图片即可

秋连昏732电脑怎么连接复印机 - 复印机如何连接电脑
支帘樊17651014593 ______ 1. 复印机如何连接电脑复印机和电脑之间用一根打印线连接,你把那个连接起来以后... 也可以将电子文档的文件、表格、图片打印出纸质版保存.这里的扫描功能需要用到...

秋连昏732WPS电脑制表格步骤带图怎么加边框 -
支帘樊17651014593 ______ 额..比如一开始是这样的哈然后,你全选你想加边框的区域,右键选择设置单元格.第二种简单的方法是这里就能弄...

秋连昏732表格挡住电脑任务栏(电脑最下面的任务栏挡住打开的表格怎么设置)
支帘樊17651014593 ______ 1. 电脑最下面的任务栏挡住打开的表格怎么设置原因:Word表格段落格式使用了固定行距导致的.解决方法如下: 所需材料:Word 2007演示. 一、鼠标悬停在表格上边...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024