首页 >>  正文

excel表格内文字对齐

来源:baiyundou.net   日期:2024-09-20

今天下午,小米创办人雷军介绍了小米自研的一套表格识别算法,该算法高效准确地将图片中的表格转化为可编辑的Excel文件,大幅提升使用体验。

表格识别是指将图片中的表格结构和文字信息识别成计算机可以理解的数据格式,在办公、商务、教育等场景中有着广泛的实用价值,也一直是文档分析研究中的热点问题。

围绕这个问题,小米研发了一套表格识别算法,该算法高效准确地提取图片中的表格,转化为可编辑的Excel 文件。目前算法已经成功落地于小米10S系列、MIX Fold 2等旗舰机型,大家可以从相册-更多-表格识别,或者扫一扫进入体验。

表格检测算法

小米表示,表格检测算法主要是从图片中准确的提取表格区域,并对表格进行矫正,得到平整的表格图片以便下一步的表格识别;

表格识别算法主要是从图片中提取表格结构和表格文字内容,然后将这些信息有效的结合在一起,输出可编辑的Excel表格。

表格检测有以下难点:一方面是手机上的算法和内存有限,另一方面是对表格检测结果要求非常高,表格周围往往包含其他文字,如果检测结果不准,会对后面的识别结果造成负面影响。

小米的表格检测算法会同时检测到表格区域和表格的四个角点,通过透视变换和我们自研的抗扭曲算法得到只有表格区域的平整表格,效果如图所示。

由于算法运行在手机端,需要保证运行速度和模型大小,小米采用了一个非常轻便的一阶段检测框架,backbone采用shuffleNetV2;

在检测出表格框的同时,回归出关键点信息,便于表格的透视矫正,并用Wing loss代替L1 loss让关键点回归更加准确;

数据方面,用算法低成本地从公开数据中挖掘大量表格检测数据,显著性地提高表格检测效果。最终模型大小为1M左右,顺畅地运行在小米手机上。

表格识别算法

表格识别算法在服务端运行,主要包含的模块有:文本检测、文本识别、表格结构预测、单元格匹配、对齐算法、Excel导出。

目前主流的方法是将表格用HTML的超文本表示,然后对HTML进行编码,预测HTML序列和对应的坐标信息。

该方法在开源数据集上取得了不错的效果,中国平安科技和百度也采用了这种方案,但是HTML 的标签过多导致表格结构识别容易出错。

针对该方法的不足,我们对表格采用全新的编码方式,仅用四个标签就能表示任意结构的表格,极大地提高了表格结构识别准确率。

表格识别在部署过程中,采用Fastertransformer推理框架进行加速,官方称小米的推理速度提升了大约20倍,明显改善用户体验。

总结

该算法能高效方便地从图片中提取表格,极大地提高办公效率。小米表示,工程师们将持续提升小米手机中文档类图片的识别体验。

","force_purephv":"0","gnid":"99ab8e55cdaf1954d","img_data":[{"flag":2,"img":[{"desc":"","height":"325","title":"","url":"https://p0.ssl.img.360kuai.com/t016c1ff28a79d85736.jpg","width":"600"},{"desc":"","height":"266","title":"","url":"https://p0.ssl.img.360kuai.com/t01fc8acfa642a32b86.jpg","width":"600"},{"desc":"","height":"268","title":"","url":"https://p0.ssl.img.360kuai.com/t01e95f341e06550651.jpg","width":"600"},{"desc":"","height":"400","title":"","url":"https://p0.ssl.img.360kuai.com/t01a21674a95e43cf90.jpg","width":"600"}]}],"original":0,"pat":"xmc,art_src_3,fts0,sts0","powerby":"cache","pub_time":1662212580000,"pure":"","rawurl":"http://zm.news.so.com/21f34e07b3141b8cdad798ecd2247ca4","redirect":0,"rptid":"bdd5bae6d06f3a18","s":"t","src":"驱动之家","tag":[{"clk":"kdigital_1:excel","k":"excel","u":""},{"clk":"kdigital_1:小米手机","k":"小米手机","u":""},{"clk":"kdigital_1:小米","k":"小米","u":""}],"title":"小米自研新技术落地:能将图片中的表格转化成Excel文件

桑炊南4318在Excel中输入文字,则它默认的对齐方式是? -
丁涛饺19591003906 ______ 文字左对齐,数据右对齐

桑炊南4318excel中表格里的字体如何两端对齐 -
丁涛饺19591003906 ______ 在上方工具栏找“三三”这样的按钮,可以切换对齐方式.

桑炊南4318请问EXCEL表格里的某一组文字如何对齐? -
丁涛饺19591003906 ______ 如图,希望采纳

桑炊南4318如何在excel合并单元格里对齐文字 -
丁涛饺19591003906 ______ 你都已经找到合并单元格的工具了,对齐文字不就在合并单元格功能的上面嘛.格式——单元格——对齐,里面有“水平对齐”、“垂直对齐”以及“合并单元格”

桑炊南4318Excel中怎么将文字设为垂直靠上? -
丁涛饺19591003906 ______ 材料/工具:Excel2010 1、首先新建Excel2010文档并打开. 2、编辑好需要调整的内容. 3、将需要调整的内容全部单击选中. 4、右键选择“设置单元格格式”. 5、在弹出的对话框中,选择“对齐”;在水平对齐中,选择“居中”;在垂直对齐中,选择“靠上”. 6、单击对话框“确定”按钮. 7、操作完成后,就可以看到效果.

桑炊南4318excel表格中如何把表格的字竖着并且居中
丁涛饺19591003906 ______ 在单元格右击-->"设置单元格格式"-->"对齐"-->"水平对齐"下方框选"居中"-->"垂直对齐"下方框选"居中"-->点"方向"下方框"文本"-->"确定"即可.

桑炊南4318EXCEL中怎么根据单元格的内容设置文字的对齐方式? -
丁涛饺19591003906 ______ 如果借和贷是分别在两列,可以分别设置左或右对齐的

桑炊南4318在Excel里面怎样让单元格里的文字竖直显示? -
丁涛饺19591003906 ______ 可以通过单元格的设置进行竖向显示,具体操作步骤如下:工具/原材料 excel2018版、电脑.1、打开电脑找到并点击打开excel2018版新建工作表格软件;2、双击打开excel工作表以后,为了更好的便于示范,在A列的单元格编辑好任意的文本内容;3、编辑并选中好单元格以后,鼠标右击选择”设置单元格格式“的命令;4、点击进入单元格设置以后,在对齐的界面下找到并勾选”文字竖排“的命令;5、勾选并确定以后,此时文本的内容已经成功显示竖排.

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024