首页 >>  正文

excel建立预测模型

来源:baiyundou.net   日期:2024-07-08

今天下午,小米创办人雷军介绍了小米自研的一套表格识别算法,该算法高效准确地将图片中的表格转化为可编辑的Excel文件,大幅提升使用体验。

表格识别是指将图片中的表格结构和文字信息识别成计算机可以理解的数据格式,在办公、商务、教育等场景中有着广泛的实用价值,也一直是文档分析研究中的热点问题。

围绕这个问题,小米研发了一套表格识别算法,该算法高效准确地提取图片中的表格,转化为可编辑的Excel 文件。目前算法已经成功落地于小米10S系列、MIX Fold 2等旗舰机型,大家可以从相册-更多-表格识别,或者扫一扫进入体验。

表格检测算法

小米表示,表格检测算法主要是从图片中准确的提取表格区域,并对表格进行矫正,得到平整的表格图片以便下一步的表格识别;

表格识别算法主要是从图片中提取表格结构和表格文字内容,然后将这些信息有效的结合在一起,输出可编辑的Excel表格。

表格检测有以下难点:一方面是手机上的算法和内存有限,另一方面是对表格检测结果要求非常高,表格周围往往包含其他文字,如果检测结果不准,会对后面的识别结果造成负面影响。

小米的表格检测算法会同时检测到表格区域和表格的四个角点,通过透视变换和我们自研的抗扭曲算法得到只有表格区域的平整表格,效果如图所示。

由于算法运行在手机端,需要保证运行速度和模型大小,小米采用了一个非常轻便的一阶段检测框架,backbone采用shuffleNetV2;

在检测出表格框的同时,回归出关键点信息,便于表格的透视矫正,并用Wing loss代替L1 loss让关键点回归更加准确;

数据方面,用算法低成本地从公开数据中挖掘大量表格检测数据,显著性地提高表格检测效果。最终模型大小为1M左右,顺畅地运行在小米手机上。

表格识别算法

表格识别算法在服务端运行,主要包含的模块有:文本检测、文本识别、表格结构预测、单元格匹配、对齐算法、Excel导出。

目前主流的方法是将表格用HTML的超文本表示,然后对HTML进行编码,预测HTML序列和对应的坐标信息。

该方法在开源数据集上取得了不错的效果,中国平安科技和百度也采用了这种方案,但是HTML 的标签过多导致表格结构识别容易出错。

针对该方法的不足,我们对表格采用全新的编码方式,仅用四个标签就能表示任意结构的表格,极大地提高了表格结构识别准确率。

表格识别在部署过程中,采用Fastertransformer推理框架进行加速,官方称小米的推理速度提升了大约20倍,明显改善用户体验。

总结

该算法能高效方便地从图片中提取表格,极大地提高办公效率。小米表示,工程师们将持续提升小米手机中文档类图片的识别体验。

","force_purephv":"0","gnid":"99ab8e55cdaf1954d","img_data":[{"flag":2,"img":[{"desc":"","height":"325","title":"","url":"https://p0.ssl.img.360kuai.com/t016c1ff28a79d85736.jpg","width":"600"},{"desc":"","height":"266","title":"","url":"https://p0.ssl.img.360kuai.com/t01fc8acfa642a32b86.jpg","width":"600"},{"desc":"","height":"268","title":"","url":"https://p0.ssl.img.360kuai.com/t01e95f341e06550651.jpg","width":"600"},{"desc":"","height":"400","title":"","url":"https://p0.ssl.img.360kuai.com/t01a21674a95e43cf90.jpg","width":"600"}]}],"original":0,"pat":"xmc,art_src_3,fts0,sts0","powerby":"cache","pub_time":1662212580000,"pure":"","rawurl":"http://zm.news.so.com/21f34e07b3141b8cdad798ecd2247ca4","redirect":0,"rptid":"bdd5bae6d06f3a18","s":"t","src":"驱动之家","tag":[{"clk":"kdigital_1:excel","k":"excel","u":""},{"clk":"kdigital_1:小米手机","k":"小米手机","u":""},{"clk":"kdigital_1:小米","k":"小米","u":""}],"title":"小米自研新技术落地:能将图片中的表格转化成Excel文件

危邦玛1556如何使用预算 - 财务预算模型怎么弄怎么?财务预算模型怎么弄怎么用
连贵天17828989448 ______ 文章转载请附带地址 谢谢!http://www.ecc-china.com/msgecc.php?id=255 经常所说的财务模型是指,利用EXCEL将我们对公司经营活动和资本结构的各种假定通过...

危邦玛1556如何用excel 做成绩预测.就是通过比较学生几次考试成绩,做一个模型作为选文科还是理科的依据.请指教,谢 -
连贵天17828989448 ______ 必须要建模 简单的就是把前几次的考试成绩的难度系数同成绩乘一下,对比一下在什么地方有进步. 最好是每科成绩都做一下. 单纯的排名似乎没有意义,个人的选则还是很重要的.但如果在其喜欢的方向上有严重缺陷的话,还是放弃吧.

危邦玛1556Excel在经济预测与决策中有哪些应用和操作
连贵天17828989448 ______ 还是我来告诉你吧!Excel是一个表格的制作和管理软件,然后表格结合经济预测模型可以被有效展示出来,但如果没有这些背后的逻辑和模型支持,Excel就仅仅是一个软件了.Excel本身自带很多函数,还支持VBA的二次开发,利用这些内容可以将经济预测中的数学、逻辑计算变为直观的数据结果,从而实现经济预测和决策功能.利用Excel图表可以表现数据结果.基本来说,Excel只是一个软件工具,其在本身的功能上有局限性,但如果可以结合其他学科的理论结果,具体情况具体分析,则其应用可以十分强大.

危邦玛1556有什么办法可以自动选择预测模型呢?即对于给定的序列,快速有效的找到最适合的模型. -
连贵天17828989448 ______ 预测模型么?有时间序列,灰色预测,动态规划,模糊数学可能也用的到.其他的预测模型我就不是很清楚了. 你说的快速有效的找到适合的模型么,可以先把所有的预测模型找到,分析每个模型适合的条件,再做判断. 像时间序列我比较熟悉,如果给定的序列与时间有关,那就用这个. 灰色预测的话,给你复制一段百度百科里的话 通过少量的、不完全的信息,建立灰色微分预测模型,对事物发展规律作出模糊性的长期描述(模糊预测领域中理论、方法较为完善的预测学分支). 希望对你有帮助.如果需要进一步探讨,可能就需要楼主给更详细的问题的补充了.谢谢.

危邦玛1556有关Excel的解答
连贵天17828989448 ______ Excel是电子表格,在财务预算工作中起到计算方便、快捷的作用,如果运用的熟练,其功能非常强大,可以调查统计 1. 基本会计表单制作及美化优化(会计科目、会计凭证、备用金拨补表、固定资产管理表、薪资管理表……) 2. 财务公式与函数(PMT()、NPV()、SLN()、SYD()、DDB()……)以及模拟运算、分期付款、趋势分析、变量求解的应用 3. 制作销售统计及会计分析图表报表、编制财产目录…… 4. 创建财务数据库:会计数据库、人事薪资数据库、进销存数据库、固定资产数据库…… 5. 利用宏命令高效批量处理财会表单,利用VBA编程建立财务预测模型、财务分析模型

危邦玛1556wps excel怎么做数据挖掘 -
连贵天17828989448 ______ 1. 数据准备:在进行数据挖掘之前先对数据进行查看、整理和随机取样.数据准备的方式有:浏览数据、清除数据以及为数据分区2. 数据挖掘:开始进行数据挖掘的真正步骤,可以建立挖掘模型和预测分析等.数据模型化的方法有分类、估计、聚类、关联、预测和高级等.3. 准确性验证:通过图形来查看模型,图形有准确性图表,分类矩阵和交叉验证等4. 模型用法:对已经建立好的模型进行条件式查询结果:5. 管理:对于已经建立好的挖掘模型管理其挖掘结构

危邦玛1556Excel 怎样建立规划求解的模型 -
连贵天17828989448 ______ 整数规划模型Excel 求解的简化方法 [摘 要] 整数规划是一类典型的线性规划问题.对于这类问题, 运筹学中已有解决的方法,但比较繁琐.本文利用excel 软件的“规 划求解”工具,对整数规划问题求解的模型建立和求解作了较详尽 的论述. ...

危邦玛1556事情是酱汁的,我想要利用EXCEL,对以往数据进行分析预测,通过添加趋势线自动得出模型公式 -
连贵天17828989448 ______ 酱紫啊,不知道你是什么版本的Excel, 2007以上你可以看看模拟分析功能.或者你直接用Trend函数啊

危邦玛1556数学建模数据缺失怎么建立预测模型 -
连贵天17828989448 ______ 看看你数据量有多大,如果数据量大占缺失数据占比不大的话,那就做个灰色把数据补上就行, 如果数据量很少,还缺失数据的话,没办法,不管怎么处理都会加大误差,反正都是要补齐数据的,你就灰色补齐就行了,如果时间性不强,就指数平滑或者移动平均

危邦玛1556Excel 怎样分析回归统计结果,英文字母代表什么 -
连贵天17828989448 ______ 统计学中的回归预测分析具有普遍的实用意义,但变量之间关系分析及计算繁杂,而借助Excel可方便高效地研究其数量变动关系,完成其繁杂的计算分析过程. 根据回归预测中的实例,借助Excel进行相关分析,判断出其相关程度,并在此基...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024