首页 >>  正文

lambda教程

来源:baiyundou.net   日期:2024-09-20

对于需要处理大量文档的组织来说,数据分类、提取和分析可能具有挑战性。传统的文档处理解决方案是人工操作,成本高昂,容易出错,而且难以扩展。亚马逊云科技智能文档处理(IDP)通过Amazon Textract等人工智能服务,利用行业领先的机器学习(ML)技术,快速准确地处理来自任何扫描文档或图像的数据。生成式人工智能(生成式AI)是Amazon Textract的补充,可进一步实现文档处理工作流的自动化。关键字段规范化和输入数据汇总等功能有助于加快管理文档处理工作流的周期,同时降低出错的可能性。

 生成式人工智能由称为基础模型(FM)的大型机器学习模型驱动。基础模型正在改变您解决传统上复杂的文档处理工作负载的方式。除现有功能外,企业还需要汇总特定类别的信息,包括财务报告和银行对账单等文件中的借记和贷记数据。基础模型可以更轻松地从提取的数据中生成此类洞察。为了优化人工审核时间并提高员工的工作效率,电话号码中缺少数字、文件缺失或地址没有街道编号等错误都可以自动标记出来。在当前场景中,您需要投入专门的资源,通过人工审核和复杂的脚本来完成这样的任务。这种方法既繁琐又昂贵。基础模型有助于以更少的资源更快地完成这些任务,并将不同的输入格式转化为可进一步处理的标准模板。在亚马逊云科技,提供Amazon Bedrock等服务,这是使用基础模型构建和扩展生成式人工智能应用程序的最简单方法。

 Amazon Bedrock是一项完全托管式服务,通过API提供领先的人工智能初创企业和亚马逊云科技的基础模型,因此您可以找到最满足自己要求的模型。亚马逊云科技还提供Amazon SageMaker JumpStart,此服务让机器学习从业者能够从广泛的开源基础模型中进行选择。机器学习从业者可以从网络隔离环境中将基础模型部署到专用的Amazon SageMaker实例,并使用SageMaker自定义模型以进行模型训练和部署。

 在这篇文章中,将分享如何利用生成式人工智能增强亚马逊云科技上的IDP解决方案。

 

 改进IDP管道

 基础基础亚马逊云科技IDP方案由三个阶段组成:分类、提取和富集。在分类阶段,基础模型现在无需任何额外训练即可对文档进行分类。这意味着,即使模型之前没有见过类似的示例,也可以对文档进行分类。在提取阶段,基础模型对日期字段进行规范化处理,并核实地址和电话号码,同时确保格式一致。富集阶段的基础模型可进行推理、逻辑推理和总结。如果在每个IDP阶段都使用基础模型,工作流就会更加精简,性能也会提高。下图展示了采用生成式人工智能的IDP管道。


 IDP管道的提取阶段

 当基础模型无法直接处理原生格式(如PDF、img、jpeg和tiff)的文档作为输入时,就需要一种将文档转换为文本的机制。要在将文档发送给基础模型之前从文档中提取文本,可以使用Amazon Textract。使用Amazon Textract,可以提取行和字词并将其传递给下游基础模型。以下架构使用Amazon Textract从任何类型的文档中精确提取文本,然后再将文档发送给基础模型进行进一步处理。

 通常,文档由结构化和半结构化信息组成。Amazon Textract可用于从表格和表单中提取原始文本和数据。表格和表单中的数据之间的关系在业务流程自动化中起着至关重要的作用。基础模型可能无法处理某些类型的信息。因此,可以选择将这些信息存储在下游存储中,也可以将这些信息发送给基础模型。下图举例说明了Amazon Textract如何从文档中提取结构化和半结构化信息,以及需要由基础模型处理的文本行。


 使用亚马逊云科技无服务器服务通过基础模型进行总结

 前面介绍的IDP管道可以使用亚马逊云科技无服务器服务实现无缝自动化。高度非结构化的文档在大型企业中很常见。这些文档既包括银行业的证券交易委员会(SEC,Securities and Exchange Commission)文档,也包括医疗保险业的承保文档。随着亚马逊云科技的生成式人工智能的发展,这些行业的人们正在寻找以自动化和经济高效的方式从这些文档中获取摘要的方法。无服务器服务有助于提供快速构建IDP解决方案的机制。AWS Lambda、AWS Step Functions和Amazon EventBridge等服务有助于构建集成基础模型的文档处理管道,如下图所示。

 上述架构中使用的示例应用程序由事件驱动。事件定义为最近发生的状态变化。例如,当对象上传到Amazon Simple Storage Service(Amazon S3)存储桶时,Amazon S3会发出Object Created事件。来自Amazon S3的事件通知可触发Lambda函数或Step Functions工作流。这种类型的架构称为事件驱动型架构。在这篇文章中,我们的示例应用程序使用事件驱动型架构来处理出院文档样本并总结该文档的详细信息。具体流程如下:

  • 当文档上传到S3存储桶时,Amazon S3会触发Object Created事件。

  • EventBridge默认事件总线根据EventBridge规则将该事件传播到Step Functions。

  • 状态机工作流开始使用Amazon Textract处理文档。

  • Lambda函数对分析数据进行转换,以便进行下一步操作。

  • 状态机调用SageMaker端点,该端点使用AWS SDK的直接集成来托管基础模型。

  • S3目标摘要存储桶接收从基础模型收集的摘要响应。


 设置解决方案

 按照README文件中的步骤设置解决方案架构(SageMaker端点除外)。有了自己的SageMaker端点后,就可以将端点名称作为参数传递给模板。

 

 清理

 为节约成本,请删除作为教程一部分部署的资源:

  • 按照README文件中清理部分的步骤进行操作。

  • 从S3存储桶中删除所有内容,然后通过Amazon S3控制台删除该存储桶。

  • 删除您可能通过SageMaker控制台创建的所有SageMaker端点。


 总结

 生成式人工智能正在改变您使用IDP处理文档以获得洞察的方式。亚马逊云科技人工智能服务(如Amazon Textract)和亚马逊云科技基础模型有助于准确处理任何类型的文档。

 

原标题:利用生成式人工智能增强AWS智能文档处理能力

原链接:https://aws.amazon.com/cn/blogs/china/enhancing-aws-intelligent-document-processing-with-generative-ai/


","gnid":"909f0443b396fc99c","img_data":[{"flag":2,"img":[{"desc":"","height":"420","title":"","url":"https://p0.ssl.img.360kuai.com/t01227cb8cbac6d7435.png","width":"936"},{"desc":"","height":"326","title":"","url":"https://p0.ssl.img.360kuai.com/t015b9db8d227561b47.png","width":"936"},{"desc":"","height":"851","title":"","url":"https://p0.ssl.img.360kuai.com/t0145c2c26625a6e0e4.png","width":"1171"},{"desc":"","height":"733","title":"","url":"https://p0.ssl.img.360kuai.com/t0166e987775fad2d6c.jpg","width":"1241"}]}],"original":0,"pat":"art_src_0,fts0,sts0","powerby":"hbase","pub_time":1695261063000,"pure":"","rawurl":"http://zm.news.so.com/35e77cb597bbabf70ec19ae149e70438","redirect":0,"rptid":"2fe92d485d62b42e","rss_ext":[],"s":"t","src":"现代传媒","tag":[{"clk":"ktechnology_1:亚马逊","k":"亚马逊","u":""},{"clk":"ktechnology_1:人工智能","k":"人工智能","u":""},{"clk":"ktechnology_1:amazon","k":"amazon","u":""}],"title":"亚马逊云科技人工智能服务赋能智能文档处理

汤琪芳4621创建lambda表达式,取一个int值并将其乘以5,然后返回新的int值. -
倪皇新17111258022 ______ auto x = [](int a){return a*5;}或者#include <functional> std::function<int(int)> x = [](int a){return a*5;}C#似乎还可以再简单一点 Func<int,int> x = a => a*5;

汤琪芳4621如何用java8的lambda写一个求阶乘的函数 -
倪皇新17111258022 ______ 作者:青虹 链接:https://www.zhihu.com/question/30088949/answer/164364307 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 代码如下: package lamda; import java.util.function.Function; import java...

汤琪芳4621python lambda 表达式中怎么进行赋值 -
倪皇新17111258022 ______ lambda说白了就是个匿名函数.可以作为表达式右值(用来给左值赋值),本身不能被赋值.python的lambda的lambda,功能非常有限,Guido也不喜欢它.稍微复杂点的计算还是用函数好.

汤琪芳4621python lambda 函数 -
倪皇新17111258022 ______ 直接使来用有什么问题么自?在python2.7.11下,2113似乎两者5261都可用的:4102 >>> lambdaf = lambda x: (x+2)**2 # lambda 定义 >>> def deff(x): return (x+2)**2 # def 方式的函数定1653义 >>> f1= lambda x: -lambdaf(x) >>> f1(2) -16 >>> f2= lambda x: -deff(x) >>> f2(2) -16 >>>

汤琪芳4621如何在 LINQ 的 select 语句中使用 Lambda -
倪皇新17111258022 ______ 使用 LINQ 查询表达式 IEnumerable stores = from store in database.Stores where store.CompanyID == curCompany.ID select new SelectListItem { Value = store.Name, Text = store.ID }; ViewBag.storeSelector = stores; 或使用 LINQ 扩展方法和 ...

汤琪芳4621Lambda表达式,挑出重复的数据 -
倪皇新17111258022 ______ 试试这样 var newData = data.where( d1 => data.count(d2 => d2.url == d1.url) > 1) 手写代码,理解思想

汤琪芳4621java lambda表达式如何使用2个参数. -
倪皇新17111258022 ______ Set<String> set=new HashSet(){{ add("Hello "); add("My "); add("World."); }}; String t=set.stream().reduce("", (s,e)->s+=e); System.out.println(t);Hello My World.

汤琪芳4621如何更好的使用Java8中方法引用详解 -
倪皇新17111258022 ______ 在学习lambda表达式之后,我们通常使用lambda表达式来创建匿名方法.然而,有时候我们仅仅是调用了一个已存在的方法.如下:Arrays.sort(stringsArray,(s1,s2)->s1.compareToIgnoreCase(s2)); 在Java8中,我们可以直接通过方法引用来简...

汤琪芳4621Lambda表达式的C#表达式 -
倪皇新17111258022 ______ C#的Lambda 表达式都使用 Lambda 运算符 =>,该运算符读为“goes to”.语法如下: 形参列表=>函数体 函数体多于一条语句的可用大括号括起. 可以将此表达式分配给委托类型,如下所示: delegate int del(int i); del myDelegate = x=>{...

汤琪芳4621Python lambda怎么写? -
倪皇新17111258022 ______ 1 2 3 4 5 6 7 8 9 tim@crunchbang:~$ python Python 2.7.3(default, Mar 142014, 11:57:14) [GCC 4.7.2] on linux2 Type"help", "copyright", "credits"or"license"formore information. >>> wordsList =['cat', 'elephant', 'rat', 'rat', 'cat'] >>> result ...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024