首页 >>  正文

excel画图怎么添加三个y轴

来源:baiyundou.net   日期:2024-09-20

报告出品方:西部证券

以下为报告原文节选

------

1、AI算力需求空间测算

AIGC浪潮汹涌,大模型开启新一轮AI技术革命


训练规模突破临界值,大模型“智慧涌现”

大模型训练规模与参数量、数据量及训练轮数等紧密相关。当模型规模突破阙值,即出现“智慧涌现”。

左图横坐标为模型训练的预训练规模,用FLOPs综合表示;纵轴为精确性等评判模型效果的指标。当模型规模在一定范围内时,模型能力并未随着规模提升而提高;当规模超过此临界值时,模型效果显著提升,出现“智慧涌现” 。


迈入AI智能时代,计算芯片依赖已从CPU转向GPU

• AI时代离不开机器学习,而神经网络训练及推理需要进行大量的矩阵运算和卷积运算,具有强并行运算与浮点计算能力的GPU逐渐成为计算主力军。



大模型训练、微调、推理催生大量AI算力需求



大模型训练侧 GPU 需求测算

• 2022年,英伟达、斯坦福联合微软研究院共同训练出了万亿级参数的GPT,比1746亿参数的GPT-3还高出了一个量级;

• 论文中的测试基于DGX A100-80GB集群完成。对于最大的 1T 规模的模型,一共使用了384台8卡DGX-A100服务器,服务器内部各GPU间使用超高速NVLink和NVSwitch互联,每台机器装有 8个200Gbps的 InfiniBand网卡;

• GPU利用率 = 单张GPU训练时吞吐量/单张GPU峰值吞吐量,论文使用了数据并行、流水线模型并行、张量模型并行、服务器通信优化等加速技术提高GPU利用率。

• 训练过程中,英伟达A100卡使用数量的变化范围为[32,3072],GPU利用率随参数量增加而增长,变化范围为[44%,52%]。



大模型训练侧 GPU 需求测算

• 这篇论文给出了使用并行策略后训练时间的经验公式:

• 其中,T 表示训练集的Token数量,P 表示模型参数数量,n 表示A100卡数量,X 表示训练时每张GPU的吞吐量。X 值由GPU峰值吞吐量与GPU利用率相乘得出。

• 论文中进行训练时采用混合精度即FP16。在此精度下,每张A100的峰值吞吐量(非稀疏)为 312 TFLOPS。

• 论文以GPT-3为例做了估计:当 T = 3000亿,P = 1750亿,A100卡数量 n = 1024张,批处理大小为 1536时,假设GPU利用率为45%,即每张A100训练时吞吐量为 312 × 45% = 140 TFLOPS。

估计GPT-3端到端训练时间 =???? × ???? × ???????????????? × ????.???????? × ???????????????????????????????? ×????.???? ×???????????????? = ????. ???????? × ????????????(s) ≈ ????????(天)

• 据推测,GPT-4的参数量达到万亿级别。SemiAnalysis报道称GPT-4参数量为1.8万亿,且采用更大的训练集,GPT-4训练过程中A100卡数量达到万张量级。

GPT-4具体参数量目前暂无官方数据,半导体咨询研究公司SemiAnalysis称:OpenAI训练GPT-4的FLOPS约为2.15 × 1025 ,在大约25000个A100上训练了90-100天,由于延迟和故障重启问题,GPU利用率约为32%-36%。

大模型推理侧 GPU 需求测算——推理侧具备更大的成长空间

• 根据Similarweb数据,2023年8月ChatGPT的月度访问量为14亿(包括直接访问、外链等),平均访问时长为7分钟。

假设1:ChatGPT访客平均每次访问提问数为10个,每个问题加上其回答的Token数量平均为1000;

假设2:ChatGPT访客来自全球各地,假设在每日24小时内平均分配访问量和计算量;

假设3:在推理侧,大模型运算更为简单,我们仍保守假设GPU利用率为45%。

• 推理过程中,每个参数只需执行1次乘法运算和1次加法运算,以GPT-3的参数量1750亿带入以下测算。

• 推理前一般采用量化等技术将模型优化到Int8精度,在此精度下,每张A100的峰值吞吐量(非稀疏)为 624 TOPS。



大模型推理侧 GPU 需求测算 —— ChatGPT

• 首先计算每月推理的算力需求:

• 再计算每秒推理侧的算力需求:

• 最后计算 A100 需求:

• 实际应用中,推理前可能会采用剪枝、蒸馏等技术来进行模型压缩。压缩一定程度上会降低模型性能,此处暂不考虑这些因素。

未来每家龙头大模型厂商推理侧A100需求有望达到十万张量级

• 2023年9月25日,ChatGPT进行重大更新——GPT-4和GPT-3.5都具有了基于图像进行分析和对话的能力。我们认为,当模型参数增长至万亿级且具有多模态能力,能承担更多生成、分析等任务时,将吸引更多用户,ChatGPT月度访问量将高增(2023年8月,谷歌月度访问量为860亿,约为ChatGPT的70倍)。

• 在以下三点假设下,长期来看,我们推测未来ChatGPT推理侧A100需求将超过70万张。

假设1:我们采用外媒SemiAnalysis给出的数据,即使用GPT-4时每次推理只需使用2800亿个参数;

假设2:多模态能力与更强大的分析能力将使得用户更加依赖大模型,推理侧每日问答的Token平均数量达到30000甚至更多;

假设3:随着大模型技术发展,假设未来ChatGPT的月度访问量翻20倍,达到300亿。


大模型推理侧 GPU 需求测算 —— 微软Copilot

2023年9月21日,微软宣布基于GPT-4的Copilot将全面开放:

微软全球版Copilot于2023年9月26日随更新的Windows 11以初期版本形式推出,融入到画图、照片、Clipchamp 等应用程序中;

全球版Microsoft 365 Copilot将于2023年11月1日起面向企业用户提供服务,融入Teams、Outlook、Word、Excel、Loop、OneNote 和OneDrive等应用程序中,同时微软将推出AI助手 Microsoft 365 Chat。



大模型推理侧 GPU 需求测算 ——Copilot +Windows

2023年5月,微软宣布Windows用户突破 10 亿。

假设Windows中Copilot使用率为15%-80%,用户每天使用Copilot时输入和输出的平均Token数量为500-5000。

如下表所示,当使用率为30%,每日人均输入输出Token数量为2000时,Windows Copilot的A100需求量超过1万张。

乐观估计,当使用率为80%,每日人均输入输出Token数量为5000时,A100需求量超过9万张。


大模型推理侧 GPU 需求测算 ——Copilot + Microsoft 365

微软曾在FY20Q1电话会议上披露,Office 365(现已更名为 Microsoft 365 )商业版的月度活跃用户突破 2 亿,而根据微软的季报及年报数据,商业版用户数量年增速保持在15%左右,我们推测Microsoft 365 企业用户数目前已突破 3 亿。

假设Microsoft 365中Copilot使用率为15%-80% ,企业用户使用Copilot时,输入和输出的平均Token数量为2000-30000。

如下表所示,当使用率为30%,每日人均输入输出Token数量为10000时,Microsoft 365 Copilot的A100需求量超过2万张;

乐观估计,当使用率为80%,每日人均输入输出Token数量为30000时,A100需求量超过15万张。



驱动AI发展的关键引擎,英伟达A100 & H100 供不应求

自年初以来,英伟达A100一直处于供不应求的状态,而其他加速卡由于性能、生态等方面与英伟达存在较大差距,大部分场景无法实现替代,尤其在训练侧,A100与H100具有极大的优势与较高的技术壁垒。现阶段,大模型技术突破遭遇瓶颈,算力资源短缺为重要原因之一。OpenAI表示GPU供应不足阻碍了其研发计划的推进,例如模型微调和划拨专用容量等受到影响。

OpenAI联合创始人Andrej Karpathy曾转发了一篇博客文章。这篇文章认为训练大语言模型的初创企业、云服务供应商及其他大公司需要拥有超过1000张H100或A100。

A100方面:GPT-4可能在10000-25000张A100上进行了训练,Meta拥有约21000张A100,特斯拉拥有约7000张A100,Stability AI拥有约5000张A100,Falcon-40B在384张A100上进行了训练。

H100方面:

a) OpenAI可能需要50000张,Inflection可能需要22000张,Meta可能需要25000张。大型云厂商可能每家都需要30000张(Azure、谷歌、AWS、Oracle)。Lambda和CoreWeave以及其他私有云厂商可能总共需要10万张, CoreWeave预订的H100数量约为35000-40000张,而Anthropic、Helsing、Mistral、Character等每家可能需要10000张。

b) Inflection在其GPT-3.5等效模型中使用了3500张H100。GCP拥有大约25000张H100。微软Azure和Oracle可能有10000-40000张H100。



2、发展趋势

大模型训练中的故障与中断问题对GPU集群的质与量提出了更高要求

• 大模型架构复杂,训练周期较长。硬件、系统、软件、驱动等等需要稳定运转才能最大化加速卡并行运算的能力,保障模型训练的效率,缩短训练的时间和成本。

• 虽然加速卡具有优异的计算性能,但软、硬件等故障时常发生,各类任务频繁重启,训练经常中断、持续时间较短。如果训练中断后不能及时恢复,不仅会影响训练成功率,还会使得训练成本居高不下。



大模型训练中的故障与中断问题对GPU集群的质与量提出了更高要求

• Meta员工曾在训练OPT-175B模型的日志中提到,几乎整个训练过程都要面对不停地重启和中断。

在某两周内,由于硬件、算法或实验稳定性问题,训练重启了40多次。其中,绝大多数重启都是由于硬件故障以及缺乏提供足够数量的“缓冲”节点来替换坏节点的能力。

通过云接口更换一台机器可能需要几个小时。

最后两周,解决基础设施问题占据了团队大部分时间,因为这些硬件问题可能会在一天中的任何时间导致训练中断几个小时。

后续团队虽然提出了各种加速重启的方案并安排了更多的人24小时轮值维护,但依然要面对硬件层面的各种问题。

内部训练进度的图表显示,接下来的两周之内,最长的3次连续训练时间长度只有2.8天、2天、1.5天。

• 2021年9月开始,历时3个月;

• 5位工程师;

• 1750亿参数,1024张英伟达80G A100;n 除了云服务器客服,没有专门的设备运维团队;n 使用实验室当时能找到的所有数据,很明显很多时候模型是训练不足的;由于超参数与业内其他几家 FAIR NLP groups(Microsoft/NVIDIA/OpenAI) 所 公 开的超参数有所不同,所以不太清楚最优设置是什么。

以Meta团队的资源和效率,使用992张A100卡,需要大约33天的连续训练(假设0次失败或重新启动) 才能完成3000亿Token的模型训练。

团队发现BF16是最适合的格式也是里程碑。


案例:阿里云面向AI大模型的解决方案


• 除了提供多样化的GPU产品选型,阿里云面向AI大模型的解决方案还包括:1)SCC高性能弹性计算机群以保证算力规模;2)灵活的算力切割及调度能力以满足更细粒度的计算需求;3)加速套件以提高效率。

案例:阿里云面向AI大模型的解决方案

• SCC高性能弹性计算集群:为提升并行运算的效率,集群中GPU之间使用了最高效的NVSwitch互联。节点之间使用了非阻塞式的RDMA网络,同时节点间还有VPC网络互联。此外,集群还用了高性能的集群存储CPFS和块存储。

• 算力切割&调度:提供更小的 GPU 计算粒度,通过池化的方式提升资源使用效率。例如,通过 cGPU 技术实现GPU的资源切割和跨主机资源池,以解决 GPU 资源的使用不充分、或者更加夸张的计算资源配比需求等等,帮助用户获得更有效率和更有性价比的 GPU 计算资源。



--- 报告摘录结束 更多内容请阅读报告原文 ---

报告合集专题一览 X 由【报告派】定期整理更新

(特别说明:本文来源于公开资料,摘录内容仅供参考,不构成任何投资建议,如需使用请参阅报告原文。)

精选报告来源:报告派

科技 / 电子 / 半导体 /

人工智能 | Ai产业 | Ai芯片 | 智能家居 | 智能音箱 | 智能语音 | 智能家电 | 智能照明 | 智能马桶 | 智能终端 | 智能门锁 | 智能手机 | 可穿戴设备 |半导体 | 芯片产业 | 第三代半导体 | 蓝牙 | 晶圆 | 功率半导体 | 5G | GA射频 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圆 | 封装封测 | 显示器 | LED | OLED | LED封装 | LED芯片 | LED照明 | 柔性折叠屏 | 电子元器件 | 光电子 | 消费电子 | 电子FPC | 电路板 | 集成电路 | 元宇宙 | 区块链 | NFT数字藏品 | 虚拟货币 | 比特币 | 数字货币 | 资产管理 | 保险行业 | 保险科技 | 财产保险 |

","gnid":"9979988ef6bc82b25","img_data":[{"flag":2,"img":[{"desc":"","height":"617","title":"","url":"https://p0.ssl.img.360kuai.com/t018e2bb408d0588611.jpg","width":"1210"},{"desc":"","height":"524","title":"","url":"https://p0.ssl.img.360kuai.com/t01d5986233f5e4f090.jpg","width":"1196"},{"desc":"","height":"546","title":"","url":"https://p0.ssl.img.360kuai.com/t014eb9c34bab704c83.jpg","width":"1195"},{"desc":"","height":"609","title":"","url":"https://p0.ssl.img.360kuai.com/t014732bc5277ea327e.jpg","width":"1250"},{"desc":"","height":"391","title":"","url":"https://p0.ssl.img.360kuai.com/t01f6fb26fc7b7f53e9.jpg","width":"1191"},{"desc":"","height":"73","title":"","url":"https://p0.ssl.img.360kuai.com/t010751ee04cd59b13f.jpg","width":"371"},{"desc":"","height":"380","title":"","url":"https://p0.ssl.img.360kuai.com/t016c8049db2c1656e4.jpg","width":"1244"},{"desc":"","height":"216","title":"","url":"https://p0.ssl.img.360kuai.com/t01e3842fb7d5bc7a35.jpg","width":"784"},{"desc":"","height":"87","title":"","url":"https://p0.ssl.img.360kuai.com/t01e7c0c133ed9e87ca.jpg","width":"781"},{"desc":"","height":"84","title":"","url":"https://p0.ssl.img.360kuai.com/t0152a1b9d00e68c50f.jpg","width":"783"},{"desc":"","height":"391","title":"","url":"https://p0.ssl.img.360kuai.com/t01b17824ed05b17679.jpg","width":"1192"},{"desc":"","height":"563","title":"","url":"https://p0.ssl.img.360kuai.com/t014a07f630a4ecfe66.jpg","width":"516"},{"desc":"","height":"401","title":"","url":"https://p0.ssl.img.360kuai.com/t014ccc0c9bdce6bf00.jpg","width":"671"},{"desc":"","height":"76","title":"","url":"https://p0.ssl.img.360kuai.com/t01dc7544b535cd4b8b.jpg","width":"1091"},{"desc":"","height":"331","title":"","url":"https://p0.ssl.img.360kuai.com/t012d1df1e733b4ce42.jpg","width":"1161"},{"desc":"","height":"376","title":"","url":"https://p0.ssl.img.360kuai.com/t01c93f4e8f0ce5964e.jpg","width":"1206"},{"desc":"","height":"254","title":"","url":"https://p0.ssl.img.360kuai.com/t0125cfa7677dc9e9c9.jpg","width":"1187"},{"desc":"","height":"443","title":"","url":"https://p0.ssl.img.360kuai.com/t01c8ecde836c0c5895.jpg","width":"1236"},{"desc":"","height":"340","title":"","url":"https://p0.ssl.img.360kuai.com/t01cc630baa072cebd9.jpg","width":"834"},{"desc":"","height":"471","title":"","url":"https://p0.ssl.img.360kuai.com/t01dc4c7dd157340005.jpg","width":"733"},{"desc":"","height":"605","title":"","url":"https://p0.ssl.img.360kuai.com/t0180bac29c46dd1234.jpg","width":"501"},{"desc":"","height":"432","title":"","url":"https://p0.ssl.img.360kuai.com/t010857b94ff39c8423.jpg","width":"1231"}]}],"original":0,"pat":"art_src_0,fts0,sts0","powerby":"cache","pub_time":1696984690000,"pure":"","rawurl":"http://zm.news.so.com/41de358efaff101e8c9a2a303778a9f5","redirect":0,"rptid":"3483bd405e073a60","rss_ext":[],"s":"t","src":"报告派研读","tag":[],"title":"计算机行业报告:大模型发展的关键引擎,看好AI算力高景气持续

费泼怖3408excel中怎么添加绘图工具兰
闻洪堂18764257507 ______ 在菜单栏:“帮助”的右边的空白区域点鼠标右键,你会看到右键菜单中有一项就是“绘图”,选上他,你的excel中下方就会显示绘图工具栏了

费泼怖3408excel画图怎么设置横纵坐标 - excel作图横纵坐标怎么设置
闻洪堂18764257507 ______ 1.excel作图横纵坐标怎么设置1.在Excel中做好图表之后,右键点击图表中的柱形或者折线等,点击列表中的“选择数据”.2.在弹出的对话框中点击“水平坐标轴”下的“...

费泼怖3408EXCEL插入图表问题 -
闻洪堂18764257507 ______ hi,提供三种方法您可以尝试: 1.选择空白单元格---插入---选择你要插入的图表类型(如柱状图)---选择图表区域右键--选择“选择数据”----添加纵坐标(系列名称:合计;系列值:D3--D5)-----添加水平轴标签(A3--A5); 2.取消1行合并单元格,将D列数据和B列数据位置,然后选择A列和B列创建图表; 3.选择数据区域(A2:D5)----插入图表(如柱状图,这时候有房租、水电、合计)--右键图表---选择数据---将房屋、水电系列删除; 希望可以帮到你^_^

费泼怖3408怎样在excel表格里添加三个加号“+++”? -
闻洪堂18764257507 ______ 在数字面前加“+++”号有两个方法 方法一 1、设置单元格格式 选择要输入的单元格或区域(这里选择:A1)调出菜单>点击:设置单元格格式 见图一 2、在跳出的“设置单元格格式”的对话框中选择:文本 然后确定 见图二 3、效果: 在...

费泼怖3408excel作图怎么添加图表标题 -
闻洪堂18764257507 ______ 单击已经生成的图表区域,在“图表工具”“格式”最左侧的“添加图表元素”“轴坐标”中,选择“主要横坐标轴”或“主要纵坐标轴”,然后在坐标标题框输入正确的名称,即可.

费泼怖3408excel第一行第一列里如果想设置3个斜线,怎么操作?
闻洪堂18764257507 ______ 视图-工具栏--绘图--然后下面出现绘图工具,选择你需要的框里面用直线画图吧,

费泼怖3408excel单元格右侧添加3个字符 -
闻洪堂18764257507 ______ 如果是固定的3个字符,可以直接用&连接来实现. 举例说明如下: 1.A列右侧添加3个字符“三个字” 2.输入公式如下: 3.下拉填充如下:

费泼怖3408如何在excel表格批量添加绿色小三角 -
闻洪堂18764257507 ______ 1、在桌面上找到excel的快捷图标单击,在excel的快捷图标上单击鼠标右键,在右键菜单里点击打开,将excel这款软件打开,如图所示: 2、打开excel之后,我们在单元格内输入一些数据,并将该列选择,然后找到菜单里的数据选项,如图...

费泼怖3408excel VBA窗口里面的横线是怎么插入的 -
闻洪堂18764257507 ______ 方法一:单击菜单栏中的“文件”/页面设置/页眉页脚/自定义页眉,在左、中右三个方框中输入页眉内容,然后在中间的方框中文字后面插入光标,敲一次回车键,再按键盘上的短横线键,一直添加三行半左右.不过这种办法做出来的是虚线. ...

费泼怖3408怎么在excel或者wps里面添加右下角的小三角,如图所示 -
闻洪堂18764257507 ______ 数据-数据有效性-允许里选序列-在下面的来源中设置

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024