首页 >>  正文

轻量级linux系统

来源:baiyundou.net   日期:2024-09-24

衡宇 发自 凹非寺

量子位 | 公众号 QbitAI

“要做中国的OpenAI!”“要打造中国版ChatGPT!”ChatGPT的火以燎原之势蔓延到每一个角落。

人们目光的焦点聚集到这个具体的现象级应用,或者其它大模型支撑的类ChatGPT产品上。大模型似乎成为了人人都能参与的游戏?智源研究院院长黄铁军并不这样想。

ChatGPT的出现,好比用电灯点亮了一个街区。

但是要建全国、全球的电网,中间还有很长的路要走。

“很长的路”上,技术、资金、算力、算法、基础设施,搭建了一道难以攻破的壁垒。要继续前行,得凿开壁垒,开凿的斧头应是大量的技术研究和创新合作。

智源研究院就提供了这么一把斧头,它联合30多家产学研单位,开发了FlagOpen(飞智)大模型技术开源体系。这也是国内首个大模型开源体系。

黄铁军

黄铁军表示,希望大家的关注点从AI“海平面以上”冰山一角的大模型,回归到“海平面以下”的AI技术生态的全部,尤其是技术体系上。

一枝独秀,不如降低AI的应用门槛

2022年的云栖大会上,阿里推出了AI大模型开源社区“魔搭”Model Scope,推出伊始,达摩院就向社区贡献了300余个AI模型,全面开源开放。

FlagOpen是否意味着又一个魔搭的诞生?智源研究院副院长兼总工程师林咏华解释了二者的不同。

“魔搭有点像抱抱脸(HuggingFace)”林咏华谈道,“FlagOpen和魔搭不一样的地方是,我们的主要目标不是构建一个聚集很多人的繁华社区,而是推动大模型技术的发展。”

基于这个目标,FlagOpen配套了六个模块,分别是FlagAI、FlagPerf、FlagEval、FlagData、FlagStudio和FlagBoot。

FlagAI

FlageAI集成了很多主流大模型算法技术,以及多种大模型并行处理和训练加速技术,并支持微调。目前涵盖的模型包括NLP、CV与多模态等领域,如语言大模型OPT、T5,视觉大模型ViT、Swin Transformer,多模态大模型CLIP等。目前,FlagAI已经加入Linux基金会

“悟道2.0”通用语言大模型GLM,“悟道3.0”视觉与训练大模型EVA,视觉通用多任务模型Painter,文生图大模型AltDiffusion(多语言),文图表征预训练大模型(多语言)等智源研究院“悟道”大模型项目多个成果也开源在FlagAI。

FlagPerf

AI软硬件评测面临异构程度高、兼容性差、应用场景复杂多变的挑战。FlagPerf搭建的AI硬件评测体系,支持多种深度学习框架,及时跟进最新主流模型评测需求,便于AI芯片厂商插入底层支撑工具,且不以排名为核心目标

截至FlagOpen体系发布,FlagPerf已和天数智芯、百度PaddlePaddle、昆仑芯科技、中国移动等进行合作。

FlagEval

FlagEval是覆盖多个模态领域、包含评测维度的评测工具,首先开放的是近期很火的多模态领域-CLIP系列模型评测工具,支持多语言多任务、开箱即用。

FlagData

FlagData数据工具开源项目集成包含清洗、标注、压缩、统计分析等功能在内的多个数据处理工具与算法。此前,智源研究院已经构建了WuDaoCorpora语料库。

FlagStudio

FlagStudio是文生图、文生音乐等艺术创作相关的开源项目集合,集合的算法和模型更贴合中文场景,当前主要提供智源研究院文生图相关能力的应用。

FlagBoot

FlagBoot是基于Scala开发的轻量级高并发微服务框架,默认完全异步,且没有宏、隐式转换等晦涩难懂的代码。极少的代码量便于开发者轻易了解背后逻辑,而后进行自定义修改。

“大数据+大算力+强算法=大模型”是当前AI发展的主流,用FlagOpen,开发者尤其是初创公司,可以尝试大模型的开发和研究工作,换句话说,AI的研发、应用门槛被降低了。

以大模型为主导的方向提供基础开源体系,某种意义上,智源研究院在追赶ChatGPT产品的热点上退了一步。这或许是其非营利性机构的性质使然。

而ChatGPT背后的OpenAI,也是打着非营利性机构的旗号出道的(2019年3月1日,OpenAI LP子公司成立,旨在营利)。同样的机构性质,同样押注AI,并关注大模型赛道,

智源研究院有打算,或者可能成为中国的OpenAI吗?

ChatGPT每日调动后台参数的成本已经是天文数字。如果要在中国打造一个OpenAI,需要多少成本打底?

“智源要不要做一个OpenAI,很难简单做对比。”黄铁军回答这个问题时说道,DeepMind、OpenAI和智源研究院是同类机构,但不能简单等同。追求AI前沿,做开放研究是三家机构的共鸣;没有大量投资就没有那么多人做大量探索,三个机构也都有各自的社会资源投入办法,比如微软刚追投了OpenAI100亿美元。

但黄铁军同时表达了自己的不解,那就是:中国版的OpenAI怎么定义?

“某种意义上,这就是很不清楚的问题。”

我没有批评的意思。但是有人站出来说要做中国的OpenAI,他到底是什么意思?是想和OpenAI一样有100倍的盈利吗?更多的还是要问想做中国OpenAI机构那个人,他眼中的定义是什么。

开源的打不过封闭的?

PC时代,Linux打破Wintel联盟的垄断;在iOS的封闭生态和Android的准封闭生态下,开源的RISC-V异军突起。开源意味着开放,意味着多家机构同时维护带来的风险降低和问题减少。

FlagOpen是国内首个大模型开源体系,智源研究院拿出了这样的态度:

大模型时代,需要这样的开源。智能时代需要真开源,就像Linux、RISC-V和2022年完全转入开源社区的PyTorch。

聊到此处,林咏华表示更愿意把FlagOpen类比为大模型领域的Linux

但有一种说法广为流传,即开源虽好,能让得到更好的迭代和更新,但开源的打不过封闭的

对这个问题,黄铁军做出了回应。他称Linux的成功,不是因为把其它操作系统都打败了,而是在整个市场竞争中占据了主要份额。

开源开放应该是一个大趋势,大部分情况下,以开源形式或以开源形式为基础的产品会占据较大的份额。

与此同时,在某一特定方向上,有一个闭源产品做得更好并不奇怪。这不等于谁打败了谁,而是大家在满足用户需求时做出了不同选择。

开源是FlagOpen的选择,来一起看看这个选择现阶段的成果——

登陆GitHub可以看到FlagOpen体系里各个项目的标星,标星最多的是FlagAI,尚不过千,最少的标星量只有几十。另外还可以观察发现,开源体系中只涉及推理方面,没有涵盖训练部分。

林咏华表示这是智源的策略,即不是等做到完美再开源,而是把种子点做了之后就开源,以此方便各个企业之间在没有商业合作协议的情况下就能互相合作。

选择现在公布FlagOpen开源体系的另一个原因,是现在大模型火上了天,有很多没有接触过大模型的初创团队也开始尝试自己训模型。

工欲善其事,必先利其器,“既然有这么多人想做这件事,我们在这个时候开源出来,是想给予我们的经验,让他们更加顺利往前走。”

— 完 —

量子位 QbitAI · 头条号签约

","force_purephv":"0","gnid":"9c2f2e39d7d684a18","img_data":[{"flag":2,"img":[{"desc":"","height":"720","title":"","url":"https://p0.ssl.img.360kuai.com/t012641faa34997fbe0.jpg","width":"1080"},{"desc":"","height":"540","title":"","url":"https://p0.ssl.img.360kuai.com/t01356059c96d7501ce.jpg","width":"960"},{"desc":"","height":"502","title":"","url":"https://p0.ssl.img.360kuai.com/t01b6fda4038b3e37f2.jpg","width":"1080"},{"desc":"","height":"608","title":"","url":"https://p0.ssl.img.360kuai.com/t01034494e7a29abe8d.jpg","width":"1080"},{"desc":"","height":"407","title":"","url":"https://p0.ssl.img.360kuai.com/t01a421d1771d786004.jpg","width":"1080"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"hbase","pub_time":1677652260000,"pure":"","rawurl":"http://zm.news.so.com/f46cbe28cb428c9efbc21b6cfc5254da","redirect":0,"rptid":"646b89ef052b2b9d","rss_ext":[],"s":"t","src":"量子位","tag":[{"clk":"ktechnology_1:linux","k":"linux","u":""}],"title":"要做中国OpenAI的很多,但智源要打造大模型领域的Linux

关珠绍3962比较不占系统资源的linux版本 -
廉雯促19888545387 ______ 512内存不小了,这个配置很不错了,出问题可能是因为fedora 11和ubuntu 9.04这些版本太过于激进了,包的稳定性不够,最新的xorg7.5不那么稳定 我用debian,硬件需求很低 如果担心debian硬件支持不好,可以用knoppix knoppix我在256M,P3的老机器上用过,还开着compiz

关珠绍3962怎么把linux系统装进U盘? -
廉雯促19888545387 ______ 把linux要装进U盘的话可能得需要选取一些轻量级的发行版.推荐几个,puppy linux一个100多M的;slitaz-3.0linux一个只有30多M的;tinycore_4.1 linux这个确实很小只有10M多一点.不过由于这些轻量级的linux本身体积小所以在功能上易操作性...

关珠绍3962给老电脑装个linux -
廉雯促19888545387 ______ 你好,,,轻量级linux发行版适合您的要求,如:puppy , LXLE , Bodhi Linux ,,,,,等等 参考网页: http://www.linuxdown.net/

关珠绍3962为什么说linux是轻量级进程 -
廉雯促19888545387 ______ 因为linux并没有为线程准备特定的数据结构.在内核看来,只有进程而没有线程,在调度时也是当做进程来调度.linux所谓的线程其实是与其他进程共享资源的进程.为什么说是轻量级?在于它只有一个最小的执行上下文和调度程序所需的统计信息.他是进程的执行部分,只带有执行相关的信息.

关珠绍3962请问有什么版本的Linux系统占用资源最小 -
廉雯促19888545387 ______ puppy,dsl,pclinux 三者中puppy比较好看,dsl最好用 内存主要是图形桌面和firefox之类的大程序占去的,什么版本关系不大,选轻量级的桌面环境或者窗口管理器+轻量级程序就很省内存 ps: cpu不是问题,386以上都能运行,快慢问题,制约系统的还是内存,内存不足时不仅慢而且一卡一卡,根本不能用 linux对cpu的使用和windows不同,一般cpu都在一刻不停地运转,cpu 20%,40%都很正常,内存也是,有多少尽量用 puppy好像是64M内存,dsl更小一些,我平时用debian+openbox,还开启一些特效,开机时120M内存,几个程序也不到400M

关珠绍3962ubuntu linux 系统各版本的区别 -
廉雯促19888545387 ______ Ubuntu的不同版本主要是应对使用者的不同的预期需求,其实只要发行版本号一致,从内核来说是相同的.通俗一点可以这么说,不同发行版本的区别在于预安装软件的不同和图形桌面环境的不同.  资源消耗上来说一般认为kubuntu > ubuntu ...

关珠绍3962内存要求最低的带图形界面的Linux -
廉雯促19888545387 ______ 要求最低的图形界面就是你安装好一切以后自己安装xfree86(更高级点xorg),这时候已经可以从命令行执行图形界面的程序了,比如你在启动xinit后在命令行打入firefox,如果你安装了firefox的话就可以打开了(firefox明显是一个图形界面软件...

关珠绍3962Ubuntu怎么安装轻量级的LXDE桌面 -
廉雯促19888545387 ______ Ubuntu怎么安装轻量级的LXDE桌面 1、安装.运行以下命令在Ubuntu上安装Lubuntu的定制LXDE和vanilla LXDE:sudo apt-get install lubuntu-desktop2、请使用此命令来安装只有香草LXDE:sudo apt-get install lxde 您还可以通过下载Lubuntu Live ...

关珠绍3962如何在windows下搭建一个linux环境 -
廉雯促19888545387 ______ windows下Linux环境搭建 相信绝大部分CFD方向的研究者都需要通过自己编程来解决问题.所编写的程序有大有小,小的只是一个脚本,用于数据的后处理;而大的则需要调用若干CPU进行并行计算.然而据我所知,国内大多数CFD研究者的...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024