首页 >>  正文

还钱的高情商说话技巧

来源:baiyundou.net   日期:2024-07-10

鱼羊 梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

大规模语言模型,微信版,来了!

并且甫一登场,就没藏着掖着:

论文、API接口、在线试玩网站……一条龙全都齐备。

续写文本、阅读理解等常规任务就不说了,这个名叫WeLM的AI,竟然直接让我和李白跨时空聊起了杜甫:

我:现在有一首关于你的歌,其中一句歌词是「要是能重来,我要选李白」,请问你自己有什么看法?

李白:我要选杜甫。

这还不算完,WeLM甚至还治好了我不会聊天的毛病,分分钟教会我如何高情商说话。

这么一个AI,参数量不算大,目前处于百亿水平。

但值得关注的是,实验结果显示,它在18个中文语言任务里,效果堪比参数量是其25倍的模型

是不是有点手痒想上手一试了?先奉上链接,咱们再仔细说说,这波微信是怎么做到的。

体验链接:https://welm.weixin.qq.com/docs/playground/

API接口:https://welm.weixin.qq.com/docs/api/

论文地址:https://arxiv.org/abs/2209.10372

「学富五车」的大模型

微信语言大模型WeLM,全名Well-Read Language Model,也就是「学富五车的语言模型」

在翻译任务上,WeLM不光可以做到基本的,甚至三语夹杂也难不倒它。

在文本续写任务上,只需给出开头就能生成适应不同风格的文本。

这种多语言、多任务能力是怎么做到的?

其实WeLM与著名的GPT-3是同类,都是自回归解码器结构,微信团队选择这种结构就是看中其在海量数据中掌握无穷范式的能力。

在具体实现方法上,WeLM还有两项特色。

一是采用RoPE相对位置编码,与传统的固定位置编码相比能更好处理长文本,比如理解整篇文章甚至整本书。

二是使用62k个token的SentencePiece并保留其中的空格和Tab,这样更有利于下游任务。

使用这些方法,WeLM总共设计了从13亿到100亿参数的三个版本,可按需调用。

其中100亿参数的满血版WeLM在14项中文任务中整体表现超过同大小的模型,甚至在零样本任务上超过比它大25倍的模型。

这其中最大的秘诀就是精心准备的高质量训练数据上充分训练,也就是「学富五车」的含义所在。

高质量训练数据包括从Common Crawl下载的近两年中文网页、大量书籍、新闻、论坛数据和学术论文。

收集到的数据总量超过10TB,其中包含750G英文数据,中文中夹杂的英日韩语为了语义连贯也全部保留。

不过这还不算完,需要经过清洗、去重等一系列步骤才能算得上是高质量数据。

首先是去除噪声和脏数据,结合使用规则和模型检测后,超过87%的数据被过滤。

再利用SimHash算法去重,进一步过滤掉40%的数据。

接下来要去除一切和测评相关的数据,保证公平性,以 17-gram 为检测重复粒度再次过滤了0.15%的数据。

一系列处理后留下的数据量为262B tokens,最后再对这些数据进行不同比重的采样,使数据平滑分布在各个话题上。

对于预训练,团队认为当今多数大模型的训练都不够充分,WeLM 100亿参数版的训练量基本与1750亿的GPT-3相当(300B tokens),在128张A100上训练用了大概24天时间。

为了保证训练效率,WeLM在训练过程中还使用了完全可原地复现的形式,不管发生任何问题都能从最近的checkpoint恢复。

自1750亿参数的GPT-3之后,语言模型规模越来越大,到今年谷歌的PaLM已经达到5400亿,中文大模型同样有这个趋势。

可以看出微信团队选择了另一条路线,以高质量训练数据和高效训练做到「四两拨千斤」的效果。

到这一步WeLM已经有了不错的表现,不过接下来这个步骤再次将其零样本泛化能力提到新的高度。

研究团队针对76个数据集各人工撰写10-20个Prompt,将原任务中的文本关系的标签和输入信息转化成流畅通顺的自然语言形式,更符合自回归语言模型的训练形式。

使用这些Prompt对模型微调后,相当于让模型学会了面对多样的Prompt该做什么。如果遇到相似Prompt形式的全新任务,也可以有更稳定的表现。

实验证明,在全量数据上微调后的模型在新的NLP任务上具备更优秀的零样本迁移能力,同时也使得微调变为一项一劳永逸的工作。

最后,研究团队还测试了WeLM的三个额外能力。

通过提供示例,WeLM可以对自己的决策作出解释,不过这种能力不太稳定,还需要进一步探索。

通过简单提问,WeLM可以对结果进行自我纠正和检查能力,为后续提高性能提供了可能方向。

WeLM还表现出一定的记忆能力,如果输入内容完美匹配前文,即使内容很长、出现频次很低,模型依然可以准确的生成剩下的部分。

最后再来总结一下,WeLM精通中文的同时掌握英日韩等多种外语、可以通过少样本或零样本学习执行全新任务,同时以合理尺寸做到与25倍参数量的模型相媲美使用成本较低,总之就是奔着实用性大规模落地去的。

同步开放在线体验与API,也是希望有想法的开发者能方便的用起来,让WeLM大模型真正实用的工具。

WeLM怎么用

具体来说,WeLM线上Demo目前释出的功能包括:对话-采访、阅读理解、翻译、改写、续写以及自由任务。

在正式开始跟WeLM玩耍之前,记得要先给模型扔一段简单的「范文」,也就是「prompt」。

在线网站会给出一些默认的prompt,你也可以自行修改设计。需要遵循的设计原则是:

第一,描述清楚;第二,例子具备代表性(多个例子更好)。

以文本分类任务为例,prompt应该长这样:

其中的技巧包括,首先,把分类任务用自然语言清晰地表达出来,在上面这个示例中,「微博」即为输入,「类别」即为输出。

其次,在第一句的指令型描述中,需要把可能的分类结果都列出来。

最后,如果效果不佳,可以尝试加入更多例子,让WeLM更清楚你到底想要做怎样的任务。

另外,正如前文所说,WeLM拥有零样本学习能力。

所以直接把它当作问答搜索引擎来用,也不是不行(手动狗头)。

如果你还想得到更多样化的生成结果,token数量、temperature等参数均可调整。

更重要的一点是,WeLM已开放API接口 。也就是说,如果身为开发者的你想在自己的App里用上这个大模型,填写调查问卷注册即可。

One More Thing

说起来,这样的大模型要是真的落地应用了,妈妈岂不是再也不用担心我因为不会聊天而母胎solo ?

比如说……

你还有什么有趣的脑洞?大胆招呼起来~

— 完 —

量子位 QbitAI · 头条号签约

","force_purephv":"0","gnid":"9c8fa94c74c319be7","img_data":[{"flag":2,"img":[{"desc":"","height":"895","title":"","url":"https://p0.ssl.img.360kuai.com/t0183d838d04b013cfb.jpg","width":"1080"},{"desc":"","height":"433","title":"","url":"https://p0.ssl.img.360kuai.com/t01a439e6a7cc3872c1.jpg","width":"1080"},{"desc":"","height":"448","title":"","url":"https://p0.ssl.img.360kuai.com/t01f62df56545a5fc55.jpg","width":"926"},{"desc":"","height":"780","title":"","url":"https://p0.ssl.img.360kuai.com/t0101e0931bc75b9dd0.jpg","width":"1080"},{"desc":"","height":"186","title":"","url":"https://p0.ssl.img.360kuai.com/t01decc9a7411e5c14b.jpg","width":"1080"},{"desc":"","height":"504","title":"","url":"https://p0.ssl.img.360kuai.com/t015ab6830be253ad28.jpg","width":"702"},{"desc":"","height":"366","title":"","url":"https://p0.ssl.img.360kuai.com/t01dbba6ff68c8f48fc.jpg","width":"1080"},{"desc":"","height":"885","title":"","url":"https://p0.ssl.img.360kuai.com/t01aa25ba1f380120d5.jpg","width":"1080"},{"desc":"","height":"410","title":"","url":"https://p0.ssl.img.360kuai.com/t011ed0e409260909b1.jpg","width":"1080"},{"desc":"","height":"394","title":"","url":"https://p0.ssl.img.360kuai.com/t012b5defec0f985fda.jpg","width":"1080"},{"desc":"","height":"362","title":"","url":"https://p0.ssl.img.360kuai.com/t015de1c196ad44b909.jpg","width":"1080"},{"desc":"","height":"590","title":"","url":"https://p0.ssl.img.360kuai.com/t0103900330932fcbc5.jpg","width":"1080"},{"desc":"","height":"172","title":"","url":"https://p0.ssl.img.360kuai.com/t01a845c7b819addfab.jpg","width":"1080"},{"desc":"","height":"691","title":"","url":"https://p0.ssl.img.360kuai.com/t012010cdb16e286b75.jpg","width":"1080"},{"desc":"","height":"1039","title":"","url":"https://p0.ssl.img.360kuai.com/t0135e81ca1e147c336.jpg","width":"1080"},{"desc":"","height":"363","title":"","url":"https://p0.ssl.img.360kuai.com/t01018ce6f14e4f767c.jpg","width":"1080"},{"desc":"","height":"310","title":"","url":"https://p0.ssl.img.360kuai.com/t0147738e0f94f40ce4.jpg","width":"292"},{"desc":"","height":"776","title":"","url":"https://p0.ssl.img.360kuai.com/t01557e80744e6b9894.jpg","width":"867"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"hbase","pub_time":1665636540000,"pure":"","rawurl":"http://zm.news.so.com/24a4298444f64e380c8e571828c2669a","redirect":0,"rptid":"b46353f6192f5bcf","s":"t","src":"量子位","tag":[{"clk":"kculture_1:李白","k":"李白","u":""}],"title":"微信版大语言模型来了:跨时空对话李白、教你高情商说话,在线可玩

淳元泽1380借钱怎么说最合适? -
祖裘封13235267431 ______ 一、找人借钱的时候,态度切不可太过随便找人借钱,属于求人办事的范畴,既然是求人,那就得有求人的态度,别把面子当回事,说话的时候,要多用商量的语气,切勿生硬,也不要大大咧咧的,太过随便.有些人情商较低,不注意这一点,...

淳元泽1380高情商的女人是怎样要钱的? -
祖裘封13235267431 ______ 高情商的女人问男人要钱的方法如下: 1、 暗示:高情商的女人会使用暗示的方法,而不是直接主动去要钱.例如,“老公,最近好像有新款的衣服上市了,我好想要一件哦.” 2、 撒娇:撒娇是女人天生的武器,有时候柔声细语地撒娇可以达...

淳元泽1380有什么好方法叫人还钱的呢? -
祖裘封13235267431 ______ 对于这种无赖,最好的办法就是向法院起诉.建议你直接向法院申请支付令.如果不行的话,就直接向法院起诉要求还款吧.

淳元泽1380如何委婉的向女生借钱,5个高情商句子? -
祖裘封13235267431 ______ 1、欠账是种支持,不催是种信任,催是真的急用,按时付款是诚信,诚信在自己手中请珍惜!希望每一位欠账的客户能理解,支持理解万岁.2、人应该有慈悲之心,但不要滥用你们的同情心,欠债还钱天经地义.3、真是受够了,催别人还钱...

淳元泽1380人生账单不欠账. 老师,父母,盆友,对我们的帮助,那么我们如何还账?如何提高自己情商? -
祖裘封13235267431 ______ 其实不需要还,只要我们能平平安安的度过一生,他们就会很高兴!

淳元泽1380怎么高情商回复别人发的红包? -
祖裘封13235267431 ______ 1. 对方嫌钱少时,可以巧妙回复:“下次我在小数点后面多加几个零,最后一位再加个1,你先发个大的,我随后回你一个.土豪,你先发一个吧,一分也是爱.”这样既幽默又委婉地表达了自己的想法.2. 当对方抱怨红包金额小时,可以回复...

淳元泽1380借钱这件事,高情商的人是怎么处理的 -
祖裘封13235267431 ______ 做好必须的法律程序1. 签订借款合同或者写借条(注意不是欠条,两者区别很大)2. 约定还款期限,逾期不还需承担何种责任3. 要有担保人,借款人不还你可以找担保人偿还4. 要有抵押物(合同注明,逾期不还可以请求法院查封拍卖-车、房子或其他等值价值以上属于借款人财物)5. 利息不高于人民银行规定借贷利息的3倍以上

淳元泽1380怎样才能让欠钱不还的人把钱还给你?
祖裘封13235267431 ______ 把欠条带上,住到他家里……

淳元泽1380体波指的是什么呢?
祖裘封13235267431 ______ 在地球内部传播的地震波称为体波,体波又分为纵波和横波.纵波是震源向四周传播的压缩波,也称为P波,其介质质点振动的方向与波的传播方向一致,从而使介质不断地压缩、疏松,故纵波又称为疏密波,这种波的周期短、振幅小、波速快(在地壳内部的速度可达大约每秒7km),引起地面竖直方向的振动,破坏力较小.横波是由震源向四周传播的剪切波,也称为S波,其介质质点的振动方向与波的传播方向垂直,这种波的周期长、振幅大、波速慢(其波速大约每秒4km),引起地面水平方向的振动,破坏力很大.

淳元泽1380螺纹联接常用的防松方法有哪些?
祖裘封13235267431 ______ 常用的防松措施有:(1)摩擦防松这是应用最广的一种防松方式,设法增大螺纹副... (2)机械防松用便于更换的金属元件约束螺纹副,例利用开口销使螺栓螺母相互约束,...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024