首页 >>  正文

其他时间还是其它时间

来源:baiyundou.net   日期:2024-05-02

杨净 梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

做大模型的公司不少,能明确给出产业落地时间线的还是头一次见。

刚刚,在2023京东全球科技探索者大会暨京东云峰会上,京东推出了言犀大模型+言犀大模型开放计算平台,并展示了零售、健康、物流、营销、金融、客服等多个产业场景的阶段性实践成果。

一开场,就欣赏了一段由大模型驱动的数字人歌舞表演。

电商场景下,支持AIGC商品内容生成。

还有AI增长营销平台,几句话构建出营销方案、推广网站。

医疗场景下,通过多轮对话即确定用户腰疼的的原因。

除了现场演示之外,三步走的落地路线图也格外引人关注——

今年下半年在京东内部高复杂场景中反复打磨锤炼,并针对重点场景的标杆客户进行对外服务,主要目的是发现那些看起来“不起眼”,但产业应用中又非常关键的问题。

2024年上半年,就能针对严肃商业场景将大模型能力全面对外开放 。

划重点了,这里的对外开放不只是提供API,而是连产业应用一起打包,让企业开箱即用的那种

京东不会把没做好的菜端上餐桌。

而京东之所以有底气制定这样路线,也是颇有不少干货在里面的。

产业伙伴需要什么样的大模型?

通用大模型火过半年之后,整个产业已经把目光聚焦到下个阶段——产业大模型。

随着最早提出产业大模型的京东交出答卷,关于「产业伙伴需要什么样的大模型」的问题也可以得到阶段性解答。

大模型时代到来,C端应用层出不穷,普通大众有了直观感知,对其所存在的“胡说八道”等问题,也有了切身体会。

但对于B端企业而言,由于身处行业不同以及自身业务考虑,到底「用什么?如何用?」始终没有很好的答案,大多都“还是不知道怎么用”。

当大家谈到产业大模型,第一反应是聚焦某个行业做小模型

但何晓冬告诉量子位,这可能是一个误解,做产业模型的时候还是需要一个通用域的数据,通用域数据对行业应用也非常关键,它提供了背景常识性的知识。否则如果用户突然提出一些跟这个领域不相关的询问的时候,话题的跳跃性比较大,原来领域小模型就会很茫然。

所以,企业所需要的产业大模型也必须建立在通用能力基础上

大模型于企业而言,大都是降本增效之用。比如可以自动化处理数据和任务、分析大量数据给出更精准的决策、扩展到新的业务领域等等。

而要实现这些用处,大模型就必须满足两个原则:可信、可用

  • 可信,意味着模型的预测结果是可靠的,可以被企业信任;
  • 可用,则表示模型可以在实际业务中发挥作用,为企业创造价值。

这两点,不仅是企业用什么大模型的选择基准;也是实现大模型产业化的两个基础特性。

首先来看可信。

针对性地解决大模型可信问题,市面上仍未形成完整的解决方案。

过去几个月大模型从亮相到应用以来,始终存在的幻觉问题。而早在2020年京东基于Transformer做的K-PLUG模型实体属性抽取准确率达到了95%,已经达到了商用的水平。

这各中原因,在于京东走出了自己一条路——知识注入

当时放在业内,属于首创。

它大幅改善了此前AI生成长文本任务中文本多样性、篇章连贯性,以及在商品卖点文案的生成中尤其需要关注的卖点独特性、属性一致性,给予商品“真实的赞美”。

最终在一系列NLP任务中,比如实体属性抽取准确率、生成式多轮对话ROUGE-L、多轮问答知识检索率,其性能明显优于其他基线模型。

之所以能这么早地发现“幻觉”问题并解决,这与他们一直以来围绕产业实践有关。

市面上一般生成式语言模型生成的内容正确率是83%、85%左右。一般toC用户用起来觉得还可以,十个里面错一个,但是商用是不可接受的

同样的思路,也集成到了可用的实践上。

从提供大模型企业的视角下,这个问题就转变成如何让大模型创造普惠价值。任何一项技术实现普惠,意味着技术门槛和使用成本的尽可能降低。

算法的泛化+向量数据库+SaaS,这是京东给出的一套组合拳。

前两者自不必多说,一方面算法泛化能力,可以让模型处理多种任务,解决行业中复杂长尾场景。

2022年,针对模型泛化性不足,京东提出百亿级Vega模型。并于2023年在通用语言理解基础模型方面对织女大模型进行再升级,提出规模更大、性能更强、迁移性更好的Vega v2模型。

向量数据库则可以实时更新知识库,补齐大模型的长期记忆,还能降低训练成本,可以说一举多得。

而向量数据库,2019年京东就在业内率先研发了Vearch。目前服务超100家大中型企业用户。数据显示,将京东的向量数据库用于大模型预训练,相比传统方式,通过优化模型推理效率,推理成本降低80%。

目前大模型在应用上的主流思路,就是调用API。何晓冬在接受采访时表示,这对于一些传统行业客户来说,这依旧有一定的技术门槛。

而客户唯一关心的就是服务效率,只要能将产品用起来就行。

于是团队决定直接将技术解耦形成“言犀AI开发计算平台”,并在内部实践中打磨产品模块。客户甚至不需要掌握深厚的AI知识,跳过中间步骤直接引入成熟的大模型能力。

之前需要10余人的科学家团队工作,现在只需要1-2个算法人员,通过平台即可完成从数据准备、模型训练到模型部署的全流程,训练效率提升2倍,推理提效6.2倍,成本节约近90%。

从可信、可用这两个角度来看,京东给出的解决方案,在整个行业中打了个样儿。

从语言大模型走向多模态数字人交互

这种围绕产业实践发现问题、解决问题的方法,不光体现在大语言模型上,也体现在京东产业AI发展的各个阶段。

前深度学习时代,还很少有人期望AI能像今天一样独立成为一个功能甚至产品,当时的目标主要集中在降本增效、体验优化上。

2012年京东开始应用智能客服中心,着力于用技术辅助客服提升人效,优化客户体验。回首看来,其中探索的三个具体任务方向:

ASR语音识别技术、NLP语义分析技术、数据挖掘技术。

时至今日,这三类技术对大模型的训练影响颇深。

进入深度学习时代,AI开始能在更综合、复杂的场景下发挥作用。

2015年,京东智能客服正式应用了深度神经网络技术。2018年,首度升级无人客服实现人机结合。在同样“深度”的实践过程中,言犀团队逐渐认识到了这样一个问题:

客服对话属于任务导向性对话,最终是要解决真实场景的问题,与一般闲聊有本质区别。而且不同的场景,用户对于对话的要求也不一样,仅售前和售后就差别很大。

于是,早在AlphaGo掀起上一轮人工智能热潮的那段时间,何晓冬就提出“对话的本质就是推理和决策”,后来他在各种场合常用“围棋也叫手谈”来解释这个观点。

在此思想指导下,何晓冬带领团队融合声学、语义、时间等多模态特征,开发出一系列人机交互场景的“话语权决策“(Turn taking)技术路线。

最近谷歌整合旗下谷歌大脑与DeepMind团队,提出要用AlphaGo技术与Transformer结合开发下一代大模型“双子星”Gemini,也标志着这条路线的价值终于被更多人认识到。

再后来就到了现在Transformer大模型时代,京东的布局也很早。

京东在AI工程化方面,每天服务数亿活跃用户。以智能客服领域为例,每年产生数百亿的动态交互数据,一是数据规模大,每天提供1000万智能客户服务,每月200万小时通话语音,今年京东618期间累计服务超7亿次,在各种高负载考验下,京东沉淀出了最佳实践。

加上京东其他领域的人机交互,数据量级达到了数百亿。

2022年,京东以言犀2.0——人工智能应用平台的方式将内部验证过的技术解耦出来,开始对外输出。

如今的言犀AI开发计算平台,也是延续着这个思路。

何晓冬介绍,今年起,言犀大模型正在强大工程化能力基础上于京东场景内深度落地,在健康、金融、物流等京东众多优势行业可复制性的场景中率先锤炼能力,打磨出成熟可靠的技术能力。

以健康领域为例,靠着言犀大模型的多轮交互、工具调用、总结摘要、图文多模态等能力,打造了健康助手及辅助诊疗应用。

目前,健康助手及辅助诊疗已积累超3千万高质量临患对话,构建起百万级规模医学知识图谱,涵盖超千种疾病专业性服务,20种评价标准保障医疗安全。

在物流领域,在言犀大模型的支撑下,京东物流超脑实现实时交互、根因分析和智能决策,并更新迭代至具备实时自动生成全局最优的供应链解决方案的能力。

在营销领域,京东科技市场和平台运营团队打造了AI增长营销增长平台,运用大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,实现方案生产效率上百倍提高;将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。

接下来是正在加速到来的通用人工智能时代,何晓冬认为一定是往多模态方向走。

当AI的通用能力达到一定程度,就可以不只停留在幕后提供技术支持,而是形成产品直接面对人类用户,甚至像未来智能体一样更深层次与人类交互。

对此,京东云在言犀大模型的基础上整合了多项多模态数字人交互能力,也在数字人客服、直播等场景实践中找到出一些心得。

比如实现了语义驱动的肢体动作编辑,通过与大模型结合让数字人说话时的动作与语义匹配,交互更加自然。

又比如数字人动态局部高清技术,利用了人类视觉感知并不均匀的特点,对脸部特别是眼睛周围格外敏感。通过重点区域提高分辨率,其他区域适当降低分辨率,从而降低部署成本。

在JDD上他们表示,言犀会进一步降低操作门槛与操作难度,让更多中小商家与个人能够用得起、用得上数字人服务。

……

如此看来,言犀大模型落地路线图中强调要有“半年打磨期“的原因就呼之欲出了:

不能只提供API告诉外界有这么个AI能力,最终目标是为合作伙伴提供直接可用、有端到端价值的产品模块。

大模型时代下的京东路线

几个月前,企业们还在纷纷抢发大模型,到世界人工智能大会摇身一变“大模型主场”,各家纷纷给出自己的行业落地解决方案。

虽然看上去琳琅满目,但若进一步了解就会发现,这些方案不可避免存在业务场景趋同、落地进展仍处于起跑阶段等问题。

这与大模型技术产业化难点有关,尤其是最后一公里的问题,往往就是能用与否的边界。这牵涉到整个系统工程难题,并非传统AI三要素就可解决。

作为最早提出聚焦产业大模型的京东,早已感知到这种转变,并将其更新为全新“三要素”内涵:

  • 场景,以往静态的数据无法适应动态的交互,只有活的在行业应用中的场景数据,才得以实现。
  • 产品,单点算法不足以支撑起新的大模型。最终产品形态才具有核心竞争力,并能带动体系算法的创新和突破。
  • 算力,单个AI芯片进步的速度慢于大模型算力需求的井喷,算力集群成为更好的解决方案。

至此大模型时代下的京东路线,也就此明晰:

产业原生。源于产业、服务产业。

于是在这场峰会上,京东将自身底层能力解耦,从基础层、模型层、到MaaS、SaaS一揽子技术产品和解决方案都给释出亮相给产业伙伴。

甚至于,已经给出了明确的“三步走”战略:

  • 第一步,基于核心产业数据,内部构建基座大模型;
  • 第二步,在零售、金融、健康、物流等京东内部核心业务应用;
  • 第三步,针对金融、政务、健康等京东域外重点产业场景全面开放大模型能力,向产业输出可用可控可信可负担的定制化模型。

这样一条落地路径,也是京东再次向业内重申了自己的技术追求:

成本、效率、体验、可信、普惠、突破

早在2017年,京东提出“技术、技术、技术”口号,这三个技术代表了三个层次:

第一个层次是服务自己业务的需要;第二层次是服务产业的技术;第三层是探索未来的技术。

这三者两两耦合,形成技术与产业的闭环——基于产业的前沿创新突破,随后在内部打磨沉淀实现“可信”,最终服务产业创造普惠价值

也正是因为基于产业的思考,自今年2月业内首宣产业大模型之后,京东没再透露更多进展,直至现在才首次将自身技术积累首次亮相。

毕竟从现在发展情况来看,大模型落地的难点并不在于技术追赶,而在于产业突破。

— 完 —

量子位 QbitAI · 头条号签约

","gnid":"956ff325f9a13008d","img_data":[{"flag":2,"img":[{"desc":"","height":"403","s_url":"https://p0.ssl.img.360kuai.com/t01af772c5a95097ca7_1.gif","title":"","url":"https://p0.ssl.img.360kuai.com/t01af772c5a95097ca7.gif","width":"700"},{"desc":"","height":"508","s_url":"https://p0.ssl.img.360kuai.com/t0129057ebe2b71089e_1.gif","title":"","url":"https://p0.ssl.img.360kuai.com/t0129057ebe2b71089e.gif","width":"900"},{"desc":"","height":"395","s_url":"https://p0.ssl.img.360kuai.com/t0119a278b04d9c6568_1.gif","title":"","url":"https://p0.ssl.img.360kuai.com/t0119a278b04d9c6568.gif","width":"700"},{"desc":"","height":"504","s_url":"https://p0.ssl.img.360kuai.com/t01892ab46d7cfa5481_1.gif","title":"","url":"https://p0.ssl.img.360kuai.com/t01892ab46d7cfa5481.gif","width":"900"},{"desc":"","height":"513","title":"","url":"https://p0.ssl.img.360kuai.com/t01ac8d1ea57a2c4608.jpg","width":"1080"},{"desc":"","height":"192","title":"","url":"https://p0.ssl.img.360kuai.com/t0135c5189cf5604f2f.jpg","width":"1080"},{"desc":"","height":"199","title":"","url":"https://p0.ssl.img.360kuai.com/t01764e321986219c96.jpg","width":"1080"},{"desc":"","height":"407","title":"","url":"https://p0.ssl.img.360kuai.com/t01e2ceb8bea1d3774e.jpg","width":"1080"},{"desc":"","height":"645","title":"","url":"https://p0.ssl.img.360kuai.com/t01864969418e4d3c7e.jpg","width":"1080"},{"desc":"","height":"199","title":"","url":"https://p0.ssl.img.360kuai.com/t011ace8cae95362980.jpg","width":"1080"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"pika","pub_time":1689248940000,"pure":"","rawurl":"http://zm.news.so.com/5bd014f601464635f751823700523229","redirect":0,"rptid":"f85c66e3c8c250b3","rss_ext":[],"s":"t","src":"量子位","tag":[{"clk":"ktechnology_1:nlp","k":"nlp","u":""},{"clk":"ktechnology_1:京东","k":"京东","u":""}],"title":"京东大模型交卷:天生离产业更近一步

冀翠赖5006两个时间用of连接 前面用什么介词比如说 the morning of july 1st介词是根据前面的时间还是后面的时间?或者是其它的?综合的来讲..不是这句话,一样一个我... -
印居霞19854128210 ______[答案] 当有两个及以上时间的时候,根据最具体的那个使用介词,比如: He wakes up at seven o'clock in the morning. He will arrive in Shanghai in the morinng on Feb.1st.

冀翠赖5006自考行政管理专科,专业科考试时间,除了4月和10月可以报,其它时间可以报吗? -
印居霞19854128210 ______ 看当地规定,有的省一年考4次,即1月,4月,7月,10月,如果4次当然可以提前毕业,如果每年只考两次,没有其他方法,曾有人为考一门等了一年.

冀翠赖5006其它时间都不会?只有排卵期同房会怀孕,其它时间都不会吗
印居霞19854128210 ______ 你好,排卵期不是只有一天,是十天.如果你能确定不是在排卵期的,那都算是安全期,在安全期时做爱是不会怀孕的. 由于排卵容易受外界因素的干扰,排卵有时提前有时推迟,所以安全期并不绝对安全,不准备怀孕的一定要提前做好避孕措施

冀翠赖5006怎么能在其它时间周期还是显示日均线?(没分了,谢谢) -
印居霞19854128210 ______ 换算,比如60分显示5日均线,就换算成20,20个60分钟就是5日线,比对吧.直接应用日线数据过来,有差错.MA(CLOSE#DAY ,5);你试试看,有差错

冀翠赖5006每天早上起床腰酸其它时间不怎么腰酸是怎么回事? -
印居霞19854128210 ______ 早上阴气入内所以在每天早上六点左右你会感觉腰疼腰酸其他时间没有感觉.建议你每天晚上熬10克杜仲,应该会好一点.希望对你有帮助!

冀翠赖5006一加手机2除了可以查看北京时间以外,还能不能查看其它国家的时间??
印居霞19854128210 ______ 当然是能的,各个国家的都能看呢,一加手机2的时钟应用界面也超级好看,每个时区的时间都用一个圆圈表示出来,很直观,没有一丝多余的东西,比我们传统的时间界面有意思多了. ̄ω ̄

冀翠赖5006锻炼最好在什么时候才合适?一般多长时间? -
印居霞19854128210 ______ 正常人一天只休息七小时即可,小孩子适合延长一到两小时,一般会出现春困或秋困,其它时间也这样的话,可能是代谢不畅,要注意调养.少睡反而有精神,说明身体是处于透及状态,久而会出现早衷现像! 午睡 ,有益健康并可减少某些疾...

冀翠赖5006为什么要用晨尿测试早孕条,其它时候用准确吗? -
印居霞19854128210 ______ 楼主: 早孕试纸自测率为75%(药店有售),5分钟内观察有效,有是可出现假阴性或假阳性,在月经延迟10天后检查结果较为准确.月经周期延后7天左右仍属正常范围. 建议你严密观察,如果月经延迟一周以上,到正规医院妇科进行血HCG、B超等相关检查,确诊是否怀孕. 如果您觉得回答满意,请您在网上棱碃迟度侏道虫权矗护选择我为最佳答案,谢谢.

冀翠赖5006是不是只有排卵期才会怀孕,别的时候不会怀孕? -
印居霞19854128210 ______ 不是,只要做就有可能怀孕

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024