首页 >>  正文

深度搜索网页版

来源:baiyundou.net   日期:2024-09-20

机器人(图片来源:Unsplash)

▎钛媒体App尝试使用ChatGPT模型问了三个问题,我们发现,ChatGPT有些信息非常精准,有时有点像知乎或百科的回答,有时则像谷歌、Bing等搜索引擎结果。虽然其类似“超级鹦鹉”的模仿力令人惊艳,但部分相对复杂信息的准确度,尤其是中文信息准确度仍有待商榷。

钛媒体编辑丨林志佳

过去一周风靡社交网络的人工智能(AI)产品,非ChatGPT莫属。

12月5日,微软投资的美国 AI 实验室OpenAI创始人兼CEO Sam Altman在社交媒体上宣布,其11月30日发布的聊天机器人模型ChatGPT,上线短短五天,用户已经突破了100万。

所谓ChatGPT,就是模仿人类说话风格的同时回答大量的问题,通过 OpenAI 的新模型生成一些语义答案,利用网页应用形式与用户对话互动,实现简单聊天、信息咨询、撰写诗词作文、修改代码等。

由于其较高质量的回答、高效获取信息的方式以及上瘾式的交互体验,ChatGPT引起了国内外社交媒体的广泛传播与关注,而且产生取代谷歌等搜索引擎的讨论与可能性。

连世界首富、特斯拉CEO马斯克也称:“许多人陷入了该死的疯狂ChatGPT循环中。”甚至已经有国内投资人开始寻找ChatGPT背后的 OpenAI公司,求购其股份。

尽管对其有大量赞扬的声音,但程序员聚集的问答社区Stack Overflow已经宣布禁止使用ChatGPT生成的机器回复,而且ChatGPT存在输出结果不稳定、没有纠错体系、商业落地难、数据安全难保护、对中国境内的实名用户不友好、关键模型不开源、AIGC(人工智能内容生产)赛道引发的创业与投资泡沫等问题,已引发业内广泛讨论。

这是编辑输入“钛媒体”三字,chatGPT给出的答案,准确度确实令人惊艳

接受钛媒体App独家采访时,京东集团副总裁、IEEE Fellow何晓冬博士表示,中国应该要发展自己的ChatGPT模型产品。

“坦白讲,(语音机器人)这个方向是对的,以后会有这个市场需求。”何晓冬强调,除了在研究方面继续向前探索外,在文本生成上,ChatGPT有独到的体验和价值,已经快要接近可商用的地步了。

ChatGPT到底是怎么形成的?能否取代搜索引擎?

“AI 快要成精了!”有投资人玩ChatGPT之后在朋友圈这样感慨。

那么,什么是ChatGPT?

你可以理解为,ChatGPT偏任务型的多轮对话或问答系统,定位于“通用型 AI 技术助理”。相比苹果Siri 和小爱同学的“订餐、订票、订宾馆”,ChatGPT更多执行开放域任务,即问答、阅读理解、推理、头脑风暴、写作文、改错等,可以说是“AI 版的知乎”。

今年3月4日,OpenAI团队在预印版网站arxiv上提交了一篇题为“训练语言模型以遵循人类反馈的说明”的论文,详细阐述了ChatGPT背后基于拥有13亿个参数的InstructGPT大模型的技术能力。

OpenAI在论文中指出,ChatGPT核心在于InstructGPT模型输出,更深层次是基于OpenAI 研发的GPT-3.5基座能力。尽管InstructGPT模型参数,比NLP预训练模型——GPT-3 1750亿个参数少100倍,但前者的数据模型有所甄选、校准和微调,训练出来的结果更精准,能够更简单的优化语言模型。

该团队称,ChatGPT大部分沿用了InstructGPT的训练方式,在数据收集阶段招聘了人类AI训练师,同时扮演用户和AI助理角色收集数据。在此过程中,这些AI训练师可以根据初始模型的结果修改模型生成的回复,从而被用于有监督地精调训练模型。随后,工程师会对模型的多个生成结果进行比较,从中甄选数据中更加符合人类偏好的输出信息,甚至存在持续学习能力。OpenAI统计发现,其API用户在超过70%的情况下更喜欢InstructGPT。

目前,ChatGPT仍处于免费测试阶段,不限量向公众开放。而基于其破百万的用户数,平台所花费的成本不算小。马斯克曾询问“每次聊天的平均费用是多少”,Altman回复:“用户平均每次聊天所花费的可能是个位数美分。”

钛媒体App也第一时间尝试使用ChatGPT模型,简单问了三个关于芯片相关的问题。我们发现,ChatGPT有些信息非常精准,有点像知乎或百科的回答,有时候像谷歌、Bing的搜索引擎结果。但它的答案精准度依然有待商榷。

1、摩尔定律什么时候会终结?

2、英特尔未来能否超越AMD和英伟达?

3、帮我写一篇芯片的七言绝句

清华大学计算机科学与技术系长聘副教授、博导,聆心智能创始人黄民烈告诉钛媒体App,ChatGPT展示了新一代AI技术的能力,或许不远的未来,一定程度的AGI(通用人工智能)可以做到。至少无缝人机交互是乐观的。他指出,InstructGPT的数据很好,胜在数据质量高、多样性、RLHF算法。其中,强化学习带来的增益非常之大。

目前来看,ChatGPT的升级在于更多是算力与语料调教后的技术成果。

何晓冬则对钛媒体App表示,ChatGPT模型在使用体验上确实让人感觉耳目一新。无论是流畅性,还是逻辑感都非常强,逻辑强于内容。但“干货”量偏低,缺少一些知识的准度,“其实某种意义上,我觉得它的实用价值现在还是比不上谷歌(搜索)的。”

前Google总部科学家、出门问问创始人李志飞接受采访时表示,相对于语音助手和搜索引擎,ChatGPT还有很多不能干或干不好的事情。ChatGPT的“认知”建立在虚拟训练文本上,没有跟实时的数据库或信息连接,仍有些“空中楼阁”的味道,所以特别适合插科打诨。

有用户总结,目前ChatGPT不能回答的话题包括:不能预测可能会但从未发生过的事件及其后果;不能OpenMind或打破常规建立新规则和新模式;不能深入问题的细节去回答而是停留概要层面;无法区分是否为事实问题,一些非事实问题无法得到回答;很偏门的问题(可能从未有人这么想过的问题)不会回答;不能列出非主流观点;对话语境不能跳跃太大,领域跨度太大等。

但专栏作家Parmy Olson却认为,相比谷歌搜索抓取数十亿个网页内容编制索引,然后按照最相关的答案对其进行排名,包含链接列表来让你点击。ChatGPT却直接基于它自己的搜索和信息综合的单一答案,回复流程更加简便。

针对外界认为ChatGPT能否取代搜索引擎的讨论,ChatGPT自己却给出了“否定”回答:ChatGPT并不是搜索引擎。它的目的不是提供信息搜索。相对于搜索引擎通过索引网页并匹配搜索词来提供信息,ChatGPT则是通过对自然语言问题的回答来帮助用户解决问题。因此,它们之间没有直接的竞争关系,并不能相互颠覆。

早前,OpenAI还发布了DALL·E 2——可以通过文本描述中生成图像的AI程序。国盛证券指出,相比于此前的AI绘画,ChatGPT更具有将AI能力与工作流程相结合的潜力,如果将ChatGPT与Midjourney等创作工具融合,有可能直接输出设计图稿等内容。而ChatGPT和DALL·E两个产品都是AIGC技术带来的新变革。

“我认为AI的潜力还可以进一步放大和挖掘。回看过去这十年,AI 技术的进步确实超出想象。10年前你可以看到图像、语音识别有突破,但肯定不会想到绘画、文章也可以通过 AI 生成逻辑性产品,这两者是不同的。这十年AI在不停的超越和突破很多人的预期和想象,这还是挺了不起的。”何晓冬对钛媒体App表示,这次ChatGPT最大的创新点在新的半监督学习算法,使得它对用户的意图理解,可能快达到大规模商用的搜索引擎水平。

何晓冬认为,相较于之前大量使用无监督深度学习算法,ChatGPT模型背后的算法和训练过程更加新颖。如果没有人的数据甄选,这个模型参数即便大十几倍,也很难达到这个效果。尤其ChatGPT把生成的文本模型更加“组织化”,这是非常大的技术创新。

“在某种意义上,这其实是对过去一味追求(参数)大和追求无监督学习的一个路线修正。”何晓冬表示。

OpenAI 于2021年底已经完成了2.5亿美元的A轮融资,投资人包括微软、马斯克、谷歌风投、老虎基金、A16z以及Altman前东家Y-Combinator等。据The Information报道,成立七年的OpenAI公司估值已经接近200亿美元,是其2022年预计收入的500-800倍。

在2020年 OpenAI发布GPT-3之后,微软于当年9月22日取得独家授权。报道指,OpenAI每年在微软云计算上花费约为7000万美元。

中国应该有自己的ChatGPT

事实上,尽管ChatGPT海外爆红、服务器被挤垮,百万网友使用,但不包括中国境内的实名用户。很多拥有国内+86电话用户无法使用ChatGPT。虽然有很多替代的网站或方案,或直接到非官方渠道购买 OpenAI网站账号,但仍引发很多用户抱怨,国内用户体验大打折扣。

“中国必须要有自己的基座大模型,应用大模型。很简单,OpenAI关键模型不开源,只给API,中国还不能随便用,已经是‘卡脖子’了,所以我们为什么不做这样的事情。”黄民烈对钛媒体App表示,包括百度、聆心等国内很多团队正在(对AIGC)做决心与相关资源投入解决相关问题。

告别硅谷崇拜,在中国互联网世界中,国内应该建立有中国创新特色的ChatGPT,甚至是超越OpenAI能力的中国AI公司。这已经成为中国 AI产业发展的必答题。

事实上,2022年也因此被称为“AIGC元年”,生成式AI发展迅速。今年9月一篇文章中提到,生成式AI可以处理的领域包括了知识工作和创造性工作,涉及数十亿的人工劳动力。生成式AI可以使这些人工的效率和创造力至少提高10%,有潜力产生数万亿美元的经济价值。

根据中关村大数据产业联盟发布的《中国AI数字商业展望2021-2025》报告预计,至2025年,中国AI数字商业核心支柱产业链规模将达到1853亿元,未来五年的复合增长率约为57.7%。国泰君安则预测,未来五年,或将有最多30%的图片内容由AI技术参与生成,相应有600亿以上的市场规模。

AIGC产业链(来源:行业报告)

在国内,AIGC概念企业正逐步成长,包括奇绩创坛、联想创投、华创资本、唯猎资本等机构都在观望或关注。今年12月,AI生成3D内容的数字品牌AVAR获得天使+轮融资,成立一年间已连续完成三轮;另一家跨越星空也在半年内连续完成两轮共数千万元融资。未来是否存在类似 AI绘画平台Stable Diffusion背后的Stability AI的独角兽公司,依然需要时间等待。

何晓冬表示,目前GPT(AIGC)创业价值有两点:一是如果从研究角度看,国内会继续往算法技术创新上探索;二是产业价值,特别在文本生成上有独到的体验和价值,本身已经接近可商用的地步了。未来可能需要考虑具体场景应用以及准确性等,尤其是垂直的专业知识。

“现在确实是AI应用发展的好时机,尤其是应用落地的时机。我对AI 比较乐观,而且我认为AI未来肯定要走产业路线。我越来越感觉到产业界应用机会比学术界更大。”何晓冬认为,AI技术慢慢地会从一个“作坊式”研究探索变成“工业级”工程或系统落地。目前,何晓冬团队正在对AI语音交互、多模态智能、数字人等诸多技术产品展开探索与研发落地。

对于有行业人士称,ChatGPT存在输出结果不稳定,商业落地并不容易,还需深耕,而且很难找到工业端应用范围,尤其它需要大量算力。

黄民烈向钛媒体App回应称,ChatGPT定位为通用任务型助理,作为工具,容易被很多人用到。当然这里面商业成本是必须要考虑的,但他认为未来一定是成本下行的趋势,一定会产生很多商业应用。可以参考现在很多文生图的公司和应用、感知和认知领域的AIGC等。“所以我绝对是积极乐观的。”

此外,AIGC带来的法律版权、种族和性别偏见、伦理等问题不可忽视。据Axios报道,Adobe正在考虑将AI生成的图片以付费形式售卖,消息一出引起广泛讨论。

大成律师事务所肖飒法律团队在公众号发文指出,一般情况下AI创作并不会发生侵权行为,但如果AI在创作某一幅具体的画作的过程中使用了过多某作品中的元素,或者是作为模板的作品本身属于侵权作品,那么该AI生成的画作就可能被认定为侵权作品,从而存在侵权的可能性。“必须明确的是,AI虽然能够学习,但本身并不懂法律,更不懂得侵权的概念,任凭其自由发展是完全不可取的。”

据财新,小冰公司CEO李笛表示,大家现在的热情很容易被点燃,是因为ChatGPT的对话质量超出预期,但真实商业化不像投资人想得那么简单,ChatGPT的工业应用还有很长的路要走。

(本文首发钛媒体App,作者|林志佳)

热点视频推荐

12月8日,国美零售发布公告称,目前已获得由黄光裕旗下全资公司提供的1.50亿港元贷款,这笔资金由集团公司控股股东黄光裕减持股票所得。公告称,贷款提供主体的公司由黄光裕全资拥有,贷款为免息及无抵押,初始期限为6个月,可由订约双方于届满前以书面形式延长。贷款所得款项将由集团用作一般营运资金。这笔资金将主要用来解决最近的员工工资问题。据国美内部人士估计,这笔资金至多支持全体员工一个月的工资发放。

点赞关注钛媒体视频号,观看更多精彩视

*温馨提示:喜欢钛媒体公众号的小伙伴注意啦!根据公众号推送新规,请将钛媒体设为“星标”,这样才能第一时间收到推送消息,已设置的小伙伴还需要重新设置“星标”哦

-----------华丽的分割线------------

下载钛媒体App,领先一步,更深一度。

下载【钛媒体App】,领先一步,更深一度。

万水千山总是情,点个在看行不行
","force_purephv":"0","gnid":"96b87ddcabc75620a","img_data":[{"flag":2,"img":[{"desc":"","height":"249","title":"","url":"https://p0.ssl.img.360kuai.com/t0133b52254f093b827.jpg","width":"1080"},{"desc":"","height":"675","title":"","url":"https://p0.ssl.img.360kuai.com/t016b1b9c5c2531d7d6.jpg","width":"1080"},{"desc":"","height":"240","title":"","url":"https://p0.ssl.img.360kuai.com/t011eefabeb3dcbb782.jpg","width":"240"},{"desc":"","height":"843","title":"","url":"https://p0.ssl.img.360kuai.com/t0105a697e15ecb906b.jpg","width":"1080"},{"desc":"","height":"264","title":"","url":"https://p0.ssl.img.360kuai.com/t0166948b9b1a0e0a8b.jpg","width":"1080"},{"desc":"","height":"838","title":"","url":"https://p0.ssl.img.360kuai.com/t010a803a47c454bd6d.jpg","width":"1080"},{"desc":"","height":"447","title":"","url":"https://p0.ssl.img.360kuai.com/t01865fe41143d2cdfe.jpg","width":"1080"},{"desc":"","height":"407","title":"","url":"https://p0.ssl.img.360kuai.com/t01e4234d7c1f3bfa79.jpg","width":"1080"},{"desc":"","height":"766","title":"","url":"https://p0.ssl.img.360kuai.com/t012c31988c79545b0a.jpg","width":"1080"},{"desc":"","height":"1868","title":"","url":"https://p0.ssl.img.360kuai.com/t01405271d3733dee48.jpg","width":"1080"}]}],"original":0,"pat":"art_src_1,fts0,sts0","powerby":"hbase","pub_time":1670579954000,"pure":"","rawurl":"http://zm.news.so.com/14e8909764c40c8651b69e440d39f7be","redirect":0,"rptid":"82d8039b54aadbbc","s":"t","src":"钛媒体APP","tag":[{"clk":"ktechnology_1:app","k":"app","u":""},{"clk":"ktechnology_1:搜索引擎","k":"搜索引擎","u":""},{"clk":"ktechnology_1:黄光裕","k":"黄光裕","u":""}],"title":"ChatGPT 会取代搜索引擎吗?|钛媒体深度

隆包狐1537深度搜是娱乐搜索吗?
隆侧俊13328551691 ______ 深度搜是最大的期刊搜索网站:收录4万种权威中英文学术期刊、6000万篇学术论文、各国专利、中英文百科知识.深度搜索,是网指络上不见人声的信息搜索变成是人找...

隆包狐1537搜图软件中搜索深度是什么意思? -
隆侧俊13328551691 ______ 搜图软件里面的.问题补充:搜索深度!11 深度搜索 深度搜索,是网指络上不见人声的信息搜索变成是人找人,人问人,人查人,人挖人的拷问,这种叫做,VpWBtC

隆包狐1537如何做到让网站被搜索引擎秒收录的 -
隆侧俊13328551691 ______ 引擎无法抓取,搜索引擎抓取网站的大小是有范围限制的.所以网站的URL链接深度是是搜索引 擎抓取网站的重中之重.所以让搜索引擎快速的收录你的网站.应该做到以下几点: 根据网站栏目的不同,对每个栏目页面设定标题和关键字 网站...

隆包狐1537网站建设有什么技巧?
隆侧俊13328551691 ______ 网站建设越来越火热,但是网站建设有什么技巧呢?老渔哥建站认为建站应该会的技巧:一、网站主题规划主题不可过于分散,网站主题越集中,一般情况下网站所有者在这方面投入的精力会更多,因此所提供信息的质量也会越高.二、丰富网...

隆包狐1537很多身边的朋友都在用深度搜,深度搜是做什么的啊?
隆侧俊13328551691 ______ 最大的期刊搜索网站:收录4万种权威中英文学术期刊、6000万篇学术论文、各国专利、中英文百科知识.

隆包狐1537怎么优化网站内链 -
隆侧俊13328551691 ______ 内链优化注意事项1、链接的相关性,不管是针对以上哪种形式的内链,链接的相关性都是必须的,不要为了单纯的实现所谓的内链,而毫无顾忌的增加内部链接.2、网站扁平化,网站的扁平化是通过内链实现的,比如文章中加入解释性的锚文...

隆包狐1537如何在深度官方网站下载 深度的系统? -
隆侧俊13328551691 ______ 深度官方论坛貌似没有,因为有版权压力 深度和雨林木风从08年底之后就不做XP系统了(之后出的是假的).深度的最后一个XP版本是V9.0二次修正(都是SP3的,分FAT32和NTFS分区格式,都不错),精简版的就是V6.2. 你可以百度一下“野猪尖”,这个博客左侧的公告里有《野猪尖博文推荐》,其中就有微软原版的XPSP3、《深度系统全系列MD5值及下载地址》以及《雨林木风最后4个系统的下载地址》. 另外,雨林木风发布了更新至2010年10月的最新补丁集,下载地址可搜索“照牛排”,这个是通用的,无论深度、雨林木风或微软原版的XPSP3都能用,无病毒和插件.

隆包狐1537什么是深度链接? -
隆侧俊13328551691 ______ 深度链接(Deep Linking),即绕过被链网站首页直接链接到分页的链接方式. 深度链接分类 一、外部深度链接,比如像常见的SEOer做外链的一种手段,通过去各大论坛发布软文带上所要推广站点的url地址,这种方式可以称之为外部深度链接.这种链接,普通浏览者很难找到,而对于搜索引擎来说是有机会被收录的,这种可以称之为单向的外部深度链接. 二、内部深度链接,这个可以很好的理解,相信不少网站站长也很熟悉,简称为“内链”,这种链接像百度百科经常会用到,某个词条在词条描述里会给另外所提到的一个词条再加上链接,是同一个站点的内部链接.

隆包狐1537如何得知一个网站的最大深度 -
隆侧俊13328551691 ______ 1.在搜索引擎上site网址,然后挨个查看URL,了解网站深度2.用网站地图在线制作器,制作一个网站地图,然后通过查看这个地图的源代码,了解每个URL的网站深度

隆包狐1537ie8打开网页有时快有时慢怎么回事
隆侧俊13328551691 ______ 你试试我说的打开网页慢的原因在于没有定期清除电脑内垃圾.1)系统临时文件——在Windows使用过程中,操作系统和应用程序产生的文件.有些文件在Windows或应用程序正常退出时将会自动删除.2)IE临时文件——您在使用浏览器时留下的缓存文件.3)无效快捷方式——用户在卸载程序后,程序的快捷没有被有删除,就这样产生快捷方式垃圾信息.4)其他系统垃圾——除了以上的系统垃圾外还有其他的垃圾,金山毒霸将会深度搜索并清理.1) 下载最新版金山毒霸20112) 打开金山毒霸2011→安全百宝箱→垃圾文件清理3) 通过提示来完成相关简单操作.希望能对你有用

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024