首页 >>  正文

python默认值参数

来源:baiyundou.net   日期:2024-09-23

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

2011 年,风险投资家、原 Netscape 创始人 Marc Andreesen 的一句「软件正在吞噬世界」,警醒众人。自此一切可编程的大门逐渐开启。然而在百花齐放软件驱动产品的背后,往往一个 Bug,极有可能瓦解所有。

近日,一位科技博主分享了一则早年间真实发生的一个 Bug 事件,因为一个“灾难性”的软件版本发布间接地导致了曾可以与 Reddit 匹敌的科技网站 Digg 分崩离析,最终让这家曾经估值高达 1.6 亿美元的公司被以 50 万美元价格收购。

作为亲身经历者,软件工程师 Will Larson 在 2018 年以《Digg's v4 launch: an optimism born of necessity.》一文,回顾了当初 Digg 公司的发展情况与个人参与的整个遭遇。万万没想到的是,经历了两年改版重写,再到耗时一个月的寻找 Bug,最终的问题竟是与 Python 的一个函数有关,然而彼时再想修复,似乎一切已为时已晚。借此,通过这篇文章也想给奋战在一线的开发者避一避坑。

背景

这家名为 Digg 的公司,成立于 2004 年,是一个以科技为主的新闻站点。与当时其他新闻网站有所不同的是,Digg 允许用户把自己搜集的新闻和其他互联网内容汇聚在一起进行提交,然后 Digg 通过内部算法机制将新闻抓取到网站的首页,用于展示。

来自维基百科

这样做有一个好处就是,Digg 将文章的筛选权利交给了用户,可以让他们自己筛选出最受关注和有价值的文章,然后通过订阅方式,订阅数量高的就会自动被推荐上首页,由此让更多的人看到。在时下这种新颖的做法,也让很多用户有了参与感,Digg 的规模也逐渐扩大。

当然,所有事情也有两面性,也所谓「树大招风」。

Will Larson 在 2018 年发布的博文里提到:“过去一年里,Digg 过得异常艰难。我们的 CEO 在我加入的前一天离开了;高级工程师们鬼使神差地离开了公司,并拉走了他们剩在公司的朋友们,降低了公司的生产力;具有欺诈性的团伙规避了我们的算法,利用投票与订阅的方式,出售我们网站头版的访问权,并威胁我们要及时修改算法以防止他们的滥用;我们的开发者环境配置工具坏了,没有人知道如何修复它们,所以我们给新员工重新分配了近期离职同事的僵尸虚拟机。”

要说一家发展前景良好的公司,为何会沦落如此,一方面,必然有其内部的战略问题,另一方面,也与外部的竞争环境有关。Will Larson 称,受到外部的影响因素之一便是与 2011 年 Google 推出了 Panda “反垃圾网站”算法有关。

那时,Google Panda 的主要目的是将质量低、含有垃圾内容的网页或网站排名降低,使得高质量的内容得到应有的合理排名。

虽然 Google Panda 算法本身是利好质量高的网站,但是 Will Larson 表示,“当时 Digg 已经被 Google Panda 算法更新破坏了。由于该搜索更新花了一个月的时间才慢慢生效,Digg 的命运就此也发生了巨大逆转:我们从第一个也是唯一一个盈利的月份开始下跌,一直跌到网站月流量被砍掉一半。前一个月,公司在五年的盈利道路上达到了顶峰,下一个月,公司处于自由落体状态,即将从弱势地位进行融资。”

为了重振旗鼓,也为了改变现状。Digg 决定对网站的 v3.5 进行重写,将发布 Digg v4 版本。

不过时间转瞬过去了两年,Digg 因重重变故,导致新版本一拖再拖。然而,Digg v4 版本是该公司回归互联网巨头竞争的战场中唯一的机会,如果错失,可能也就错过了整个时代。后来,经过公司内部的商议,他们决定将没有完全准备好的 Digg v4 紧急上线。

重写 Digg v4 的办公现场,来源 Will Larson 博客

殊不知,这一仓促的决定也注定了其仓促的收场结局。

Python 函数的默认参数的一次失败案例

慢慢地问题开始显现。

彼时的上午 10 点左右,有人问研发团队什么时候开始切换新版本,工程师回答称:"我们已经开始重新配置 V3 服务器了。" 不过,由于容量太小了,该团队决定重新映像所有现有的服务器,然后在新的软件栈中重新配置。

切换工作正式开启,不过一些奇怪的事情发生了。切换过程中,新的网站并没有真正地出现。运营团队匆匆忙忙地发布了一个维护页面,整个团队陷入了沉思。因为,他们并没有一个回滚计划。然后有一个工程师给出了或许是唯一可能的选择:继续向前切换。

他们也的确这么做了,一个小时后,当全部量切换完成,旧网站页面取而代之的是 Digg v4 版本,所有人员也长舒一口气。

不过刚高兴没多久,大家发现多数的页面呈现无法加载的状态。初期,该研发团队将问题定位为 Cassandra 集群,因此他们扩大了对 memcache 的使用,作为保护 Cassandra 的一个写通缓存。

几个小时之后,访客页面没有问题,但是已经登录的用户却仍然看到报错的页面,如 MyNews,该页面类似于“个人中心”,会呈现用户与每篇文章互动的记录以及个性化的新闻页面。无奈之下,研发团队将登录用户的默认页面改为 TopNews,这样使得用户登录之后可以使用网站。

次日,MyNews 已经彻底无法访问,网站每隔四个小时之后就会出现故障。除此之外,还有几十个小问题也在不断出现。

于是,他们再次做了一个大胆的决定——从头开始写 MyNews 页面。起初,该团队以为 Cassandra 的缓存击穿了 memcache,破坏了相关功能。后来他们用 Redis 重写了,并实施了一个分片的 Redis 集群,并成功将原来的迁移到新开发上。

遗憾的是,研发团队还是需要每隔四个小时就手动启动每个进程。

简单来看,相当于问题的根源还是没有找到,只是用了一种麻烦的替代方案来短暂支持。没想到的是,这个 Bug 耗费了该团队一个月的时间来追踪。

好在最终还是发现了问题的所在。Digg 的 API 服务器是一个 Python Tornado 服务,它将 API 调用到 Python 后端层,即 Bobtail(前端是 Bobcat),其中一个最经常被访问的端点是用来通过用户的名字或 ID 来检索用户。因为它支持按名字或 ID 检索,所以它把两个参数的默认值都设置为空列表。

def get_user_by_ids(ids=[])

然而,Python 只在函数第一次被评估时初始化默认参数,这意味着每次调用函数时都会使用同一个列表。

在这种情况下,每次调用时,用户的 ID 和名字都被附加到默认列表中。几个小时后,这些列表开始在每次请求中检索数以万计的用户,甚至压垮了 memcache 集群,导致了页面崩掉。

通过一个简单的例子可以直接看出:

def f(l=[]): l.append(1) print(l)

f()f()f()输出[1][1, 1][1, 1, 1]

最后

事情最后的结局是,Digg 团队修复了该漏洞,Digg v4 完全正常启动。而距离此事过去了一周后,Digg 迎来了最后一任 CEO;一个月后,Digg 开启第三轮裁员;一年后,Digg 公司被 Chartbeat 的母公司 Beatworks 以 50 万美金的价格收购。

谁曾想,Digg 也是互联网的宠儿,估值曾达到过 1.6 亿美元,登上过《商业周刊》的封面,Google 也曾计划以 2 亿美元将它收入囊中。殊不知,正是这一次的失败改版让 Digg 迅速损失了人气,以及内部一些管理问题,让竞品迅速超越。自此,一家创业明星公司就此陨落。

Will Larson 在文末写道,「Digg V4 有时会被作为灾难性发布的例子,隐含的教训是我们不应该发布它。我曾经一度同意这个观点,但现在我认为我们推出的决定是正确的。因为,我们的流量明显下降,每个月都在损失一大笔钱。如果我们能在推出伟大的东西和糟糕的东西之间做出选择,肯定会更倾向于推出伟大的东西,但我们却选择了最后一次挥棒。」

另外,他还表示,“即使是现在,我也不确定当初那样一个有才干的团队是如何进行这种愚蠢的展示的。”

归根结底,这是程序员一次技术失败导致的惨痛教训。也有不少网友评论道,「动态类型一时爽,代码重构火葬场」。

参考链接:

https://lethain.com/digg-v4/?continueFlag=0a23bc7c424c6abc75f97cbaaa2d55ff

https://weibo.com/u/1642628345

","force_purephv":"0","gnid":"9896b0dd46428cee9","img_data":[{"flag":2,"img":[{"desc":"","height":"80","s_url":"https://p0.ssl.img.360kuai.com/t0186957a1ca5352752_1.gif","title":"","url":"https://p0.ssl.img.360kuai.com/t0186957a1ca5352752.gif","width":"640"},{"desc":"","height":"601","title":"","url":"https://p0.ssl.img.360kuai.com/t017aad3338314bf54a.jpg","width":"1080"},{"desc":"","height":"207","title":"","url":"https://p0.ssl.img.360kuai.com/t01d9a27e300256e271.jpg","width":"320"},{"desc":"","height":"764","title":"","url":"https://p0.ssl.img.360kuai.com/t019b3088beb5c3e273.jpg","width":"1080"}]}],"original":0,"pat":"art_src_1,sexamb,fts0,sts0","powerby":"hbase","pub_time":1661936349000,"pure":"","rawurl":"http://zm.news.so.com/a2795439b5db7ce4ac039888f885a655","redirect":0,"rptid":"225f40d5ea539804","s":"t","src":"CSDN","tag":[],"title":"一个 Python Bug 干倒了估值 1.6 亿美元的公司

古友怖4796python怎么查看函数有什么参数 -
鲁阙米14720826183 ______ Python中查看函数参数有四种方式: 1. F(arg1,arg2,…) 这是最常见的定义方式,一个函数可以定义任意个参数,每个参数间用逗号分割,用这种方式定义的函数在调用的的时候也必须在函数名后的小括号里提供个数相等的值(实际参数),...

古友怖4796在python的函数中,如何将列表list的一部分作为函数的参数? -
鲁阙米14720826183 ______ 后面paraTestList(a[2:])中,括号里面的a[2:]命令是指创建了一个包含列表a的一部分的一个副本列表.具体做法是: def paraTestList(L): L[0]='z' a=['a','b','c','d'] b=a[2:] paraTestList(b) print(b) 具体情况如下: 1.Python的函数定义简单但灵活度大...

古友怖479610个错误和解决方法,你中招了吗 -
鲁阙米14720826183 ______ Python程序员最常犯的10个错误,你中招了吗?关于本文 刚接触这门语言的新手可能会对Python简洁灵活的语法有些不适应,或是低估了Python强大的性能.鉴于此,本文列出了Python开发人员常犯的10个小错误,资深程序猿也难免会中招哦...

古友怖4796python怎么查看函数参数? -
鲁阙米14720826183 ______ 在开发中我们可以借助于相关插件或使用Python内置函数"help()”来查看某个函数的参数说明,以查看内置函数sorted()为例:函数参数包括:必选参数、默认参数、可选参数、关键字参数.1、默认参数:放在必选参数之后,计算x平方的函...

古友怖4796python 中的range返回的是什么列表 -
鲁阙米14720826183 ______ # python # range(stop) 函数解析 # range(start, stop[, step]) # 参数说明如下: # 首先参数必须都是整数 # start :如果没有设置该参数,默认值为0. # stop : # step :如果没有设置该参数,默认值为1.step 一定不能为0. # 返回一个纯数字列表list...

古友怖4796Python 的函数是怎么传递参数的? -
鲁阙米14720826183 ______ 首先你要明白,Python的函数传递方式是赋值,而赋值是通过建立变量与对象的关联实现的.对于你的代码:执行 d = 2时,你在__main__里创建了d,并让它指向2这个整型对象.执行函数add(d)过程中:d被传递给add()函数后,在函数内部,...

古友怖4796python怎样接收参数 -
鲁阙米14720826183 ______ Python中函数参数的传递是通过“赋值”来传递的,函数参数的接收传递有四种形式: 1. F(arg1,arg2,...) 2. F(arg2=,arg3=...) 3. F(*arg1) 4. F(**arg1) 第1 种方式是最“传统”的方式:一个函数可以定义不限个数参数,参数(形式参数)...

古友怖4796python 初始化参数怎么设置 -
鲁阙米14720826183 ______ class A(object): def __init__(arg): self.arg = arg 在__init__中定义

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024