<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Know-Hao</title><link>https://d4xm6ha8xilrh.cloudfront.net/</link><description>Recent content on Know-Hao</description><generator>Hugo</generator><language>zh-Hans</language><lastBuildDate>Sat, 30 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://d4xm6ha8xilrh.cloudfront.net/index.xml" rel="self" type="application/rss+xml"/><item><title>十年磨了一堆剑：离开BCG前的自我盘点</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/bcg-graduation/</link><pubDate>Sat, 30 May 2026 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/bcg-graduation/</guid><description>&lt;p&gt;一眨眼竟然在BCG已经苟了十年了。当年面试的时候觉得BCG是响当当的招牌，自己算是初出江湖，抱着一种”过手如登山，一步一重天。我就是想见识一下高山“的心态。回过神来，已经在山里待了十年了。在离开这座山之前，打点一下行装，看看当年初出茅庐的自己，入了宝山是否空手而回，还是带走了些什么。&lt;/p&gt;
&lt;h2 id="见世面"&gt;见世面&lt;/h2&gt;
&lt;p&gt;在咨询公司工作最直接的收获之一，是确实接触了很多不同的行业，走南闯北去了不少地方，和不少人打过交道。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;沐浴过佛罗里达和洛杉矶的阳光，也经历过明尼苏达和加拿大New Brunswick的风雪。&lt;/li&gt;
&lt;li&gt;实地考察过：超市，轮胎仓库，高尔夫用品店，薯条加工厂，玻璃窗厂。&lt;/li&gt;
&lt;li&gt;作为洛杉矶的员工，在上海出差过9个月，在加拿大出差过1年半。&lt;/li&gt;
&lt;li&gt;做过项目的行业：养老金基金，石油能源，制药，食品，家具，百货商店，体育用品，连锁酒店，资产管理公司，主题乐园，科技，汽车，连锁超市。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;每个行业也不仅仅是瞥一眼而已。我本科学了数学，硕士学了运筹学（算是应用数学的一个分支），找工作的时候想的自然是要学以致用，在业界找到数学工具的应用价值。在前面提到的这些行业里，也确实亲身参与了用数理模型来解决实际问题的过程。比如在&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-04/" target="_blank"&gt;其它文章&lt;/a&gt;
里面已经提到过的：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;ul&gt;
&lt;li&gt;&lt;strong&gt;帮助服装百货公司如何打折进行定价&lt;/strong&gt;：百货公司在给打折商品定价时，既需要考虑利润率（避免江南皮革厂这种直接血亏倒闭），也要考虑出货速度（按照预计时间清空库存才能及时上新货）。我们先用一个机器学习模型预测需求弹性（即：价格每变动一块钱，需求会对应变化多少），然后再通过一个优化模型（MIP）找到不同商品在不同时间点的最佳折扣力度。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助酒店集团做需求预测和定价&lt;/strong&gt;：酒店的房间其实边际成本都一样，如何定价完全取决于需求而不是成本。因此，尽可能准确地预测房间需求量就有利于定价——如果知道一周后的那个周末会有很多人订房，开价就可以高一些，趁机赚一票。这里我们用机器学习模型（时间序列叠加XGBoost）基于历史数据和相关信息（比如是不是情人节要到了）对订房需求进行预测。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助制药公司优化供应网络&lt;/strong&gt;：一家大型药企在欧洲的供应链非常臃肿，在同一个地区可能有好几个仓库和配送中心。通过网络优化模型（network flow model），我们给这家公司提供了如何将40多个节点简化为10多个节点的方案。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助金融投资公司判断长期趋势&lt;/strong&gt;：投资界有个广受欢迎的理论是，一家公司的长期业绩表现应该符合均值回归，趋向于它同类公司的均值表现。基于这个理论，我们可以通过统计建模（采用基于条件概率的KDE），预测每家公司未来5-10年的长期表现趋势，帮助金融投资公司更好地规划长期投资组合。&lt;/li&gt;
&lt;/ul&gt;

 &lt;/blockquote&gt;

&lt;p&gt;这些项目中，有的是我还是初级员工时自己手搓的，有的是我成了经理之后带队完成的。这个角色转变的过程，也让我涨了很多见识。从一开始从零开始搭模型（以现在vibe coding的标准来看那个时候都算是古法编程了），到后来做经理设计架构、带团队、和各种客户撕逼，再到后来卖项目（本质上算是销售岗了），起草上百万美金的合同并看着它们被签署，这一路点了各种的技能树。&lt;/p&gt;
&lt;p&gt;现在回头看，当时入职前想要见见世面的想法，现在算是完全实现了，不管是行业见闻还是个人技能包。如果当时的我穿越到现在看到现在的我，应该会是心满意足的吧。&lt;/p&gt;
&lt;p&gt;不过当时的我年轻没见识，以为这些经历就是在一份工作中获得的全部收获（除了工资之外）。现在作为过来人，倒是觉得这些东西都还只是表象。在这即将要跑路的节骨眼，我也想掏掏心窝子，挖一挖这份工作给我带来的一些深层次的、或好或坏的改变。&lt;/p&gt;
&lt;h2 id="一些被腌入味的思维方式转变"&gt;一些被腌入味的思维方式转变&lt;/h2&gt;
&lt;p&gt;前面说到在很多不同行业都做了项目，那就有一个不可避免的问题：杂而不精。很多行业都是简单接触一点，干个几个月的项目，然后换个不同的行业做下一个项目。很多行业确实有共通之处，比如制药行业和食品行业的供应链其实很相似，很多问题的解决方法是通用的，但细究的话又有各自的独特之处。&lt;/p&gt;
&lt;p&gt;之前网上有段子说：“永远别和傻子争论。他们会把你拉到他们的水平，然后用经验打败你。”我感觉我在咨询公司就是反向操作：把问题拉到我们所知道的宽泛且通用的水平，然后再用共通的经验解决它。&lt;/p&gt;
&lt;p&gt;这也是为什么我文章的标题说是“十年磨了一堆剑”——别人是十年磨一剑，我则是磨了一堆，每把剑都有剑的样子，但跟人家真正十年磨出来的剑相比，又不太一样。两相权衡，也未必有什么绝对的更好或者更差，就只是，不太一样。&lt;/p&gt;
&lt;p&gt;我之前和一个做计算机安全的朋友聊天，他是PhD毕业，工作就是做这方面的研究。他说他在工作中想获得的终极成就在这世界上大概只有5个人能够读得懂。我发现我在咨询公司做的工作则是相反：我们需要尽可能让所有不同背景、不同级别的人，都能听懂我们提供的解决方案。用一个数学模型解决的问题，需要解释给CEO听，也要解释给车间生产线的员工听。&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;歪楼吐槽：不光是解释，而且是说服。要让对方觉得TA自己是聪明的，我们和TA差不多聪明（不管实际上TA比我们聪明很多还是笨很多），然后这个解决方法或者结论是在我们的辅助下TA自己领悟的。这个说服的手段本身也是一门手艺。说白了就是：用对方听得懂的话，证明我们做的是对的，但功劳是TA的，聪明人也是TA。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;这个通用性和咨询公司常用的一个理念是相符的：&lt;strong&gt;80/20&lt;/strong&gt;。我们经常会认为很多问题如果能被解决80%，就能够产生足够多的价值，剩下20%的长尾需要花不成比例的时间去完全解决，不值得。说白了就是抓大放小，先解决主要矛盾。而一般来说，这80%的问题都和其它领域有很多共通性——无非是人员结构冗余、数据采集过程有缺失、流程有漏洞之类的。更何况在这个学科高度多样化又高度交叉的当今世界，”在很多不同领域解决过相似问题“的履历本身也算是一种专业经验（expertise）了吧。&lt;/p&gt;
&lt;p&gt;除了80/20之外，这份工作其它让我“腌入味”的思维方式还有：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;结构化思维&lt;/strong&gt;：琢磨任何事情都要划分结构，罗列一二三点。要是结构不是MECE（mutually exclusive collectively exhaustive）就会很难受。写东西喜欢罗列bullet points——正如你现在看到的这样。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;事事有计划&lt;/strong&gt;：任何事情都要提前规划好，准备好应对各种幺蛾子，重要的事情都有plan B甚至plan C。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;后面这条估计是把我的J人属性又往上拱了一格。可能我原本是个七八成的J人，做完这份工作现在已经是九成九的J人了，甚至被有的朋友戏称为J王。&lt;/p&gt;
&lt;p&gt;还有一样——做咨询大部分时候是帮助企业做决策（decision making），尤其是在面对巨大不确定性的时候：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;美国和伊朗打仗了，我们作为一家石油公司现在应该做什么？如果现在增加产能，等油开采出来了，但不打仗了油价下跌了怎么办？&lt;/li&gt;
&lt;li&gt;政府给了我们一笔补贴，我们是拿这笔钱提供价格折扣，还是改良设备和供应链呢？&lt;/li&gt;
&lt;li&gt;各国生育率都在下降，我们作为一家奶粉公司应该趁早改行，还是继续梭哈，挤走竞争者独占市场？&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;在每天的工作中面对这样的问题，也就逐渐对于“&lt;strong&gt;在不确定的时候做决策&lt;/strong&gt;”这个事情脱敏了。在生活中碰到“要不要买房”、“要不要换工作”这样的决定的时候，也不至于头大如斗。这里我说的是“更习惯”，而不是“更擅长”——并不见得我做的决定质量更高了，只是更习惯于去面对这些问题罢了。用到的手段也无非是前面提到的这些东西：用结构化思维拆解问题，抓大放小80/20，事事提前做计划规划各种可能的路径。&lt;/p&gt;
&lt;h2 id="为什么跑路了"&gt;为什么跑路了&lt;/h2&gt;
&lt;p&gt;前面说了这么多，读起来大部分还算是给BCG说的好话，虽然其实我觉得思维方式的这些转变大部分是中性的，说不上好坏。但总有朋友会有疑问：既然BCG听起来还挺好的，你为啥要跑路了？&lt;/p&gt;
&lt;p&gt;坦白讲最大的理由就是太累了，工作和生活之间失衡了——就是我们大家常说的没有work-life balance。这里也不仅仅是工作时间长和到处出差。要操心的事情很多很杂，平时的闲暇时间很难真正和工作切割开。从精神上来说，没有足够时间读书和思考，大部分时间只顾着埋头做事；从身体上来说，饮食、睡眠 、运动各个维度都处于亚健康层面，2025年又敲了一个不能更明显的&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/chemo/" target="_blank"&gt;警钟&lt;/a&gt;
。所以也是该跑路的时候了。&lt;/p&gt;
&lt;p&gt;说到底，在BCG的工作是在&lt;strong&gt;以高强度换取高成长&lt;/strong&gt;（以及高福利）：在几周的时间内快速了解一家公司面临的问题，然后构建出解决方案并实施见效。这个过程强度很高，但成长也快。能顶住这个强度并且想继续“磨一堆剑”的人都不妨继续待着。顶不住这个强度的，亦或是不想这么磨剑的，不妨去别的行业。&lt;/p&gt;
&lt;p&gt;从某种程度上说，我觉得在BCG的工作挺容易让人上头的：扔给你一个复杂的问题，解决它有可能创造几百万的价值，几乎没有资源限制（token随便用、服务器随便开），你不需要操心其它任何生活的琐事（出差的食宿酒店全报销），只需要专注地解决眼前这个问题，你还有一群同样天资卓绝、名校毕业的同事和你一起共同奋战，唯一的限制就是时间有限，几周甚至几天之内就需要立竿见影。这种环境是很容易给人打足鸡血的——给你最好的装备、最强的队友、最贵的副本，然后告诉你三天后交boss首级。&lt;/p&gt;
&lt;p&gt;在很长一段时间里，甚至可以说即便到了现在，我也还是挺享受这种上头感的。在我看来这也是咨询这个行业的魅力之一。我们公司有一个Flex Capacity Program，大致意思是可以自愿降薪降工时，比如拿80%的薪水干80%的活。这样强度不就降下来了么？可在我看来，采用这个机制的话，前面说的这个高强度换高成长的交易就不成立了，也就失去了在这个行业待着的一个重要理由。所以我自己宁愿直接跑路，也不想靠这种方式继续在BCG苟着。&lt;/p&gt;
&lt;h2 id="江湖再见"&gt;江湖再见&lt;/h2&gt;
&lt;p&gt;至于跑路去哪里，以后有机会再另写博客展开说。我盲猜一波：这些咨询工作给我带来的经验和思维方式在很长的时间里继续会影响着我的行为处事。出来混江湖，这十年磨的这堆剑总归还是先带在身上——就算用不上，背着也挺帅的吧。&lt;/p&gt;</description></item><item><title>世界以痛吻你，你扇它巴掌啊：记录我治疗结肠癌的2025年</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/chemo/</link><pubDate>Thu, 30 Oct 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/chemo/</guid><description>&lt;p&gt;2025年初，我开始有些便血的症状。倒也没有什么痛感，也没有什么不舒服的地方，所以也没有太当回事。但还是约了肠胃科的医生。&lt;/p&gt;
&lt;p&gt;2月底见到肠胃科医生，他说：你这症状是教科书般的痔疮啊（事后回想：大哥你这本教科书怕是盗版的吧）。何况你年纪还轻没到50岁，家里又没有病史，不像是什么严重的情况。但是，鉴于是便血，我们保险起见还是做个肠镜。&lt;/p&gt;
&lt;p&gt;于是3月份，我来到医院做了个全麻的肠镜。做肠镜的过程见&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/colonoscopy-experience/" target="_blank"&gt;这篇文章&lt;/a&gt;
。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/chemo/before-colonoscopy-masked.png" alt="做肠镜前的我" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;做肠镜前的我&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;从全麻的沉睡中醒来，&lt;strong&gt;我仿佛来到了一个不同的世界，一个我从来没想象过、到现在还没完全接受的世界。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;醒来的时候，周围站了好几个医生，除了我的肠胃科医生之外还有好几个人。我头脑还没完全清醒过来，他们就给我说了一大堆情况，现在想来大概就是肠道里发现了肿瘤，怀疑很有可能是恶性，需要尽快做手术切除，这就安排你住院，最快今晚就动手术。&lt;/p&gt;
&lt;p&gt;于是我晕晕乎乎地给家人和同事发了消息打了电话。然后就被医院的人推着走——验了血，也做了CT，都是为了先看一下我的情况发展到什么程度了。然后把我送到了病房。晚上主刀医生过来见了我，告诉了我三个消息：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;以她的经验，我这个情况基本是结肠癌&lt;/strong&gt;。但一般都是可以治疗的，痊愈率挺高。&lt;/li&gt;
&lt;li&gt;CT没有发现扩散，所以应该不是四期（即最晚期），如果是癌症的话就应该是前三期。如果不是癌症的话，手术切除之后就完事了；不然的话根据严重程度可能还需要术后做化疗。而确切的诊断，需要做手术的时候拿了切片做了大病理报告才能知道。&lt;/li&gt;
&lt;li&gt;当天是来不及做手术了，手术应该会被安排在两天后。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;于是我又告知了一圈家人朋友同事。此时我竟然还算心态稳定，也可能是没有完全消化这个消息吧，觉得那就先开刀，然后见招拆招再说。毕竟要确诊到底是什么情况需要大病理报告出来之后才能知道。大概，我那时内心深处还是抱着一丝侥幸心理吧。&lt;/p&gt;
&lt;p&gt;两天后的清晨，我被推进了手术室，做腹腔镜手术。&lt;/p&gt;
&lt;p&gt;在进手术室之前我签了些文件，护士也按惯例说了一下手术基本流程和可能出现的情况。比如，我这个是腹腔镜手术，常规操作是在腹部开几道小口，在机器的辅助下摘除肿瘤。但如果情况不好，也有可能把伤口开得更大，甚至有可能还给我接一根导尿管。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;所以躺在手术台上，在被麻醉的前一刻，我内心慌得一匹&lt;/strong&gt;，因为不知道醒来会是什么样的世界：我伤口会是怎样，会不会醒来之后痛得死去活来，会不会带着一根导尿管。甚至，我会不会再也醒不过来？&lt;/p&gt;
&lt;p&gt;好在医院的麻药挺给力的，我还没怎么panic，就已经被麻得不省人事了。醒来的时候已经回到了自己的病房，护士跟我说手术进行得很顺利，摘除了肿瘤，和预期的一样，没有开大口也没有接导尿管。&lt;/p&gt;
&lt;p&gt;我术后恢复得挺快，第二天排气，第三天排便，于是第三天中午我便出院了，看来医院也是迫不及待要“翻台”的样子。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;出院两天后，大病理报告出来了。如医生预测的那样，果不其然是结肠癌。更具体的说，是&lt;strong&gt;乙状结肠癌3期&lt;/strong&gt;，扩散到了4个淋巴结，按照TNM分期系统的话是T3N2M0。&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;背景知识：结肠癌分期通常分为 0至4期，数字越大表示癌症扩散越严重。﻿&lt;/p&gt;
&lt;p&gt;0期（原位癌）：癌细胞仅限于肠壁的最内层。﻿&lt;/p&gt;
&lt;p&gt;I期：癌细胞侵入肠壁的肌肉层，但未扩散到淋巴结或远处器官。﻿&lt;/p&gt;
&lt;p&gt;II期：癌细胞侵入肠壁外层，可能穿过浆膜，但尚未扩散到淋巴结。﻿&lt;/p&gt;
&lt;p&gt;III期：癌细胞已扩散到附近的淋巴结。﻿&lt;/p&gt;
&lt;p&gt;IV期：癌细胞已转移到身体的其他远处器官，如肝脏或肺部。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;得知消息的这天，&lt;strong&gt;我的心态是崩溃的&lt;/strong&gt;。即便是之前医生已经给我设立了很现实的预期，真正看到病理报告的时候我内心最后一丝的侥幸心理最终还是被击得粉碎。而查询结肠癌3期的资料，现代医学固然有对症下药的治疗手段，但生存率也远非100%——&lt;strong&gt;五年存活率只有60-70%！&lt;/strong&gt; 也就是，30多岁的我，突然被告知：你有三成的概率活不过五年。&lt;/p&gt;
&lt;p&gt;我和老婆说了这件事，她也很崩溃，但同时还是很有效地抚慰了我的情绪。说来也是阴差阳错，她“骗”我说60-70%是无病生存率（意味着不但生存而且还没有复发），不是真实生存率（意味着只要活下来就行），真实生存率其实要更高。我当时也没核实，就迫不及待地相信了她所说的。后来过了挺长时间之后，我才发现60-70%确实是真实生存率，而我老婆其实当时也是理解错了。但这个误解，反而在那个最崩溃的时刻，让我俩都冷静下来，重新整理了心理防线，积极地面对接下来的治疗。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;这里我们先暂停一下时间线，展开说一说我&lt;strong&gt;为什么会30多岁就得了癌症&lt;/strong&gt;。为此我也研究了很久，和好几个不同的医生都讨论过。&lt;/p&gt;
&lt;p&gt;先说一下我的基础情况：30多岁男性上班族，平时一直有运动习惯（打网球+举铁）。家里没有肠胃癌症的病史。平时工作算是比较辛苦，经常出差和加班，压力挺大，另外虽然我平时也算是注重饮食结构平衡（每顿都吃蔬菜+蛋白质+碳水），但是以中国人的标准来看，我平时红肉吃得比较多（但大概还是比不上美国人或者蒙古人）。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/chemo/spartan.jpg" alt="2024年还在参加Spartan障碍赛的我" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;2024年还在参加Spartan障碍赛的我&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;如果说是工作压力和饮食习惯直接导致的癌症，我觉得是不够全面的——比我工作忙、饮食结构更差的人多了去了，我认识的同事中就有不少，他们都还好好的。诊断之后我也做了基因测试，既没有发现先天遗传的基因缺陷，也没有后天突变的基因缺陷。我所见过的所有医生也没有办法给我提供一个明确的因果论断。只能说，基于时间线的推断和对于癌症机制的了解，我觉得最有可能发生的情况是：&lt;/p&gt;
&lt;p&gt;2021年底我打了新冠的疫苗加强针之后，出现过一段时间&lt;strong&gt;免疫力极弱的时间段&lt;/strong&gt;，那个时候肠胃也不好，再加上长期的&lt;strong&gt;工作压力和饮食结构&lt;/strong&gt;，导致肠道里原本轻微的炎症异变成了恶性肿瘤。&lt;/p&gt;
&lt;p&gt;具体来说，我2021年打完疫苗加强针之后做体检时，发现白细胞数量非常低，低到我的家庭医生觉得有问题，让我找了专科医生，又抽了8管血做了专门的检查。当时没有发现其它异常情况，过了一段时间之后白细胞数量也逐渐回升了，所以就归结为了疫苗加强针造成的短期副作用。从后来肿瘤发展的时间线来看，很有可能就是最早在这个时间节点发生的异变。&lt;/p&gt;
&lt;p&gt;这里我想多说一句：&lt;strong&gt;如果你身边有人得了癌症，希望你不要过多地归咎于他/她本人&lt;/strong&gt;。大部分时候，&lt;strong&gt;癌症是由不可控的基因或者异变导致的&lt;/strong&gt;，说白了就是&lt;strong&gt;运气不好&lt;/strong&gt;。当然，健康的生活作息习惯可以极大地避免这种情况的发生，我们也应该尽可能地去做到，给身体创造良好的环境。但是，这只能说是我们尽可能控制&lt;strong&gt;次要因素&lt;/strong&gt;。世界上也依然有非常多经常抽烟却没有得肺癌的人，以及很多一口烟没抽过却得了肺癌的人。真正的&lt;strong&gt;主要因素&lt;/strong&gt;——基因或者单次的突变——都是我们&lt;strong&gt;无法控制的&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;简单地归咎于患者：“你就是因为平时xxx所以才得了癌症”，这样的说法既没有足够的科学依据，也只会给患者心里添堵，没有任何积极的作用。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;回到我自己的治疗时间线。在得知病理报告的两天后，我找到了我所在城市最好的肿瘤医院，和肿瘤化疗的医生讨论了治疗方案。依照官方指南，我们制定了为期六个月的化疗计划。&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;背景知识：大部分的肿瘤治疗方案都能找到由官方发布的治疗指南。在国内，这是由卫健委牵头撰写和修订的；在美国，这是由National Cancer Institute等多家权威机构发布的。我在网上常看到有人会问：“我是xx癌症2期，要不要做化疗？”一般来说，这些情况都能在官方指南里面找到标准的治疗方案。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;我的化疗方案由8个周期构成，每个周期为期3周，加在一起24周也就是6个月。在每个周期里，第一天去医院注射药物奥沙利铂，另外前14天每天口服另一种药物卡培他滨，剩下的7天停药让身体康复，如此循环往复8次。&lt;/p&gt;
&lt;p&gt;说到化疗，大家的第一反应大概都是：这很伤身体吧。确实，&lt;strong&gt;化疗的医理其实是遏制一切快速成长的细胞&lt;/strong&gt;。虽然我们的目标是杀死癌细胞，但是目前没有任何化疗药物可以精准地只消灭癌细胞。现代医学能做到的就是把一切快速成长的细胞全都遏制住，其中就包括癌细胞。这样，在遏制足够长的一段时间之后，希望癌细胞就被“饿死”了。&lt;/p&gt;
&lt;p&gt;但这样做的代价就是其它快速成长的细胞也被遏制了，这也是为什么化疗会“很伤身体”的主要原因。比如常见的骨髓抑制：骨髓造血功能作为快速迭代的身体功能，容易受到化疗药物抑制，导致红细胞、白细胞和血小板生成减少。整体的免疫力都下降了。&lt;/p&gt;
&lt;p&gt;还有一个常见的广为人知的副作用就是掉头发了。毛囊细胞也是快速生长的细胞之一，容易被放化疗药物抑制，于是便导致很多放化疗的患者有了脱发的症状。一般都是可逆的，治疗完成之后会慢慢长回来。所幸的是，我使用的药物对于毛囊细胞没有太强的抑制作用，整个化疗过程中没有怎么掉头发，让我的发际线再次逃过一劫（上次我的发际线“死里逃生”还是我准备读PhD但是中途辍学的时候）。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;化疗的六个月过程没有什么好多说的。基本的流程都是：周期的&lt;strong&gt;第一天&lt;/strong&gt;去做注射然后&lt;strong&gt;浑身不舒坦五六天&lt;/strong&gt;，慢慢恢复，到停药时感觉精神焕发，&lt;strong&gt;蹦跶一个星期左右&lt;/strong&gt;，然后进入下一个周期再来一遍。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/chemo/infusion.jpg" alt="在做注射的我" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;在做注射的我&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;</description></item><item><title>北美普通打工人理财碎碎念</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/portfolio-management/</link><pubDate>Sun, 07 Sep 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/portfolio-management/</guid><description>&lt;p&gt;在美国和加拿大当了很多年的打工人，一直都在学习怎么理财。在这里分享一下自己摸索的思路，也想和大家互相交流。哪位如果发家致富了，也希望苟富贵莫相忘[抱拳]。&lt;/p&gt;
&lt;h2 id="丑话aka-disclaimer说在前面"&gt;丑话（aka Disclaimer）说在前面&lt;/h2&gt;
&lt;p&gt;首先声明，这篇文章探讨的理财思路不是冲着财务自由去的。如果你在寻找类似“all in比特币，x个月后财务自由”的想法，可以直接退出本文了。&lt;/p&gt;
&lt;p&gt;这篇文章主要想和大家分享的是&lt;strong&gt;普通人的理财思路&lt;/strong&gt;，是“&lt;strong&gt;我如何合理地配置已有的资产，尽可能保值，最好能增值&lt;/strong&gt;”，而不是“投资什么能暴富”。&lt;/p&gt;
&lt;p&gt;我不是金融理财的业内人士，在工作中偶尔接触过一些金融行业的公司，有过一些非常浅显的了解。这里所有讲的内容全是自己摸索得来，就只是分享一下个人的思路。当然也随时欢迎专业人士的指导。&lt;/p&gt;
&lt;p&gt;这里也假设大家也都是普通人——不是金融专业人士也不是家产过亿的富豪，这两类人（尤其后者）有更多我们普通人接触不到的投资渠道，那这篇文章对您的参考价值应该不大。这里所有讲的投资选择都是大家普通人可以接触到的。&lt;/p&gt;
&lt;p&gt;最后，很显然，&lt;strong&gt;本文不是任何形式的投资建议。投资需谨慎&lt;/strong&gt;，切忌听风就是雨。&lt;/p&gt;
&lt;h2 id="资金配置也有鄙视链"&gt;资金配置也有“鄙视链”&lt;/h2&gt;
&lt;p&gt;首先，我假设大家的主要财务模式都是“&lt;strong&gt;收入以工资为主，也开始逐渐有些理财的收入，除去日常开销之后还有些盈余&lt;/strong&gt;”。如果已经是自己经营企业的老板，您的投资决策要比普通人复杂得多（比如资金留在公司继续投资还是发给自己），这篇文章不讨论这些。如果是拿着工资过日子但已经入不敷出，应该也没有什么心思搞理财。&lt;/p&gt;
&lt;p&gt;所以基于这个前提，我们主要的任务就是配置盈余的资金——日积月累下来，在能保值的前提下，希望还有些额外的增值。这里我首先想提出一个理念：&lt;strong&gt;资金有不同的配置顺序优先级&lt;/strong&gt;。第一个1000块和第十个1000块的配置方式很可能是不一样的。我经常看到大家讨论一系列类似的问题：“我手上有xx万该怎么投资”。在我看来，这个问题首先要取决于这是第几个xx万。&lt;/p&gt;
&lt;p&gt;以下是我自己按照优先级配置流动资金的思路：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;日常流动资金&lt;/strong&gt;：3倍每月平均家庭开销
&lt;ul&gt;
&lt;li&gt;这部分钱用来日常开销的周转，包括房租/房贷，买菜做饭，水电煤网，日常消费等等。存在借记卡里随时取用，不在意它的收益率。&lt;/li&gt;
&lt;li&gt;这里“3倍”这个比率是个人偏好，你完全可以采用自己觉得舒服的比率。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;应急款&lt;/strong&gt;：约6个月的家庭开销
&lt;ul&gt;
&lt;li&gt;这部分钱是备用的资金，应付潜在的意外事件——比如自己或者伴侣要跳槽、或者有一大笔意外支出（比如医疗费用）等等。预留了这笔钱之后，后面资金的处理就可以没有什么后顾之忧。&lt;/li&gt;
&lt;li&gt;这部分钱其实正常情况下用不到，但又不可以没有，并且还要确保流动性，要用的时候能马上调来用。所以，这部分钱可以用来赚开户bonus，在不同的银行间周转，每次开户有个几百刀的bonus，也算是没让这笔钱闲着，具体可以参考Doctor of Credit。我自己做过这个事情，是可行的，但我最后放弃了，因为比较费时间精力，而且报税的时候还要确保没有遗漏。大家可以自行决定是否花这个精力。&lt;/li&gt;
&lt;li&gt;图省事的话，放在high yield savings account或者券商的货币基金（money market fund）就行。加拿大的话可以考虑cashable的GIC。&lt;/li&gt;
&lt;li&gt;同样的，“6倍/6个月”这个比率完全可以因人而异，你自己选择就好。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;养老金&lt;/strong&gt;（401K / RRSP）：每年最多~$20k
&lt;ul&gt;
&lt;li&gt;这个应该是比较常见的理财建议了吧：“养老金拉满”。理由是养老金的收益通常是免税或者远低于你现在税率的（假设你按照正常时间提取）。而且很多公司采用matching的机制，相当于（在一定范围内）养老金买一送一了。&lt;/li&gt;
&lt;li&gt;这笔钱买什么资产取决于你的个人风险偏好了。图省事的话，大部分养老金机构都有target retirement fund，可以根据你设定的退休时间（比如2060年），动态调整风险配置——早期会配置更多高风险资产比如股票，后期更接近退休时间的时候，会配置更多低风险资产比如债券。你如果想更激进一点，可以选一个目标时间更远的fund，或者干脆自己配置也行。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Roth IRA&lt;/strong&gt; (Back door)：每年最多~$7k【仅适用于美国】
&lt;ul&gt;
&lt;li&gt;除了401k之外，美国的打工人每年还可以多投约$7k到Roth IRA，算是额外的一笔养老金吧。理论上，收入高于一定数量就会逐步失去资格（2024年家庭收入$240k以上）；但在实践中，有个众所周知的后门就是先contribute to non-deductible Traditional IRA然后convert to Roth IRA，这个方法也就是大家常说的“back door Roth IRA”。&lt;/li&gt;
&lt;li&gt;理论上，加拿大的税务居民也可以搞Roth IRA，但是和美国国债相似，加拿大税务局不认为Roth IRA的收益是免税的，因此其收益需要每年报税，所以在实践中不值得。因此这个选项仅适用于美国税务居民。&lt;/li&gt;
&lt;li&gt;另外还有一个高阶版的mega back door IRA，每年最多~$70k，根据个人情况不同可能会不一样（比如需要雇主的计划允许）。这个操作起来有点复杂，这里就不展开讲了，感兴趣的朋友可以自己研究一下。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;TFSA&lt;/strong&gt;：每年最多~$7k【仅适用于加拿大】
&lt;ul&gt;
&lt;li&gt;虽然没有Roth IRA，但加拿大的朋友可以投资TFSA，从数额上和性质上都和Roth IRA挺接近的。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;美国抗通胀债券（Series I savings bond）&lt;/strong&gt;：每人每年最多~$10k【仅适用于美国】
&lt;ul&gt;
&lt;li&gt;这个是美国财务部发布的债券，I是指inflation-protected，对标通胀率。可以在TreasuryDirect购买。I Bond 的利率由固定利率和通胀调整利率组成。固定利率在购买时锁定，通胀调整利率每6个月会更新。&lt;/li&gt;
&lt;li&gt;在这个位置配置它的逻辑是：这个债券收益的税率也是根据你套现那年的边际利率计算，而不像银行利息这种是当年就要报税的。换言之它和养老金相似，算是tax-deferred的收益。并且它很安全，没有违约的可能。&lt;/li&gt;
&lt;li&gt;其它的美国国债（treasury notes/bills）没有每人每年的购买上限，但也就不是tax-deferred的了。&lt;/li&gt;
&lt;li&gt;美国国债只有“US person”可以购买（包括公民、永居居民、税务居民）。境外没有这些相关美国身份的话不能购买。另外，加拿大税务局不认为美国国债收益是免税的，所以每年的收益也要缴税（而不是延迟到取出的那年）。所以在实践操作上，这个选项仅适用于US person。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;HSA/FSA/HCSA/PHSP&lt;/strong&gt;：每年最多~$4k
&lt;ul&gt;
&lt;li&gt;存一部分税前的钱来支付医疗开销。这里我自己并没有存满，用FSA的话，每年用不完的钱不能roll over到下一年，所以没有存很多。这个也因人而异——如果你年轻力壮一年去不了几次医院，也没必要在这里放太多钱。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;（额外）还贷&lt;/strong&gt;：每月根据当月支出情况，多还一些房贷（及车贷）本金
&lt;ul&gt;
&lt;li&gt;这里的周转余地比较大，有的时候多还一点，有的时候少一点。如果有预期的近期支出（比如过几个月要出去玩），可以最近几个月多存一点现金，少还一些额外本金。&lt;/li&gt;
&lt;li&gt;这里显然也要考虑房贷利率和投资收益率的对比关系。如果你的房贷利率远低于市场利率，那你等同于是用更低的成本持有这笔资金，那就不急着提前还贷。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;剩下的钱用于股票和理财产品投资&lt;/strong&gt;
&lt;ul&gt;
&lt;li&gt;我自己目前大概是60%大盘股指，35%中短期债券，5%专题类投资和防御性资产（详情见下个章节）。&lt;/li&gt;
&lt;li&gt;各类资产的分配比例会根据市场情况和年龄变化经常调整。&lt;/li&gt;
&lt;li&gt;多嘴一句，操作这些的时候也要考虑到对应的资本利得税。操作得越频繁，越有可能要缴纳更多的short-term capital gains tax，那就意味着需要更高的投资收益来实现同样的净收益。如果你觉得没把握的话，可以考虑更多长线持仓。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;你不必同意我的这个排序，我这里主要就是分享一下这个“按照优先级来配置不同资金”的思路，你可以定义适用于自己情况的顺序和配置方式。很多人总体的理财焦虑是觉得自己“投资不够 aggressive”，浪费了机会。但实际上，&lt;strong&gt;先把流动性和安全性处理好，然后再慢慢靠长期复利收益才是关键&lt;/strong&gt;。&lt;/p&gt;</description></item><item><title>Billions S1-S2观后感（含剧透）</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/billions-review/</link><pubDate>Mon, 25 Aug 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/billions-review/</guid><description>&lt;p&gt;&lt;em&gt;以下内容包含大量剧透，慎入。&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;以下评论主要基于前两季的剧情。从第三季开始剧情开始转向，在我看来有一些逻辑是开始崩塌的，到后面第四季及之后就更加走远了。我个人认为这整部剧的前两季是巅峰（网上也看到过不少类似的观点，不过也有不少人认为第三季最佳）。因此这里就只评价前两季，有些地方稍微提到一些第三季的内容。&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;非常高质量的金融律政剧。整体节奏非常紧凑，剧情推进得很快高潮迭起。双男主非常有火花，斗智斗勇各出奇谋，每次单独对线的时候都张力拉满。&lt;/p&gt;
&lt;p&gt;双方都不是绝对意义的好人或者坏人，都既有光明面又有黑暗面，有理性也有情感。联邦检察官Rhoades的立场是“你既然搞违法幕后交易，我就一定要伸张正义将你绳之以法”；但同时，他所采取的手段也似乎凌驾于法律之上。另一边，对冲基金大佬Axelrod的立场是“业内所有人都这么做，我只是比其他人做得更好而已，我什么都没做错，要说社会影响我捐款无数。谁来搞我，我就动用我的资源把他干掉”；但同时，他也毋庸置疑地做了很多显然违法的勾当。所以很难用黑白分明的尺子来衡量任何一方。&lt;/p&gt;
&lt;p&gt;两个旗鼓相当的大佬干仗，双方都投入了海量的资源，也付出了巨大代价——破碎的家庭、友谊、同僚等等。这些代价使得这个对抗很有真实感，很有份量，而不是双方互怼了半天却一点牺牲都没有。代价越大，两人的仇怨也就越深，就越能理解到后面不惜砸下血本也要拉对方下水的设定，能理解“搞到妻离子散也要和对方成为狱友”（引自豆瓣短评）的这种羁绊。推荐给喜欢这类CP的朋友，很好磕。&lt;/p&gt;
&lt;p&gt;第二季末尾的Ice Juice案铺垫得很好，S2E11的叙事手法也很惊艳，在所有美剧里面应该也是能排得上号的高质量制作。就我个人观感来看，我对所谓的神转折并不感到惊讶，甚至我从一开始就坚信这是个圈套。原因是，Rhoades最初下定决心启动Ice Juice行动的时间点，是刚刚被Axelrod摆了一道：在S2E09里得知丘吉尔原版书被Axelrod抢购，大发雷霆，转身看到了Ice Juice的提案，于是开始采取行动。从行为逻辑看，显然不是“Axelrod刚才针对我坑了一波，让我去赚点钱平衡一下心态”，而肯定是“来来来，我要跟你鱼死网破”，这样才合理。后面官方回顾的铺垫（比如语言上的闪烁）都是次要的，底层的行为逻辑都已经设定好了。这也是为什么这个神转折非常高质量的原因，障眼法拉满，但结果揭开的时候却也完全合情合理。&lt;/p&gt;
&lt;p&gt;说一下对剧中其他人物的观感：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Wendy Rhoades&lt;/strong&gt;: 这个人物很复杂。身为一个洞悉人性的顶级心理咨询师，却有着自己的纠结和迷茫。和两个男主都有独特的、深刻的连结，我个人认为这两段关系都刻画得很好。这也使得她的纠结和拧巴让我觉得信服，能够感同身受。我看到很多网评都不喜欢这个人物，觉得她双标或者人设不一致之类的。我倒不这么看，至少这个人物的故事可以说服我：她自己也很迷茫，不知道该应对这些突如其来的改变，因此很多行为会看起来（甚至实际上）很双标。唯一让我觉得略微值得诟病的地方是，她的这个人物设定实在是太过于容易引发冲突了（丈夫是Rhoades，老板和挚友是Axelrod），以至于像是个提前摆放好的剧情冲突触发器，需要的时候按一下按钮就可以了（比如泄露Dantzig持枪案）。我个人觉得第一季的核心冲突过多于依赖Wendy Rhoades这个人物，而不是由情节去自然而然地推动。到了第二季这一点就改善了，大部分的冲突不是直接来自于Wendy。除了这个小小的瑕疵之外，这个人物还是非常丰富的。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Lara Axelrod&lt;/strong&gt;: 这个人物是我认为构建得比较不好的。她本质上是个很自私的人，这人设本身没问题，但很难让人相信Bobby Axelrod这么犀利的人（以及他身边的圈子比如Bach和Wags）看不到这一点，但Bobby却还无脑爱她，这个设定就难以令我这个观众信服。说她自私是因为，她从一开始就摆明了一副“我只在意这个家（尤其是两个孩子）”的态度，还非常翼护自己这边的家人，可是对Bobby Axelrod看不出多少在意。到Sandicot案时，她立场鲜明地主张清算Sandicot镇，“我们穷困的时候可没人管我们死活”，明显是一副“我淋过雨所以要撕掉别人的伞”的态度。到第二季结尾第三季开头的时候更加极致，在Axelrod面临被捕的情况下只顾着保护自己这边的资产，见了Bach想采取法律手段、把现金投到自己亲戚这里、带着竞争对手Birch去清点自己在Axe Capital的资产，充分诠释了“大难临头各自飞”。单独看这个自私的人设没有问题，是自洽的，算不上人设崩塌，但很难令我信服这么一个明摆着自私自利的人物是如何出现在核心圈子中的。以Bobby Axelrod在Axe Capital的用人眼光，理应一眼就认清这个人的本质，然后敬而远之。要说“爱情使人盲目”，那剧情里对于这个盲目的爱是如何形成的、如何凌驾于Axelrod的理性之上的，花费的笔墨是不够的。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Tyler Mason&lt;/strong&gt;: 非常有意思的人物，极度理性和犀利，极强的执行力和效率，敏锐的洞察力。进入Axe Capital这个”大染缸“的适应过程也描写得很好。在Axelrod被捕之际成为中流砥柱，支撑起了Axe Capital。以第二季而言，可以说Alexlrod是（过于）幸运的了——Rhoades这方要是能找到一个如此天纵奇才、成长速度飞快的得意门生，Axelrod的日子怕是要非常难过了。从网上的评论来看，这个人物还是非常圈粉的。我对这个人物唯一的小小不满意是，TA（至少在第2-3季中）的成长曲线过于复刻Axelrod了，直接变成一个迷你版（抑或是加强版）的Axelrod，而少了一点TA自己的印记。我其实并不想看到第二个Axelrod，人设重叠了，却想看到第一个Tyler Mason——以TA的天纵之资+少数群体视角+成长轨迹，怎么在这么一个染缸里面既能融入，又能做得与众不同。（到第三季似乎通过自立门户彰显了一些“不同”，但我依然觉得TA所有的做法都是在复刻Axelrod，并没有本质不同。）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Bryan Connerty&lt;/strong&gt;: 作为Rhoades的副手和学徒，Connerty就不如Axelrod麾下的Tyler Mason那么光芒璀璨了。我个人觉得Connerty像是观众的投影，刚开始的时候带着非黑即白的正义感，并且希望实践朴实的正义。但随着剧情推进，两方的纠葛越来越深，手段层出不穷，自己深陷其中，逐渐开始对于什么是正义有了不同的看法。只缘身在此山中，也就越来越看不清谁对谁错了。（到第三季末尾就人设崩塌了——为了报复Rhoades宁愿和把Jose Lugo迫害死的Jeffcoat联手，不符合之前坚持“正义”的人设）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Mike Wagner (Wags)&lt;/strong&gt;: 我最喜欢的配角之一。忠诚的伙伴，心甘情愿扮白脸，骚话制造机。可以说是离经叛道，却独独被Axelrod认可和信任，进而忠心卖命。靠注射强行提升自己的状态，看似比谁都不稳定，实则在经历了自己的人物曲线之后稳如老狗，不用担心他会给Axelrod掉链子。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Hall&lt;/strong&gt;: 单独说一下这个清道夫，腹黑的谋士，手眼通天的“鬼魂”。很多美剧的设定里面也有类似的人物，包揽一众脏活和见不得人的勾当。我对于这类人物有个“洁癖”，就是想知道主角和他的信任是如何建立的，不然很难对这个角色买账。要干这份活，主角需要把最核心、最黑暗的机密交付给这个人处理，那么就需要有极致的信任，不然反手被出卖的话就直接GG了。这种信任甚至于要超过妻子和副手（Lara和Wags）。然而，在第二季结尾，Axelrod面临被捕的时候，Hall竟然直接失联了。你可以说他这是在自保，对于他这样游走于黑暗的人物来说无可厚非，但我如果站在Axelrod的视角，这种人实在很难相信——我怎么知道你这会儿是不是被我对家收买了，在我背后捅刀子？&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;p&gt;以后想到什么可能会再补充。&lt;/p&gt;</description></item><item><title>坦荡沟通，真诚做人</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/communication-skill/</link><pubDate>Sun, 10 Aug 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/communication-skill/</guid><description>&lt;p&gt;作为一个内向的理工科毕业生，我从读书到工作一路走来，一直被告诫“沟通能力无比重要”。但要说起“怎么提高沟通能力”，又好像没有人能给出一个完整又标准的答案。这让我不禁怀疑：告诫者本身的沟通能力大概也是挺有限的……&lt;/p&gt;
&lt;p&gt;随着在工作中不停地摸爬滚打——到处出差，和不同行业、不同背景的人打交道（aka“见人说人话，见鬼说鬼话”的事情做多了之后），我自己总结了一些所谓的“沟通技巧”。说是技巧，仔细想来却好像更多是怎么做人。写在这里自勉，也与诸位共勉。&lt;/p&gt;
&lt;h2 id="见自己"&gt;见自己&lt;/h2&gt;
&lt;p&gt;说起来可能很陈词滥调，但任何有效沟通的基础，都需要我&lt;strong&gt;自己先想清楚我想达成什么目标&lt;/strong&gt;，或者说，我需要&lt;strong&gt;自知&lt;/strong&gt;现在是在采取什么沟通&lt;strong&gt;模式&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;读书和刚入职场的时候，我们最常见的沟通模式是&lt;code&gt;汇报&lt;/code&gt;：汇报小组项目成果，或是汇报工作进度。如果你脸皮厚一点，此时也可能已经开始逐渐掌握&lt;code&gt;甩锅&lt;/code&gt;这一模式了。&lt;/p&gt;
&lt;p&gt;随着资历变深，社会经验变得丰富，沟通的目标（即模式）也会越来越多：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;说服&lt;/li&gt;
&lt;li&gt;探讨&lt;/li&gt;
&lt;li&gt;谈判&lt;/li&gt;
&lt;li&gt;通知&lt;/li&gt;
&lt;li&gt;教导&lt;/li&gt;
&lt;li&gt;试探&lt;/li&gt;
&lt;li&gt;催促&lt;/li&gt;
&lt;li&gt;求教&lt;/li&gt;
&lt;li&gt;宣泄&lt;/li&gt;
&lt;li&gt;……&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;在这个时候，分辨清楚我自己需要达成哪个目的就是沟通最基础的第一步了。很多时候我们在网上和网友“对线”，吵得不可开交，大多是因为你以为是在&lt;code&gt;探讨&lt;/code&gt;，但其实对方（以及或许你自己）只是在&lt;code&gt;宣泄&lt;/code&gt;情绪而已。&lt;/p&gt;
&lt;p&gt;不同的模式意味着需要采取不同的方法。以我自己的经历来说说&lt;code&gt;教导&lt;/code&gt;和&lt;code&gt;说服&lt;/code&gt;吧。我在咨询公司工作，外界对咨询公司的一个常见的误解是：我们只要动动嘴皮子，&lt;code&gt;教导&lt;/code&gt;企业如何做事，就能赚得大笔钞票。事实上，作为悲催的乙方，我们几乎每天都要采取的沟通模式不是教导，而是&lt;code&gt;说服&lt;/code&gt;——试图说服企业一线的工作人员接受我们的采访，考虑我们的提议，然后在采集事实信息之后，总结接下来该如何改进的建议，最后去试图&lt;code&gt;说服&lt;/code&gt;高管这是正确的决策，最终&lt;code&gt;说服&lt;/code&gt;他们为这个项目买单，欢迎他们下次再来光顾。这整个过程中，我们需要动之以情，晓之以理，喻之以利，什么方法都用上。如果是&lt;code&gt;教导&lt;/code&gt;的话，我只需要让对方清楚地知道我想传达的信息就行了——做些PPT讲一遍知识框架，负责一点的话再出些习题当作回家作业，总之参考所有学校的老师就行了。&lt;/p&gt;
&lt;p&gt;采取什么沟通模式，很多时候也取决于我自己有什么筹码。换言之，&lt;strong&gt;认识到自己有什么筹码&lt;/strong&gt;，也是&lt;strong&gt;自知&lt;/strong&gt;的重要一部分，决定了自己该采取什么沟通模式。&lt;/p&gt;
&lt;p&gt;我们作为乙方需要花很大力气去&lt;code&gt;说服&lt;/code&gt;客户而不是&lt;code&gt;教导&lt;/code&gt;客户，很大程度也是因为我们的筹码很有限。如果我司这边都是诺贝尔经济学奖得主，那对方大概就能安心听讲了。可惜我司这里都是些普通打工人，那就自然就要费力得多。&lt;/p&gt;
&lt;p&gt;同样的道理，你的老板给你安排工作是&lt;code&gt;通知&lt;/code&gt;，而不是&lt;code&gt;说服&lt;/code&gt;，也是因为你没有足够的话语权，他/她的筹码比你多。&lt;/p&gt;
&lt;h2 id="见众生"&gt;见众生&lt;/h2&gt;
&lt;p&gt;所谓&lt;strong&gt;知己知彼&lt;/strong&gt;，知道了自己的目标和筹码之后，我们算是&lt;strong&gt;知己&lt;/strong&gt;了，接下来就是要&lt;strong&gt;知彼&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;前面说到我们试图说服对方的时候往往“动之以情，晓之以理，喻之以利”，那么这里&lt;code&gt;共情&lt;/code&gt;、&lt;code&gt;道理&lt;/code&gt;、&lt;code&gt;利益&lt;/code&gt;算是我们能打的三张牌，而在自知的过程中我们也应该已经知道我们具体有什么筹码（比如能给出多少利益诱惑）。这时候就需要知彼了——打哪张牌会最有效？对方是唯利是图的商人，还是一板一眼讲道理的人机？&lt;/p&gt;
&lt;p&gt;很多时候，知彼需要深厚的阅人经历，通过短时间的接触就能看出对方是什么样的人，进而把握什么样的沟通方式对他/她最有效。抛开这种需要阅历的技术不谈，我们普通人更容易做到的方法就简单一些：&lt;strong&gt;设身处地&lt;/strong&gt;。想想你如果是在对方的位置，他/她会想听到什么的话，什么东西在驱动着他/她。&lt;/p&gt;
&lt;p&gt;我之前在工作中碰到过一个很难缠的客户，处处跟我们作对。我去他所在的城市出差，找他吃了顿饭。席间聊起，他来自伊朗，年少时便出国留学，之后便一直留在海外工作生活。于是我掏出自己从中国跑到美国读书的经历，和他一起共情了一把“背井离乡当留学生，靠学校的免费披萨度过了无数个夜晚”的辛酸经历。之后又一起吐槽自己的国家，竟然在“我的国家拥有璀璨的文化历史，只可惜当代政府把这些传统的好东西都糟践都得差不多了”这一点上再次达成了深深的共鸣。这顿饭之后，我们在工作场合相见都融洽了很多，原来的许多矛盾也都逐渐化解开了。&lt;/p&gt;
&lt;p&gt;补充一下：这里虽然我确实抱着“找共同话题”的念头开启了这些话茬，但最终我自己所说的一切也都发自肺腑，不是为了迁就对方而刻意说些违心的话。很多时候“见人说人话”这句俗语很容易被诠释为：说对方想听的话，不管自己信不信。我个人并不这么认为。可能是我比较迂腐天真吧，我还是相信真心的同频要好于口头说出来的“共鸣”。所以我对“见人说人话”这句俗语的诠释更偏向于：根据对方想听什么，&lt;strong&gt;有针对性地说些你自己也认同的事情&lt;/strong&gt;，希望能达到一定程度的共鸣。&lt;/p&gt;
&lt;p&gt;根据你对沟通对象的了解，制定对应的沟通方式，算是谋定而后动吧。反之如果你对于对方是谁、想听什么全无了解，那么你准备的沟通内容很容易就变成对牛弹琴。&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;“Designing a presentation without an audience in mind is like writing a love letter and addressing it ‘to whom it may concern.&amp;rsquo;” - Ken Haemer&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;设身处地的更深一个层面是&lt;strong&gt;尊重对方这个个体&lt;/strong&gt;，把他/她当作一个&lt;strong&gt;长期打交道的对象&lt;/strong&gt;来处理和他/她的关系，不要总想着做一锤子买卖。&lt;/p&gt;
&lt;p&gt;举个例子吧。大家可能也听闻过“咨询公司在甲方公司的内部政治斗争中被当枪使”的说法。确实，作为咨询公司很多时候很难避免被卷入这样的事情，毕竟有人的地方就有江湖，很难片叶不沾身。我自己也碰到过这种看似需要站队的事情：我们通过调查发现了一些有利于CFO派系的信息（而CFO也是起初雇佣我们公司的大佬），过几天就要整个管理层开会了，到时候如果把这些王炸拿出来，可以让对面另一个派系（CTO派系）的人狠狠吃瘪。&lt;/p&gt;
&lt;p&gt;那我们是怎么做的？我老板让我赶紧把所有信息都发给所有参会的人，尤其是CTO派系的人，提前告诉所有人这些信息的存在，给所有人都打个预防针。&lt;/p&gt;
&lt;p&gt;你也可以说我们这些咨询公司的人处事圆滑，把自己洗得干干净净。这里也不排除长期功利主义：三十年河东三十年河西，万一有朝一日CTO派系飞黄腾达，说不定还会来光顾我们的生意呢。但这样的事情也是遥遥无期，我们这么做的出发点说到底还是：别老是想着搞什么鸿门宴，偷袭对方是小人行径。&lt;strong&gt;要好好沟通就要光明正大，这也是尊重对方&lt;/strong&gt;。做一锤子买卖容易，在&lt;strong&gt;长期反复博弈中能够始终站在有利位置&lt;/strong&gt;才更难。&lt;/p&gt;
&lt;p&gt;很多常见的“沟通技巧”都是建立在知己知彼的基础上，因地制宜即可。举几个常见的例子：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;如果对方对你即将要说的事情事先没有太多了解，或者没有太多时间听你细讲，那么&lt;strong&gt;金字塔原则&lt;/strong&gt;就会很管用。金字塔原则在实用时有很多变体，但我认为最核心的原则就是把我们要展现的信息分层，最核心也是最精炼的信息是最顶层，然后按照逻辑逐渐在每一层展开。在沟通的时候先讲最顶层，视情况逐渐展开到第二第三层。&lt;/li&gt;
&lt;li&gt;如果对方有兴趣有时间听完你想讲的所有信息，那么通过一个&lt;strong&gt;故事线&lt;/strong&gt;（storylline）去好好讲一个有着起承转合的故事也许就更加动听。常见的故事线框架比如三幕剧结构（three-act structure）就可以：设置-对抗-解决。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="语言之三分"&gt;语言之三分&lt;/h2&gt;
&lt;p&gt;不管是知己还是知彼，有个概念非常重要：&lt;strong&gt;区分事实vs.观点vs.情绪&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;大部分时候，事实被用来佐证观点，而人们表达观点的时候常常受到一些内在的情绪驱动。比如“科比是有史以来最厉害（GOAT）的篮球运动员”是一个观点，拥护这个观点的球迷往往会举出很多事实来支持这一论调，比如职业生涯得分、夺冠数量等等。但很多时候，这个观点所传达出来的情绪其实是“我非常喜欢科比这个球员，是他的球迷”。&lt;/p&gt;
&lt;p&gt;正常情况下，一个有效的逻辑是基于&lt;code&gt;事实&lt;/code&gt;形成&lt;code&gt;观点&lt;/code&gt;，&lt;code&gt;观点&lt;/code&gt;产生的时候也伴随着&lt;code&gt;情绪&lt;/code&gt;。比如——&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;事实1&lt;/code&gt;：特朗普竞选时声称会降低政府赤字，但他敦促通过的最新法案（BBB）会增加3万亿美元的债务。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;事实2&lt;/code&gt;：特朗普竞选时声称会公布爱泼斯坦文件，但是他现在宣称不会再公布。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以我形成一个&lt;code&gt;观点&lt;/code&gt;：特朗普多次出尔反尔，不是一个称职的总统。&lt;/p&gt;
&lt;p&gt;同时也伴随着一个&lt;code&gt;情绪&lt;/code&gt;：我讨厌特朗普这种出尔反尔的人。&lt;/p&gt;
&lt;p&gt;之所以说这种逻辑链“有效”，是因为如果我们掌握到不同的事实，也许就能改变观点。这就使得沟通有了改变结果的可能性。反过来，如果一个人先形成&lt;code&gt;情绪&lt;/code&gt;，把&lt;code&gt;情绪&lt;/code&gt;包装成&lt;code&gt;观点&lt;/code&gt;，再选择性地用&lt;code&gt;事实&lt;/code&gt;（甚至虚假信息）来支持这个观点，那就很难通过沟通来改变这个结果。这个现象在当今的饭圈很常见：粉丝先喜欢上一个艺人（形成&lt;code&gt;情绪&lt;/code&gt;），口中说的观点是“xx艺人是内娱最强的歌手/演员/偶像”，拿出一些“事实”来佐证这个艺人有多牛。但是你真的要和他们讨论这个艺人的艺术造诣并且指出别的艺人也有可取之处的时候，就很容易受到饭圈的攻击。本质原因是他们在表达的其实是&lt;code&gt;情绪&lt;/code&gt;，而你试图跟他们探讨的是&lt;code&gt;事实&lt;/code&gt;和&lt;code&gt;观点&lt;/code&gt;。&lt;/p&gt;</description></item><item><title>美股估值：从入门到入门</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/stock-valuation/</link><pubDate>Mon, 04 Aug 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/stock-valuation/</guid><description>&lt;p&gt;过去这几十年来，对于股票投资来说，“遇事不决买美股”基本已经成为一条铁律。S&amp;amp;P500长虹了至少40年，放眼全球当真是独此一家。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/stock-eval/sp500-historical-price.png" alt="慢牛40年" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;慢牛40年&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;这就不禁使人纳闷了：&lt;strong&gt;都涨了这么久了，怎么还没估值过高&lt;/strong&gt;？这难道还能一直涨下去不成？&lt;/p&gt;
&lt;p&gt;当然了，唱衰美股的人一直都有。去年（2024年）年底，我和北美的一些管理养老金投资基金的专业人士交流，他们其中就有人认为现在美股处于高位，投资者应当分散风险（原话是“should diversify globally”）。原因是：当今美股市场的大头其实是大量资金涌入科技公司的AI浪潮，但AI的产出所带来的经济回报目前还未能比得上投入，所以无法支撑这个股价。&lt;/p&gt;
&lt;p&gt;这固然只是一家之言。那作为普通人的我们，在面对那么多不同观点的情况下，如何&lt;strong&gt;对“美股是否被高估”做出自己的判断&lt;/strong&gt;呢？这篇文章由浅入深总结一些不同的估值方法，和大家分享，但不提供任何结论。市面上很多这类文章都是扔出一堆方法（比如“股票估值的十种方法”），介绍了很多定义，但是不怎么解释本质的逻辑，看完之后还是不知道用哪个。这篇文章试图详细说一说&lt;strong&gt;从一个指标演化到另一个指标的内在逻辑&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="初窥门径市盈率及其变体"&gt;初窥门径：市盈率及其变体&lt;/h2&gt;
&lt;p&gt;说到股票估值，市面上最常见的指标是&lt;strong&gt;市盈率P/E ratio&lt;/strong&gt;：每股价格/每股净利润。比如，如果每股价格$20以及平均每股$1的净利润，P/E ratio就是20。直觉上，PE ratio可以这么解读：每投资$20，获得$1的净利润收益。&lt;/p&gt;
&lt;p&gt;另一种看待的方法是分子分母互换，看earnings-to-price ratio (&lt;strong&gt;E/P ratio&lt;/strong&gt;)，在上面这个例子里就是5%（=1/20）。直觉上，E/P ratio的解读是：每投资$1，赚5%即5美分。&lt;/p&gt;
&lt;p&gt;为什么要看E/P ratio呢？E/P ratio可以和其它benchmark的收益率进行横向对比。假如当前美国国债收益率是4%，这个4%是可以和前面这个例子的5%直接对比的。&lt;/p&gt;
&lt;p&gt;以美国国债（treasury bond）为基准，一个常用的指标是&lt;strong&gt;excessive CAPE yield (ECY)&lt;/strong&gt;。直觉上，这个指标就是衡量股票相对于国债基准有多少超额收益。在实际计算中，提出这个概念的诺贝尔经济学得主Robert Shiller多加了一点点花活，对PE ratio做了一点调整：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Cyclically Adjusted Price-to-Earnings ratio (CAPE)又称Shiler PE ratio，和普通PE ratio不同的地方在于分母不直接用当前的earning，而是根据过去十年通胀调整过的earning。&lt;/li&gt;
&lt;li&gt;CAPE yield就是对应的EP ratio（即1/CAPE）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;ECY就是CAPE yield比国债高出多少。高得越多，估值越高，中间留出的risk premium就越多。&lt;/p&gt;
&lt;p&gt;根据华尔街日报报道，目前（截至2025年上半年）美股整体的ECY约1.4%，纵观SP500的历史并不算历史高位。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/stock-eval/excessive-cape-historical.PNG" alt="当前的ECY从历史来看不算高" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;当前的ECY从历史来看不算高&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;顺便一提，ECY也可以作为构建投资组合的决策依据。比如，一旦ECY低于某个数值，可以配置更多的债券，历史经验来看这样的收益可能会更高（如下图）。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/stock-eval/excessive-cape-strategy.PNG" alt="ECY低于1.75%的时候置换债券，总体收益高于S&amp;amp;P 500" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;ECY低于1.75%的时候置换债券，总体收益高于S&amp;amp;P 500&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;h2 id="更上一层楼每家公司的底层竞争力"&gt;更上一层楼：每家公司的底层竞争力&lt;/h2&gt;
&lt;p&gt;上面说的这些指标应该是市面上比较常见的。了解了这些之后，我们算是入门了。&lt;/p&gt;</description></item><item><title>DS十年特辑04 | 数据科学和统计学有什么区别</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-04/</link><pubDate>Sat, 19 Jul 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-04/</guid><description>&lt;p&gt;&lt;em&gt;备注：此文是我在知乎上面的一篇&lt;a href="https://www.zhihu.com/question/49166647/answer/1930044470616891930" target="_blank"&gt;回答&lt;/a&gt;
，正好和这个系列相关，也引用了一些之前几篇文章讲到的内容。&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;一言以蔽之：&lt;strong&gt;这两者的区别取决于我们怎么定义数据科学&lt;/strong&gt;。各位应该也都知道，实践中的数据科学是个融合怪：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;从理论基础来说，包括了数学、统计、计算机科学、优化、机器学习等等&lt;/li&gt;
&lt;li&gt;从业界实践来说，数据科学家核心需要建模，同时很可能需要写端到端的所有代码（从数据加载到清理到建模再到最后上线部署），因此也需要相当程度的写码能力（即计算机工程知识），有时候还要搞点可视化，技能包挺杂的。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以我们怎么定义数据科学的边界在哪里呢？或者举个具体的例子：运筹优化算不算数据科学？我看到一部分人说数据科学就是统计学的一部分，那按照这个定义，运筹优化就不能算了，两者分明是不同的学科。但是，在业界实践中，至少在我所知道的多家咨询公司的数据科学业务里面，运筹优化至少占到30%。在目前的行业划分里面，要想解决“设计最优的流水线生产工序，使得成本最低效率最高”这类问题，只有数据科学家是对口的。&lt;/p&gt;
&lt;p&gt;我们在把数据科学和统计学（或者任何一门已经比较明确定义的学科）对比的时候，首先要定义清楚数据科学这个融合怪是什么。在我个人看来，数据科学的定义是：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;将现实问题转化为一个&lt;strong&gt;基于经验数据的数理模型&lt;/strong&gt;，这个数理模型从一定程度上&lt;strong&gt;刻画了世界运作的规律&lt;/strong&gt;。然后&lt;strong&gt;通过求解这个数理模型&lt;/strong&gt;，我们得到的答案可以帮助我们&lt;strong&gt;在现实世界中做出决策&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;举一些我自己接触过的项目作为例子：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;帮助服装百货公司如何打折进行定价&lt;/strong&gt;：百货公司在给打折商品定价时，既需要考虑利润率（避免江南皮革厂这种直接血亏倒闭），也要考虑出货速度（按照预计时间清空库存才能及时上新货）。我们先用一个机器学习模型预测需求弹性（即：价格每变动一块钱，需求会对应变化多少），然后再通过一个优化模型（MIP）找到不同商品在不同时间点的最佳折扣力度。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助酒店集团做需求预测和定价&lt;/strong&gt;：酒店的房间其实边际成本都一样，如何定价完全取决于需求而不是成本。因此，尽可能准确地预测房间需求量就有利于定价——如果知道一周后的那个周末会有很多人订房，开价就可以高一些，趁机赚一票。这里我们用机器学习模型（时间序列叠加XGBoost）基于历史数据和相关信息（比如是不是情人节要到了）对订房需求进行预测。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助制药公司优化供应网络&lt;/strong&gt;：一家大型药企在欧洲的供应链非常臃肿，在同一个地区可能有好几个仓库和配送中心。通过网络优化模型（network flow model），我们给这家公司提供了如何将40多个节点简化为10多个节点的方案。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助金融投资公司判断长期趋势&lt;/strong&gt;：投资界有个广受欢迎的理论是，一家公司的长期业绩表现应该符合均值回归，趋向于它同类公司的均值表现。基于这个理论，我们可以通过统计建模（采用基于条件概率的KDE），预测每家公司未来5-10年的业绩表现，帮助金融投资公司更好地规划长期投资组合。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;以上这些都是建立基于经验数据的模型、找到理论解、转化为现实决策。用到的方法五花八门，但至少在业界应用里面，都被认为是数据科学。&lt;/p&gt;
&lt;p&gt;如果你认同这个对数据科学的定义的话，那么我们似乎可以说，&lt;strong&gt;统计学是数据科学大框架下的方法论之一&lt;/strong&gt;。总体都符合数据科学的“范式”（即paradigm，来自Thomas Kuhn的科学哲学理论），只不过统计学有自己独特的方法和逻辑，与机器学习、优化等并列于数据科学的框架之下。&lt;/p&gt;
&lt;p&gt;但如果钻得更细些，我们也可以说：数据科学是一堆不同范式的融合。毕竟，深度学习和NLP有自己的通用套路：神经网络+SGD；而运筹优化也有自己的三板斧：目标函数+决策变量+限制条件。与其说是一整个统一的范式，数据科学应该更多是包含了一堆各自独立范式的混合学科。如果你从这个角度定义“范式”的话，那么数据科学就不是一个统一的大框架了。同时，统计学也未必就有一个统一的“范式”——频率学派、贝叶斯学派、乃至当下流行的算法建模流派（algorithmic modeling），都可以说是各自独立的范式。我们在业界比较经常应用的是贝叶斯学派和算法建模流派。所以从这个视角出发的话，我们也可以说：&lt;strong&gt;数据科学和统计学各自有不同的范式，两者之间有些范式是重叠的（比如贝叶斯模型）&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;相信哪个结论，如开头所言，取决于我们如何定义数据科学——或者更深层次地说——如何定义一门学科的边界。&lt;/p&gt;</description></item><item><title>DS十年特辑03 | 数据科学家的技能树</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-03/</link><pubDate>Thu, 10 Jul 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-03/</guid><description>&lt;p&gt;前两篇文章聊得都比较抽象，实诚些的朋友可能都已经没有耐心了：“啥时候能来点干货？”坦白讲，我虽然有几年从业经历，但远不觉得自己能够指点江山、为人师表。所以事先声明，前面的文章算是打打嘴炮，若是要说干货，这篇文章也就只是聊聊我个人经历中的一些偏实用向的体会，但也绝不是“7天教你成为一个优秀的数据科学家”这种所谓的版本答案。&lt;/p&gt;
&lt;p&gt;新入行的朋友经常纠结的一个问题是：&lt;strong&gt;怎么给我自己的数据技能树加点&lt;/strong&gt;？不管是学校毕业还是从别处转行，总感觉已经学了一堆东西（或者总有无穷无尽的东西可以学），但也不知道学了有没有用，入行以后也不知道怎么继续升级。说说我自己的一些观察吧：&lt;/p&gt;
&lt;h2 id="数据技能树"&gt;数据技能树&lt;/h2&gt;
&lt;h3 id="1-建模"&gt;1-建模&lt;/h3&gt;
&lt;p&gt;建模能力无疑是数据科学家的核心能力：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;建立基于经验数据的数理模型，这个数理模型从一定程度上刻画了世界运作的规律，然后通过求解这个数理模型，我们得到的答案可以帮助我们在现实世界中做出决策&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;这里的模型可以是统计模型（比如贝叶斯、KDE）、时间序列、机器学习、整数/非整数数学规划、离散事件模拟（DES）、随机过程等等。世界上的问题千千万万，建模方法也多如牛毛。你可以根据自己的兴趣或者工作性质来选择自己想走的“流派”——ML流、仿真流、优化流、贝叶斯流等等（这些名字都是我自己随便起的，你自己起自己喜欢的名字就好）。&lt;/p&gt;
&lt;p&gt;有选择困难症的朋友要问了：“有这么多技术方向，我是应该学得越多越好，还是在某个领域学得越深越好？”这一类如何平衡深度和广度的问题，我基本的思路都是：&lt;strong&gt;打造T型结构的技能包&lt;/strong&gt;。就是说，选择一个垂直领域做得越深越好（T的竖），然后在其它领域尽可能广泛涉猎（T的横）。有能力的话，逐渐进化成TT或者TTT也无不可。比如我自己读书时候学的是运筹学，所以走的是优化流，80%的时候用的都是数学规划模型（mathematical programming），但是别的工具也都有接触，要是临时接个锅做个需求预测的项目，我也能赶鸭子上架。&lt;/p&gt;
&lt;p&gt;&lt;em&gt;工具方面&lt;/em&gt;：在理论基础上，熟知各种Python包是基本操作了。取决于你的专攻方向，可能还会有专用的工具——比如优化建模就绕不开Gurobi/CPLEX。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/python-developer-comic.jpg" alt="Python" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;Python&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;h3 id="2-工程"&gt;2-工程&lt;/h3&gt;
&lt;p&gt;除了对数据模型需要有扎实的理论知识，一个优秀的数据科学家通常也是一个写码的高手。这里有几个不同的方面：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;快速迭代&lt;/strong&gt;：建模的过程通常是个实验和试错的过程——试试这些个方法行不行，不行再换一批。这就需要数据科学家能够快速写码、快速更迭、快速意识到自己是傻冒……不能在一个bug上被卡半天。具体来说，就是你debug快不快，代码写得是否足够模块化，代码的容错率是不是够高等等。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;处理工程问题&lt;/strong&gt;：理论虽然美好，现实中总有各种稀奇古怪的问题挡住我们的去路。有时候是数据量过大，加载起来太慢；有时候是数据格式不匹配；有时候是服务器和本地不同步。这些繁杂的工程问题几乎每次都会出现，在这方面有经验的数据科学家就可以更加游刃有余。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;手搓模型&lt;/strong&gt;：虽然现在各种Python包可以说是层出不穷，但很多时候一个特定问题需要一个特定的模型，市面上未必有现成的，这时候就要手搓模型了，那就是要考验各位的写码能力了。我之前工作中碰到过一个项目，发现需要用Ornstein-Uhlenbeck随机过程建模——这玩意儿光看名字就知道市面上没现成的……也就不得不自己手搓（搞了个破产版的）。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;em&gt;工具方面&lt;/em&gt;：需要一个趁手的IDE能够实现所有写码和debug的功能（比如VS Code或者PyCharm）；另外就是熟悉Databricks/Snowflake之类的数据平台&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/vs-code.png" alt="VS Code" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;VS Code&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;h3 id="3-协作"&gt;3-协作&lt;/h3&gt;
&lt;p&gt;在现实工作中，一个人单打独斗搞定一个项目的情况几乎不存在。绝大多数情况下我们都需要和同事合作，要么一起建模，要么有上下游的分工（比如一个人处理数据另一个人建模）。这种情况下，和同事合作的能力就变得很重要了。细微处比如版本管理和代码协作（commit/push/pull…），宏观处比如找到各自擅长的领域进行分工，都是需要积累的经验和技能。这一点尤其是对于新入行的朋友尤为明显——如果是在学校通过上课习得的专业知识，一般都习惯单打独斗，会需要一个适应团队协作的过程。&lt;/p&gt;
&lt;p&gt;&lt;em&gt;工具方面&lt;/em&gt;：Git&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/git-example.png" alt="Git" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;Git&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;h3 id="4-讲故事"&gt;4-讲故事&lt;/h3&gt;
&lt;p&gt;能把整个数据项目的故事讲得好听其实是一项非常重要的技能。可能大家作为技术人员，往往会觉得：“我把事情做好就行了，不用吹得天花乱坠，那样反而浮夸”。但在现实中，一个项目做得成不成功，本身底子自然重要，但是故事是怎么讲的同样也重要。所谓&lt;strong&gt;一图胜千言&lt;/strong&gt;，有时候一张酷炫的图可以省下无数的口舌。&lt;/p&gt;
&lt;p&gt;坦白讲，这一点上MBB确实是行家，一手PPT做的是花里胡哨，让数据模型的结果显得更加令人信服。所以，&lt;strong&gt;你想想MBB是怎么忽悠你和你老板的，拿出相同的力气去包装你的数据项目吧&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;&lt;em&gt;工具方面&lt;/em&gt;：PowerBI/Tableau等可视化工具；善用PPT&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/power-bi-example.jpg" alt="Power BI" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;Power BI&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;h2 id="技能加点攻略"&gt;技能加点攻略&lt;/h2&gt;
&lt;p&gt;以上这些在我看来算是必备技能了。那么如何加点呢？&lt;/p&gt;</description></item><item><title>DS十年特辑02 | 数据科学很水吗？</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-02/</link><pubDate>Tue, 08 Jul 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-02/</guid><description>&lt;p&gt;数据科学在刚刚诞生的时候，应该算得上光鲜亮丽，着实火了相当一段时间。近些年来，不知道是不是因为卷得厉害，口碑似乎不复当年。很多人会觉得“数据科学很水”，这篇文章我们就来聊聊这个。&lt;/p&gt;
&lt;p&gt;我理解的大家口中的“很水”大致分为两类：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;做这个行业的人&lt;strong&gt;鱼龙混杂&lt;/strong&gt;，什么背景的都有，尤其是很多半路出家的半吊子。&lt;/li&gt;
&lt;li&gt;这个行业主要是&lt;strong&gt;吹牛皮&lt;/strong&gt;，噱头大于实质，没有创造出什么真实的价值。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;对于第一条，在我看来，”做数据行业“和”做数据科学行业“还是很不一样的。很多转行的、非专业背景的人，大部分都是在做数据行业；但是要做数据科学的话，根据我上一篇&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-01/" target="_blank"&gt;文章&lt;/a&gt;
提到的定义，需要对现实问题建立正确的模型、找到解决方法、转化为现实决策，这每一步都需要相当的经验和技术能力，是一道不容易跨越的门槛。&lt;strong&gt;这个行业是否鱼龙混杂，取决于你用哪个门槛来定义这个行业&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;另外补充一个个人观点。多年前，我还年轻气盛的时候，练过一段时间空手道。那段时间很经常碰到的一个引战话题是：空手道和跆拳道哪个更强？以及类似的各种变体，比如空手道和散打哪个强，空手道里面系东流和刚柔流哪个更强，等等。经过一系列口头的和物理的“切磋”之后……我学到的结论是：&lt;strong&gt;没有最强的流派，只有最强的个人&lt;/strong&gt;。所谓英雄不问出处，只要在擂台上倒下的那个人不是你，你学的是哪个流派都不重要。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/TheGrandmaster-kungfu.png" alt="英雄不问出处" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;英雄不问出处&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;同理，对于从事数据科学而言，之前的专业背景是个重要因素的，但也不是全部的因素。个人能力足够强的话，触类旁通得快，怎样都可以成为大牛。&lt;/p&gt;
&lt;p&gt;第二个问题——&lt;strong&gt;数据科学行业有没有创造实际价值，还是只是个噱头&lt;/strong&gt;——是我想详细聊聊的点。也许对于很多人来说，选择一份职业的时候只要它工资给够就行了。对我来说，还是很在意这个行业有没有创造一些价值的。这也是我早年从纯数学转到应用数学（运筹学）的一大原因。以我平庸的资质，估计在纯数学领域也混不出什么名堂，即便侥幸能够立足，能做出的贡献怕是也很有限。而如果能将一些数理工具应用到实际问题中，帮着解决一些实际问题创造些价值，也不枉费我“实变函数学十遍”的一番努力了。&lt;/p&gt;
&lt;p&gt;要说数据科学这个行业有没有创造价值，让我们先把“价值”拆分成几个不同的层面：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;可以明确衡量的&lt;strong&gt;经济价值&lt;/strong&gt;：人们愿意花多少钱使用数据科学工具解决他们之前无法解决的问题？&lt;/li&gt;
&lt;li&gt;不容易直接用金钱衡量的&lt;strong&gt;社会价值&lt;/strong&gt;：这个行业有没有对社会做出正面的贡献？&lt;/li&gt;
&lt;li&gt;对于个人发展的&lt;strong&gt;成长价值&lt;/strong&gt;：这个行业能不能给从业者提供良好的成长平台？&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;以下是我对每个层面的一些个人看法。&lt;/p&gt;
&lt;h2 id="真金白银的经济价值"&gt;真金白银的经济价值&lt;/h2&gt;
&lt;p&gt;在我接触到的案例中，数据科学可以创造不少肉眼可见的经济价值。&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-01/" target="_blank"&gt;上文&lt;/a&gt;
提到的每个案例都是价值数百万美金的咨询项目，也就是说企业愿意为其中的每个项目掏数百万美金用数据科学工具来帮助他们解决这些问题：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;ul&gt;
&lt;li&gt;帮助制药公司优化供应网络&lt;/li&gt;
&lt;li&gt;帮助冷冻食品公司优化生产工序&lt;/li&gt;
&lt;li&gt;帮助服装百货公司如何打折进行定价&lt;/li&gt;
&lt;li&gt;帮助酒店集团做需求预测和定价&lt;/li&gt;
&lt;/ul&gt;

 &lt;/blockquote&gt;

&lt;p&gt;根据第三方平台Compworth和Growjo的估计，麦肯锡的数据部门（QuantumBlack）每年营收额约1-1.5亿美金，波士顿咨询的数据部门（BCG X）每年营收额约6亿美金。这些都是诸多企业在数据科学上面花的真金白银。&lt;/p&gt;
&lt;p&gt;可能有人会说，这个价格标签是来源于咨询公司吹牛皮的溢价，就如同咨询公司的PPT一样，本不值那么多钱。我并不完全认同这个观点，详见我的另一篇&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/consulting-in-reality/" target="_blank"&gt;博客文章&lt;/a&gt;
。而本篇文章的重点不是讨论咨询公司的商业订价模式。即便抛开这个因素，数据科学能创造的经济价值也是不可否认的。举两个具体的例子吧。&lt;/p&gt;
&lt;h3 id="例子1多余的直升机"&gt;例子1：多余的直升机&lt;/h3&gt;
&lt;p&gt;石油公司在海上的开采作业主要依靠钻井平台和钻井船，通常海底油田都离最近的海岸相距200公里以上。因此，向钻井平台和钻井船及时提供设备、人员、日常用品就成为了一个复杂的流程。&lt;/p&gt;
&lt;p&gt;除了常规的船只运输之外，也有很多紧急的情况需要更快速的周转：比如设备出现故障，需要技术专家和对口零配件立刻到位，不然整个钻井工作就要停摆，停工一天的损失可能就会接近百万美金。为了这些应急需求，石油公司也会动用直升机进行运输。而使用直升机的成本显然要远高于船只运输。我们客户公司预计他们的每架直升机每一年的成本折算下来约是2百万美金（包括燃油、人工、维护、折旧等等）。&lt;/p&gt;
&lt;p&gt;由于停工三四天的损失就抵得上一架直升机一年的费用，之前石油公司的思路都是：“飞机不够就再来一架，不差钱”。于是直升机越来越多，成本越来越高。当他们有了八九架直升机之后，我们帮他们做了一个优化模型，看看是不是真的需要这么多直升机。首先要做一些基本的需求预测（demand forecast），比如他们每年每个钻井平台大概需要多少次直升机支援，然后再用网络优化模型看看能不能用更少的直升机满足这些需求。结果发现，果然可以省下至少一架直升机，当然这需要通过更复杂、更优化的调度，而不是他们现在这样随心所欲地“随心飞”。这就通过数据科学模型产生了约2百万美金的价值，不管我的黑心老板这个项目卖了客户多少钱。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/helicopter-drawing.jpg" alt="一架直升机值2百万美金" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;一架直升机值2百万美金&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;h3 id="例子2失准的秤"&gt;例子2：失准的秤&lt;/h3&gt;
&lt;p&gt;在工业级批量生产薯条的过程中，第一步往往是把土豆倒在一个称量斗（weigh hopper）里，这个设备会有个称重的部件（load cell），精确衡量我们在斗里放了多少斤土豆。这些土豆随即进入生产线，之后的生产工序都需要根据土豆份量来调整刀片速度、用油量、调料用量等等。如果称重错了，后面的步骤都会受到影响，一步错步步错。最差的结果就是导致整个生产线停产，重新称量并且调整后续步骤的用量。每停产一个小时，往往就是近万美金的损失。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/weigh-hopper-load-cell.jpg" alt="称量斗" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;称量斗&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;你说巧不巧，这个称量斗的秤还真的时不时会出错。有可能是因为土豆卡住了，也有可能是没有及时归零，以及其它各种原因。那怎么（用数据科学）解决这个问题呢？我们采用了一个异常值探测的预测性维护（predictive maintenance）模型，基于历史上发生的失准事件，我们观察事件发生前称重数值有没有异常变化，找到规律之后以此来预测下一次失准事件的发生。事实证明，如果采用一个基于指数平滑移动平均线（MACD）的异常值探测模型，这个模型基本可以准确地在失准事件发生前就发出预警：“秤的数值开始跑偏了，快来人啊！”&lt;/p&gt;</description></item><item><title>DS十年特辑01 | 数据科学到底科不科学？</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-01/</link><pubDate>Mon, 30 Jun 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-01/</guid><description>&lt;h2 id="正文"&gt;正文&lt;/h2&gt;
&lt;p&gt;作为一门学科，数据科学包含了数学、统计、计算机、优化、机器学习等多门学科的一部分技能树。&lt;/p&gt;
&lt;p&gt;作为一个行业，数据科学几乎可以和各行各业都扯上些关系，给各种企业提供各种业务方面的支持——比如帮助科技公司的产品开发，分析预测某家零售企业的销量等等。&lt;/p&gt;
&lt;p&gt;作为一个职业……呃，其实说“一个职业”不太准确，因为有很多个相似但不同的职业都被笼统地归类在“数据科学”的大旗之下：比如数据科学家、数据工程师、数据分析师等等。&lt;/p&gt;
&lt;p&gt;所以我们在讨论“数据科学”的时候，很容易因为不同人的视角和定义不同，而导致讨论得牛头不对马嘴。其中也容易产生对这个行业的误解。从我自己的经验和体验出发，为了文章的统一性，讲一下我自己的定义，也欢迎大家讨论交流。&lt;/p&gt;
&lt;p&gt;在我看来，数据科学的核心定义是：&lt;strong&gt;对现实的问题建立一个基于经验数据的数理模型，通过这个模型得到的结论做出决策判断。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;先举几个具体的例子吧，希望会有助于诠释这个定义。比如我现在正在经营一家制造和销售羊毛衫的公司——&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;我想知道我下个月生产多少羊毛衫。我可以基于历史销售数据和相关信息（比如气温变化），建立一个监督式机器学习模型，根据历史数据训练这个模型，对下个月的销量做出预测，进而以此决定我下个月该薅秃多少只羊的羊毛。&lt;/li&gt;
&lt;li&gt;我想知道我该如何扩张我的供应链网络，比如我已经在中国市场站稳了脚跟，希望把我的羊毛衫卖到欧洲去，那么我应该继续薅自己家的羊毛把成品直接送到欧洲市场，还是也许在蒙古再养些羊，薅它们的外国羊毛然后从那里发往欧洲？这里， 我们可以建立一个网络优化模型（network flow model），通过这个模型的最优解确定最佳的货源地、配送中心和运输方案（即：羊毛在哪里薅、羊毛衫在哪里生产、发往哪个仓库、供给哪些客户）。&lt;/li&gt;
&lt;/ul&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/cute-sheep.jpg" alt="羊毛怎么薅" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;羊毛怎么薅&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;在这些例子中，我们都是将现实问题转化为一个&lt;strong&gt;基于经验数据的数理模型&lt;/strong&gt;（即预测模型和网络优化模型），这个数理模型从一定程度上&lt;strong&gt;刻画了世界运作的规律&lt;/strong&gt;。然后通过&lt;strong&gt;求解这个数理模型&lt;/strong&gt;，我们得到的答案可以帮助我们&lt;strong&gt;在现实世界中做出决策&lt;/strong&gt;（比如规划多少产量，配送中心建在哪里）。&lt;/p&gt;
&lt;p&gt;既然“数据科学”中有“科学”二字，于我而言，以上是至少要达到的程度。很多时候，“分析一下历史数据看看哪里奇怪了”、甚至“做一个dashboard展示历史数据”也都被归为数据科学，在我看来是不够严谨的，严格意义上这应该只是算做数据分析（analytics）。既然是科学（science），有可复现并能够被验证的框架（在这里是数理模型）是必须的。&lt;/p&gt;
&lt;p&gt;取决于你认同什么流派的科学哲学，不同的人可能会对“数据科学算不算科学”有不同的看法。我把我个人的看法放在文末附录。打这种哲学思辨的嘴炮虽然有趣，也很容易让讨论演变得很虚无。最重要的其实是，&lt;strong&gt;你在读这个文章系列的时候能够理解我指代的“数据科学”是什么&lt;/strong&gt;。那么，除了高屋建瓴的“哲学”定义之外，让我也多讲一些我过去工作中碰到的数据科学实例，这样我们可以（暂时）对数据科学有共同的定义。&lt;/p&gt;
&lt;p&gt;举一些我自己接触过的项目作为例子：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;帮助服装百货公司如何打折进行定价&lt;/strong&gt;：百货公司在给打折商品定价时，既需要考虑利润率（避免江南皮革厂这种直接血亏倒闭），也要考虑出货速度（按照预计时间清空库存才能及时上新货）。我们先用一个机器学习模型预测需求弹性（即：价格每变动一块钱，需求会对应变化多少），然后再通过一个优化模型（mixed-integer programming model即MIP）找到不同商品在不同时间点的最佳折扣力度。【MSP/定价】&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助酒店集团做需求预测和定价&lt;/strong&gt;：酒店的房间其实边际成本都一样，如何定价完全取决于需求而不是成本。因此，尽可能准确地预测房间需求量就有利于定价——如果知道一周后的那个周末会有很多人订房，开价就可以高一些，趁机赚一票。这里我们用机器学习模型（时间序列叠加XGBoost）基于历史数据和相关信息（比如是不是情人节要到了）对订房需求进行预测。【MSP/定价】&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助制药公司优化供应网络&lt;/strong&gt;：一家大型药企在欧洲的供应链非常臃肿，在同一个地区可能有好几个仓库和配送中心。通过网络优化模型（network flow model），我们给这家公司提供了如何将40多个节点简化为10多个节点的方案。【OPS/供应链】&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;帮助冷冻食品公司优化生产工序&lt;/strong&gt;：一家冷冻食品公司在生产不同类型的薯条时，经常因为更换刀片、调料等原因耽搁生产时间。通过混合整数规划模型（MIP），我们给这家公司提供了每个生产周期最优的工序排列，减少不必要的耽搁，大幅提高生产效率。【OPS/生产】&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;我在另一篇&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/using-or-in-reality/" target="_blank"&gt;博客文章&lt;/a&gt;
里还提到了几个其它的例子，也可以一并参考。&lt;/p&gt;
&lt;p&gt;一位前辈同事曾告诉过我：一个列表如果超过三项，最好进行分类，不然可读性就会下降。在上面的列表中，我在每项末尾也放置了分类。总的来说，我在工作中应用到数据科学的地方大部分落在两个业务领域（functional practice area）：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Marketing, Sales, and Pricing (MSP)&lt;/li&gt;
&lt;li&gt;Operations (OPS)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;其中，MSP经常做定价类的项目，上面就举了两个例子。除此之外，也做很多个性化推荐（personalization）。而OPS基本就集中在供应链和生产优化两个分支，上面也各有一个例子。这些应用场景加起来，大概覆盖了我做过的80%项目类型。&lt;/p&gt;
&lt;p&gt;以上这些是我所理解和应用到的数据科学。显然，这不代表整个行业和学科，只是我个人的视角。后面文章所阐述的想法也是仅以此为根基。说了这么多有的没的，管它是黑猫还是白猫，抓住老鼠就是好猫。管它是不是科学，这个行业有没有创造任何实际价值，还是“全都是泡沫”？且听下文分解。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/ds-10yr/white-cat-black-cat.jpg" alt="抓住老鼠就是好猫" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;抓住老鼠就是好猫&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;h2 id="可读可不读的附录"&gt;可读可不读的附录&lt;/h2&gt;
&lt;p&gt;&lt;em&gt;关于科学哲学的一些形而上的思考（aka嘴炮）&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;如文中所言，“数据科学算不算科学”取决于你认同哪种科学哲学的定义。如果我们考虑比较常见的Thomas Kuhn的范式论，&lt;strong&gt;一门学科算作科学的条件&lt;/strong&gt;可以大致总结为：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;有共同的理论根基，不能只是零散的应用场景&lt;/li&gt;
&lt;li&gt;有一个共同的范式（paradigm）——比如牛顿力学体系&lt;/li&gt;
&lt;li&gt;在正常情况下，从业者在范式之内解决问题，即常态科学（normal science）&lt;/li&gt;
&lt;li&gt;科学的演化和进步来自于范式转移（paradigm shift），尤其是在范式之内积累了足够多的反例（anamolies）之后——比如从牛顿力学体系演化到爱因斯坦相对论体系&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;我会认为，我对于数据科学所提出的“对现实的问题建立一个基于经验数据的数理模型，通过这个模型得到的结论做出决策判断”&lt;strong&gt;这一定义几乎可以符合Kuhn所说的“范式”&lt;/strong&gt;。从业者都是沿用共同的、有理论根基的工具方法（比如凸优化理论），去解决范式定义内的问题（比如一个线性规划问题或者一个支持向量机SVM回归模型）。&lt;/p&gt;</description></item><item><title>数据科学十年生涯回首 | 总纲</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-00/</link><pubDate>Sun, 29 Jun 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-00/</guid><description>&lt;p&gt;2012年，还在读本科的我翻开新闻杂志，首次接触到了”大数据“这个概念，觉得很酷。彼时正在读数学本科的我，深知自己不是钻研纯数学的料。大数据，以及后来逐渐成型的数据科学，看起来似乎可以是我的用武之地。之后读了工业工程和运筹学（IEOR）的硕士，便投身于这个行业，从2015年开始在北美的咨询公司为不同的企业提供数据科学的咨询服务。如今一晃已经十年，顾盼回首，想写一写这十年&lt;del&gt;牛马&lt;/del&gt;职业生涯的感受，算是给当年入行之前青涩的自己一个交代，也分享给想了解或者想进入这个行业的朋友。&lt;/p&gt;
&lt;p&gt;这个系列由以下几篇文章构成：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-01/" target="_blank"&gt;01 | 数据科学到底科不科学&lt;/a&gt;
：聊聊什么是数据科学&lt;/li&gt;
&lt;li&gt;&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-02/" target="_blank"&gt;02 | 数据科学很水吗&lt;/a&gt;
：聊聊数据科学的价值&lt;/li&gt;
&lt;li&gt;&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-03/" target="_blank"&gt;03 | 数据科学家的技能树&lt;/a&gt;
：聊聊技能树加点攻略&lt;/li&gt;
&lt;li&gt;&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/ds-10yr-04/" target="_blank"&gt;04 | 数据科学和统计学的区别&lt;/a&gt;
：答知乎问题&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;未来或许会不定期继续更新。&lt;/p&gt;</description></item><item><title>草台班子的帮工：我眼里真实的咨询公司</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/consulting-in-reality/</link><pubDate>Fri, 30 May 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/consulting-in-reality/</guid><description>&lt;p&gt;我一般不太主动和别人说我在咨询公司工作。因为很神奇的是，如果我告诉别人我在MBB工作，一般来说得到的反应有些两极分化：一部分人觉得这份工作很光鲜，甚至想要套词找内推；还有相当一部分人，觉得这份工作只是在吹牛逼，靠忽悠别人挣钱。我似乎不太能碰到态度比较中立的局外人，除非是之前完全没有听说过咨询这个行业。&lt;/p&gt;
&lt;p&gt;屈指算来，我在这个行业已经待了10年。在这个时间节点，想写写自己观察到的真实的咨询行业。既没有很多人看起来的那么光鲜，也不只是做做PPT而已。&lt;/p&gt;
&lt;p&gt;如果用一句话总结咨询公司是干什么的，我会说：&lt;strong&gt;企业花钱找来的人帮忙解决问题&lt;/strong&gt;。我们生活中碰到解决不了的问题，也会花钱找人解决，不是吗？水管坏了打电话找管道工修；生病了一直不见好，那就去医院找医生。那么企业碰到自己无法完全解决的问题，也想找人帮忙，所以就有了咨询公司。事实上，咨询公司是professional service这个行业的代表之一，而整个professional service行业——包括投行、律所、会计事务所等等——都是为企业服务的帮工。&lt;/p&gt;
&lt;p&gt;可能大家会觉得，投行律所等等的业务范围很明确，就是帮着企业上市或者打官司等等。而咨询公司听起来只是出出主意而已，并没有解决什么具体的问题？要解答这个疑惑，那我们就应该先想一下，&lt;strong&gt;企业一般都有哪些问题，是他们可能会找外人（咨询公司）来帮忙解决的？&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;不是所有问题都需要找外人帮忙的。如果我是一家卖饼干的公司，那我显然不需要咨询公司告诉我饼干的配方应该是什么。但是，在成为一家成功的饼干巨头企业道路上，有很多商业问题是我们这群一起创业的面点师没有经验的：仓库选在哪里，供应链怎么设计得及时有效，品牌宣传怎么做等等。当然，我们成立了相关的生产部门、宣传部门等等，招了这些领域的人专门处理这些事情。理论上，如果这些部门通力合作、各司其职，并且各自都足够给力的话，那么我应该也不需要别人来帮忙。&lt;/p&gt;
&lt;p&gt;很遗憾的是，这个理想的场景在现实中不存在。&lt;strong&gt;这个世界是个巨大的草台班子&lt;/strong&gt;，大家都是摸着石头过河而已。更多时候，公司里的各个部门能够维系日常业务的正常运作就很好了——对供应链部门来说，货能及时送到就算是成功了，别提什么“低成本、高效率、高韧性的供应链网络”了。长此以往，你会发现，企业每天的运营成本越来越高，利润越来越薄，人员倒是越来越多，但是没有人知道问题出在哪里，或者大家都觉得有一堆问题，但互相甩锅，也没时间去解决。&lt;/p&gt;
&lt;p&gt;企业找咨询公司帮忙的时候，我一般看到两种类型的问题：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;企业自己大概知道如何解决，但需要外力帮一把&lt;/li&gt;
&lt;li&gt;企业自己几乎不知道如何解决，需要借外力走出第一步&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;先举几个常见的例子吧：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;降本&lt;/strong&gt;（cost reduction）是常见的第一类问题。企业知道自己运营成本日渐升高，对于哪里可以砍掉点成本，或多或少是有自己的认知的。但是，要让企业自己进行全方位的降本，很容易陷入内部人事斗争的泥沼（“凭什么砍我的预算和人员不砍他的？”），拖得时日漫长不说，最后能不能实现也很难讲，说不定还连带着推行这件事的决策者一起翻车。这种情况下，找咨询公司来做这件事是最合适了，也不怕得罪人，反正脏水往咨询公司身上一泼就行（“人家麦肯锡说了，这个部门就该砍了”）。何况投资性价比也非常划得来——一般咨询公司这样的项目都是：我收你3百万，给你一个接下来3年内省下1.5亿的全面降本方案，并且在这个财年就帮你实现其中的20%（也就是年内回本并且已经开始省钱）。哪怕后两年的那个数是吹牛逼的，我自己至少也没亏，没准还能真的推行一些降本措施。&lt;/p&gt;
&lt;p&gt;顺便一提，很多人常常把咨询公司和裁员联系在一起，感觉好像咨询公司出现在我们公司好像就意味着我们要裁员了。这大概也是咨询公司常做降本类的项目、而降本常见的手段之一就是裁员导致的吧。这很情有可原，我只想多说一句：降本的手段其实很多，具体哪个有效取决于每家公司和其所在的行业。在重资产的行业（比如工业制品、能源等等），其实裁员并不能省下很多钱，（物理）资产和流程的优化反倒更有效。所以，&lt;strong&gt;找咨询公司不直接等于要降本（也可能是别的项目），降本也不直接等于裁员（也可能是别的方法）&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;另一个常见的例子是&lt;strong&gt;数字化转型&lt;/strong&gt;，属于第二类问题（企业自己几乎不知道怎么解决）。这里我都不说什么所谓的AI转型之类的时髦术语了，就只说数字化。我不知道这算不算冷知识：很多欧美世界500强企业，直到现在都非常依赖Excel，连基础的数据管理都没有。我见过一个高市值的跨国食品公司，他们生产规划和需求预测都是用Excel来做的，并且每个季度会在Excel里面手动修改上个季度的一些数字，以至于他们到后来都搞不清自己的历史数据是啥样的。对，世界就是这么草台班子。那不然呢？如果我想要有统一的数据库，能实时看到所有订单库存，并进行趋势分析看看哪里增长得快，我该找谁帮我把这个搭起来？靠公司里那群还在用Excel的牛马吗？&lt;/p&gt;
&lt;p&gt;这时候咨询公司就能起到很大的作用了。倒不是咨询公司一定真的在AI领域有多先进，但至少他们帮很多企业做过数字化转型，相比你自己从头开始招人、新建一个全新的部门、整个公司上下没有人接触过这回事，让咨询公司过来搭建这些工具和流程，甚至手把手帮你把第一批人招进来，可以大大减低试错成本，性价比要高得多。&lt;/p&gt;
&lt;p&gt;这些都算是比较常见的咨询公司的业务范围，其它还有很多，不一一罗列了。我想多说一个不那么常见的——或者从逻辑上说，更深层次的——咨询公司帮忙解决的问题：&lt;strong&gt;企业高管的心理问题&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;企业高管每天可能会面临的决策是：我需要拍板决定一件事情，这件事情可能要花几个亿，不一定会成功，如果失败，我以及一直跟着我打天下的整个团队可能都要遭殃。&lt;/p&gt;
&lt;p&gt;正常人长期处于这个状态下，压力是非常大的。他们可以去找心理医生，但心理医生不能帮他/她实际做出眼前的决策。这个时候，咨询顾问从某种意义上可以成为企业决策者的心理咨询师。显然不是真的提供心理咨询，但，咨询公司团队可以告诉你：&lt;strong&gt;我们收集了那么多事实和数据，这些东西都能支持你的决策，放心大胆地干吧，相信你自己。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;你可能会怀疑，决策者就这么天真的信了吗？这就管用了？其实从决策者的视角来说，可能更多是这样的：我有一个价值几个亿的决策，&lt;strong&gt;我花其中的1%的预算&lt;/strong&gt;（也就是几百万）找了市面上能找到的最好的咨询公司帮我做了尽职调查，就当是买了个保险吧。他们一定是对的吗？不一定，我们都知道这世界是草台班子，他们的PPT一定是掺了很多水的。但这是市面上能花钱买到的最好的参考信息了。&lt;strong&gt;我已经为这个决策做足功课了，这就够了，我不需要为此再纠结了。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;注意，这里除了对主观情绪的安抚之外，也存在一个&lt;strong&gt;客观的价值杠杆&lt;/strong&gt;。我们从外面看，好像觉得一家公司花几百万美金找咨询公司来出主意是一笔很大的金额。而很多时候，一个商业决策的价值（或者代价）可能会非常高，不单是经济层面（可能是上千万甚至上亿），也可能是公司政治层面的（一个派系的人会不会跟着平步青云或者翻车）。在这种情况下，如果花几百万美金能够让这个决策更加有理有据，哪怕只是推动一点点额外的认知，或者是抓到了一个之前决策者没有想到过的盲点，也已经对得起这个价格了。&lt;/p&gt;
&lt;p&gt;随着我自己的职业经验日渐增长，我越发觉得，在任何一个行业，&lt;strong&gt;深刻的洞见和真正基于事实的严谨分析是非常稀有的&lt;/strong&gt;。大部分的公司就只是在维系日常的运作而已，或者说，就只是活着而已。我们甚至连值得信任的看新闻的渠道都找不到——不是充斥着花边新闻就是被各种意识形态所裹挟。我相信，很多企业决策者也是这么觉得的。因此，当有咨询公司能够提供这样的洞见和分析，哪怕只是表象上看起来是这样而已，也会有足够多的企业决策者愿意为此支付不菲的价格。&lt;/p&gt;
&lt;p&gt;更何况，企业决策者和咨询公司合伙人之间，多半也是有千丝万缕的联系的。可能之前就共事过，也可能早年是商学院的同学。你找来帮忙的人，可能对你知根知底，不仅知道你的公司行业，还知道你的为人处世。从过往的交集中，你也知道他/她为人靠谱勤奋，以前认识的时候就知道他/她很优秀，现在你可以用公司的钱找他/她过来帮你一把，为什么不呢？&lt;/p&gt;
&lt;p&gt;这里多说一句，这些大佬级别的关系才是驱动咨询业务的源头之一，而不是所谓名校毕业的高材生。外界很多对咨询的吐槽集中在：“大学刚毕业的愣头青教资深业内人士做生意”。事实上，企业决策者根本不认识咨询公司的年轻人，连名字都不会去记，也完全不在意他们说什么。他们在意的是他们找的那个合伙人的招牌。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;这种大佬级别的关系也是被精心维系的&lt;/strong&gt;。如果你觉得咨询公司合伙人个个唯利是图，整天像电话推销员一样缠着你，给你安利他们的咨询方案，那你就大错特错了。好的合伙人都懂得为他/她的客户谋取最大的利益，不管是不是表象。说个关于美人计的段子：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;虚假的美人计是你馋她的身子：陛下！臣妾美吗？&lt;/p&gt;
&lt;p&gt;真正的美人计是她懂你的灵魂：重八，你怎么变的这么老了。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;想要维系好关系，不管是不是真心，都会从对方的角度出发。我就见过老板为了客户的利益而大义凛然拒绝客户生意的。&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;客户：我觉得我手底下的供应链现在效率很低下，现在我手里有一两百万的预算，要不你帮我做个效率优化的项目？&lt;/p&gt;
&lt;p&gt;我老板：先让我把情况搞清楚再说。我先白送你两个礼拜的时间，我让我的团队调查一下你这里什么情况。&lt;/p&gt;
&lt;p&gt;两周后，我老板：你的供应链其实没有问题，主要是你的二把手和三把手信息没有对齐，你让他们团队的人好好对接一下就行。你这个供应链没有值得要花两百万治的问题。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;可以想象，如果大佬之间维系的都是这样的关系，那么在需要花钱解决问题的时候，他们的支付意愿可以有多强烈。&lt;/p&gt;
&lt;p&gt;很多人吐槽花钱找咨询公司是“花了几百万买了一堆PPT”。结合上面所说的一切，我觉得大家只是没有看到这堆PPT解决了什么问题而已。有时候它可能解决了一个内部棘手、适合外人来做的问题，有时候它可能给一件整个公司都没有过经验的事情提供了新的方向，也可能有时候这些PPT抚慰了决策者的内心。&lt;strong&gt;PPT只是手段罢了，最终的目的是解决问题&lt;/strong&gt;。有些问题摆在明面上，有些问题埋得很深。&lt;strong&gt;找到谜团的核心，想出解决问题的办法，给混沌带来秩序&lt;/strong&gt;，这也算是咨询行业一直吸引着我的一个点吧。&lt;/p&gt;</description></item><item><title>在美国做全麻肠镜的完整体验</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/colonoscopy-experience/</link><pubDate>Sun, 20 Apr 2025 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/colonoscopy-experience/</guid><description>&lt;p&gt;坐标南加&lt;/p&gt;
&lt;h2 id="提前准备"&gt;提前准备：&lt;/h2&gt;
&lt;p&gt;医生应该会给一张准备清单，按照那个做就行。&lt;/p&gt;
&lt;p&gt;首先是准备泻药，这个医生会开处方药，去你提供的药房自取。这是必须要做的准备。&lt;/p&gt;
&lt;p&gt;其它几个非必需、但是我个人觉得可以准备的东西如下：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;湿纸巾：吃完泻药后会去很多次厕所，用湿纸巾对菊花比较友好。记得买flushable的那种&lt;/li&gt;
&lt;li&gt;运动饮料：术前一天不能进食，光靠喝水可能有点难顶，运动饮料可以提供些能量。但记得不要买深色的饮料，这个在医生给的清单上应该会提到。&lt;/li&gt;
&lt;li&gt;成人尿裤：吃完泻药之后，如果担心晚上睡觉难以控制，可以提前准备成人尿裤。另外之前看到别人的经验提到，去做肠镜当天如果担心去的路上还会拉肚子，也可以穿着成人尿裤去。我自己的体验是肠镜当天肠胃都已经清空了，所以路上并没有什么感觉，当然这个可能因人而异。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="肠镜前一天"&gt;肠镜前一天：&lt;/h2&gt;
&lt;p&gt;做肠镜前一天不能吃固体食物，只能喝液体。其实吃了固体食物也没用，因为马上会被泻药清干净。&lt;/p&gt;
&lt;p&gt;我拿到的泻药共两瓶，中午1点和晚上6点各喝一瓶，每次兑16oz的水，建议在15分钟内喝完，然后在接下来的1小时内建议再喝1升左右的水。这个泻药挺难喝的，兑了水之后量还不少，做好心理准备。&lt;/p&gt;
&lt;p&gt;置顶图中是一瓶泻药以及一起配的16oz的水杯。 喝完泻药就是不停地去厕所，直到拉出来都是液体为止。&lt;/p&gt;
&lt;h2 id="肠镜当天"&gt;肠镜当天：&lt;/h2&gt;
&lt;p&gt;做肠镜当天前往医院，怎么去医院他们不会管，但由于是全麻，我的医院要求必须有认识的人在肠镜之后来接我，不然不让check in。这个是为了保证病人安全，据说是因为之前有过一些出租车司机侵犯全麻患者的治安事件。&lt;/p&gt;
&lt;p&gt;到了医院直接会先登记，核实你的个人信息，以及提供接你的人的联系方式。等了会儿之后，转移到准备区域。在那里会先换上手术服，你自己的衣服都会脱掉放在袋子里（所以不用在意衣着是否宽松之类的）。&lt;/p&gt;
&lt;p&gt;之后躺到病床上，做些基本的检测，在手臂上打开静脉通道（IV）用来之后注射麻药。护士会过来解释一下全麻手术的流程，让你签同意书。麻醉师和肠道科医生都过来打了招呼，确认一下医疗病史（有没有药物过敏之类的）。&lt;/p&gt;
&lt;p&gt;都准备好之后稍作等待，转移到手术室。手术室里有三个人一起协作：肠道科医生，麻醉师，一名护士。进去之后带上氧气面罩，确认静脉通道没有问题，让我侧面躺着，然后…我就没有记忆了…&lt;/p&gt;
&lt;p&gt;醒来后医生在我床前，讲了一下肠镜的发现以及做了些什么操作。之后应该就能回去了。&lt;/p&gt;</description></item><item><title>纽芬兰深度攻略：东边那座有点独特的海岛</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/newfoundland-travel-log/</link><pubDate>Wed, 26 Jun 2024 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/newfoundland-travel-log/</guid><description>&lt;p&gt;我和老婆2024年6月初去了加拿大的纽芬兰与拉布拉多省（Newfoundland and Labrador）旅行了一圈。出发之前和沿途都做了不少功课，在这里分享给以后想去那里的朋友。&lt;/p&gt;
&lt;p&gt;确切地说，我们只去了纽芬兰岛，并没有去拉布拉多地区。纽芬兰岛位于加拿大甚至北美大陆的最东端，地势开阔，号称是冰岛的平替。我们最早想到这次旅行也是冲着这点去的。&lt;/p&gt;
&lt;p&gt;在做了一番研究并且实地玩了一次之后，总结下来纽芬兰有以下这些可以玩的点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;看海鹦&lt;/li&gt;
&lt;li&gt;看冰山&lt;/li&gt;
&lt;li&gt;看鲸鱼&lt;/li&gt;
&lt;li&gt;吃海鲜&lt;/li&gt;
&lt;li&gt;看自然地貌景观&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;下面逐一展开说一下。其中包含一些背景信息，而&lt;em&gt;斜体字&lt;/em&gt;是纯旅行攻略。讲完这些点之后，也会多说几句我们对这个地方深层次的探索和了解。&lt;/p&gt;
&lt;h2 id="海鹦atlantic-puffin"&gt;海鹦（Atlantic Puffin）&lt;/h2&gt;
&lt;p&gt;&lt;a href="https://www.allaboutbirds.org/guide/Atlantic_Puffin/overview#" target="_blank"&gt;海鹦&lt;/a&gt;
是纽省的官方鸟，也算是这里的旅游招牌。每年夏季，海鹦在大西洋的岸边筑巢繁衍，到了冬季则回到茫茫大海上过冬。最常见到它们的地方是冰岛、北欧、以及纽芬兰。其中，一半在北美能看到的海鹦都出现在纽芬兰的Witless Bay。呆萌可爱却又硬核到能抵御北大西洋寒冬的海鹦每年吸引无数的游客和自然爱好者过来一睹真容。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/nl/puffin.jpg" alt="正在筑巢的海鹦们" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;正在筑巢的海鹦们&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;我们这次也在Elliston的Puffin Viewing Site幸运地看到了不少海鹦&lt;/em&gt;。这个地方看海鹦不用坐船出海，停车之后步行约15分钟便能看到海鹦栖息的巨石。&lt;/p&gt;
&lt;h2 id="冰山"&gt;冰山&lt;/h2&gt;
&lt;p&gt;每年春季到初夏，纽芬兰东侧的海岸沿线经常能看到从北方格陵兰区域漂来的冰山。说出来你可能不信，当年撞沉泰坦尼克号的冰山号称就是从纽芬兰这边漂过去的。事实上，纽芬兰最东南端的Cape Race灯塔当时还收到了来自泰坦尼克号的无线电求援信号。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/nl/titanic.jpg" alt="泰坦尼克号路线图" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;泰坦尼克号路线图&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;说实话，碰瓷泰坦尼克号这事儿更多算是个吸引游客的噱头。但冰山本身还是很酷的自然现象：从极北区域漂流&lt;strong&gt;数千公里&lt;/strong&gt;远道而来，给我们展现它们的“冰山一角”（将近90%的体积都在水下）。虽然漂浮于海上，本身却都是由&lt;strong&gt;淡水&lt;/strong&gt;构成（来自北部寒冷地区降雨和空气中的水分冰冻而成），成了沿岸地区&lt;strong&gt;酿酒的上佳水源&lt;/strong&gt;（纽芬兰的冰川啤酒非常有名，在岛上处处可见）。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/nl/iceberg-beer.jpg" alt="当地餐馆里喝到的冰山酒" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;当地餐馆里喝到的冰山酒&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;要看冰山的话，强烈推荐Iceberg Finder这个网站&lt;/em&gt;。热心网友们都会在网站上记录何时何地看到了什么样的冰山，是最佳的信息来源。我们先是参加了一个看冰山的boat tour但一无所获，后来根据Iceberg Finder上的信息按图索骥，自己开车去岸边找，结果成功看到了冰山。一般来说，冰山都会出现在东侧沿岸，越往北出现的概率越大。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/nl/iceberg-valley.jpg" alt="纽芬兰东岸的冰山走廊（Iceberg Alley）" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;纽芬兰东岸的冰山走廊（Iceberg Alley）&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;另外，说到冰山酿酒，如果你平时会在吃饭时候点上一杯酒的话，建议你在从St. John&amp;rsquo;s出发、踏上更远的旅途之前，&lt;em&gt;先去Quidi Vidi Brewery看看打个卡&lt;/em&gt;。这是全省最大的酿酒厂，出产大量的冰山酒。在之后纽芬兰的旅途上，你几乎在每家餐馆酒吧都能看到由它们家酿造的各类本地酒，到时候会有熟悉的连结感——“啊哈，这个酿酒的地方我也去过！”&lt;/p&gt;</description></item><item><title>公司内部项目经理培训的一些笔记</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/internal-training-notes/</link><pubDate>Sat, 27 Aug 2022 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/internal-training-notes/</guid><description>&lt;p&gt;最近去芝加哥参加了为期一周的公司内部培训。原本并没有抱很高的期望，总觉得实战出真知，这种教学式的培训总像是空中楼阁，所以本想着此次主要是去摸鱼放假。但却意料之外地颇有收获，自己的小本子记得满满当当，故在此也记下一些学到的心得。&lt;/p&gt;
&lt;p&gt;这次培训名为Project Leader Foundation，是给刚升为项目经理（project leader）的我们这群人做好面对狂风暴雨的准备。何谓“狂风暴雨”？这里稍微补充一些关于project leader的背景（下文简称PL）——这个职级在大多数咨询公司的职业生涯里都是最艰难的一环。作为团队负责人，光是制定项目计划、管理好几十号人的项目时间表、交付一个价值几十万上百万美金的项目就已经相当不容易了，这就不提了。除此之外，在执行项目时，PL卡在各方势力的正中央，时时需要像走钢丝一般平衡好各个利益相关方，包括客户、老板（合伙人们）、以及所有团队成员。这几拨人全都通过PL互相沟通，所以PL身上的压力也是极大。另外从个人层面，新PL们之前的工作经验基本都是作为一个团队个体成员（individual contributor, IC），大都是画PPT、写代码、行业专业知识。而PL这个岗位的职责则需要非常不同的技能包，需要项目管理、人际关系管理等等，所以对于新PL而言挑战极大。&lt;/p&gt;
&lt;p&gt;公司自然知道新PL的种种难处，着实安排了不少培训。事实上，这已经是我参加的第三次PL培训了。第一次是在升职之前，主要培训了一些PL所需的日常操作知识，比如怎么管理项目预算。第二次是数据科学部门的专属培训，就在升职时间点前后，主要是讲了技术方面的内容。而这次的第三次培训，是发生在升职之后2-6个月之间，大家都已经有了些许当PL的经验，但同时很多人心里都有很多疑问，不知道如果做好这份差事。&lt;/p&gt;
&lt;p&gt;从培训内容来看，这次培训也没有什么特别出彩的地方。为期四天的培训中，前两天是公司内部更高级别的同事来做的培训，主要是传授一些管理流程、内容产出和利益相关方的经验。后两天则是由外部的培训公司来讲一些关于领导力、工作风格、合理分工、如何抗压等话题。这些东西听起来都是比较标准常规的培训话题，我自己看到日程的时候也是这么觉得的。&lt;/p&gt;
&lt;p&gt;让我觉得特别有收获的主要原因，是来自于所有参与培训的新PL们的坦诚分享。我学到最多的不是来自于前辈们或者培训师们所讲的东西，而是来自于同辈的实战经验和心路历程。从操作层面来说，这些实战经验都是其他人在真刀真枪做了项目、趟过坑之后总结出来的，对我而言非常适用；而从经历层面，大家互相坦诚分享自己的不安、焦虑、压力、困惑，也反倒让所有人都觉得自己不是孤独的一个人，反而更有团结感和内生力量，建立了更多自信。有个同事在最后总结的时候说：“我来参加培训之前其实非常忐忑，可能是因为我作为PL带领第一个项目并不算成功。我总觉得大家都是非常优秀的精英，看起来好像都毫无困难地承担了PL的职责，我不知道我会不会是一个非常失败的PL。而和大家聊了4天之后，才发现原来很多人跟我的心路历程都一模一样。这让我感到我自己并不孤独，也在面对以后的项目中更有了自信。”他基本说出了我们所有人的心声。下文会记录一些执行层面学到的经验技巧，但于我而言，这次培训的最大收获来自于和每个同辈的每次坦诚的对话，互相汲取和给予力量。&lt;/p&gt;
&lt;p&gt;以下是一些具体的笔记：&lt;/p&gt;
&lt;h2 id="对工作尤其是管理职位的一些新的认知"&gt;对工作、尤其是管理职位的一些（新的）认知：&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;很多时候这份工作好像要把你变成一个不同的人（比如我们很多人都被要求在会议上更加主动踊跃地发言，去掌握话语权。这对于内向的人来说好像是在要求你成为一个不同的人）。但实际上你只需要展现那些维度的行为就行，而不需要改变你自己的身份认知——我作为一个内向的人，完全可以在需要的时候刻意地去多说一些话（或者反过来，外向的人有意识地改变自己的行为，在会议中少说一些无关的话）。这些都只是改变行为，而不是改变人本身。&lt;/li&gt;
&lt;li&gt;Make this job work for you, not make yourself work for this job。很多时候我们都是牺牲自己的一些东西去完成工作上的事情（比如加班加点把手头的事情做完）。但很多时候（尤其是在管理岗位的时候），我们可以更好地去安排工作去减少自己（和团队）的牺牲，学着去利用别的工具途径。比如，解决工作量大的方法可能不是加班加点，而是找老板说服客户减少或者避免这部分工作。&lt;/li&gt;
&lt;li&gt;对于工作中的内容，非常明确地判断什么是达标就行（a hurdle to cross），而什么才是真正需要追求完美的，并据此来分配工作和精力。大部分情况下，很多东西就只需要达标就行。换句话说，就是极度严格地去执行80/20原则。&lt;/li&gt;
&lt;li&gt;大部分情况下，你不可能满足所有人、让所有人都开心。所以，你需要有目的、有策略地去选择不去满足哪些人的需求（choose who you disappoint）。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="如何更好地管理和培养下属"&gt;如何更好地管理和培养下属：&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;在不紧急的时候，给下属布置一个复杂庞大的任务，可以是超过TA能力范围的。如果TA能够基本完成，那说明能力很强，以后可以放心地将一些模块交给TA独立担当。如果TA从一开始就卡住了，那么说明能力很有限，很可能需要更多关照、以后布置任务的时候需要说得非常详细。&lt;/li&gt;
&lt;li&gt;在给下属提供反馈意见和改良建议的时候，尽量把缺点和优点联系起来，用优点带动缺点的改良。很多人可能会对缺点和建议有抗拒心理，以及不知道具体怎么做。比如我可能想告诉我的下属：你应该在会议里面多说话，但下属就算知道这是TA需要改善的点，也不知道如何入手。我可以联系优点这么说：你的分析内容非常出色，提供了很好的结果，你以后能不能在开会的时候多分享一下你的分析结果，这样大家都可以了解你的成果？&lt;/li&gt;
&lt;li&gt;在给下属提供反馈的时候，可以采用“Situation-Behavior-Implication-Action”的框架，即：在XX时候你做了XX，导致了XX的不好后果，其实你可以采用XX这样的不一样的行为。&lt;/li&gt;
&lt;li&gt;如果你希望下属承担更多独立任务，在谈话时可以更多暗示TA是任务的负责人。比如与其说“Let&amp;rsquo;s talk about task x. How are things going with step ABC?”，不如就说“Okay tell me about task X. What do you need from me?”&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="给自己打气度过艰难时刻的一些想法"&gt;给自己打气、度过艰难时刻的一些想法：&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;我自己的身心健康也是保证项目成功的重要一环，不是应该被牺牲的部分，战略上说应该是为了团队的成功而好好保障的。&lt;/li&gt;
&lt;li&gt;很多时候在一个项目上，别人（老板、客户、团队成员）更需要我，而不是我更需要别人。老板的原话是：we need you more than you need me。我手里的筹码可能比我所认为的要多。&lt;/li&gt;
&lt;li&gt;虽然我们总觉得应该告诉老板“I have everything under control”，事实上老板们很多作为过来人，也知道新PL带项目是初出茅庐，其实并不期望我们真的搞定一切。所以不要觉得自己一定要凡事都做到完美。&lt;/li&gt;
&lt;li&gt;我自己选择了这份工作，选择了这条路。多想想初心，以及也记得我可以选择不同的路。&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>阿拉斯加夏季旅行实用攻略</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/alaska-travel-log/</link><pubDate>Mon, 11 Jul 2022 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/alaska-travel-log/</guid><description>&lt;p&gt;我们一行四人今年夏天（2022年7月初）从加州出发，在阿拉斯加一共玩了8天。其中5天5夜租用了房车，游玩了Denali National Park, Matanuska Glacier, Kenai Fjords National Park，剩下的时间分别在Anchorage市中心和Katmai National Park，具体行程见文末。&lt;/p&gt;
&lt;p&gt;整理了一下我们旅途中的一些经验攻略，希望对以后想去那里旅行的人有帮助。本文尽可能提供一些&lt;strong&gt;实际操作层面的经验&lt;/strong&gt;，比较适合希望在出行前做好细致攻略的朋友。既有景点的注意事项，也有租房车的些许经验。希望能让你做好充足的出行准备，但同时也并不想提前给你剧透太多旅行的体验，靠自己得到的感受才更真实和有意义。&lt;/p&gt;
&lt;h2 id="katmai-national-park"&gt;Katmai National Park&lt;/h2&gt;
&lt;p&gt;Katmai应该是全美甚至世界范围内观赏棕熊的最佳去处。每年夏天棕熊都会在那里等待和捕捉回游产卵的三文鱼。在Katmai之内，又以Brook Falls最富盛名，是棕熊聚集最多的地方。这里需要注意一点，就是夏天的&lt;strong&gt;不同月份棕熊的出现规律也各不相同&lt;/strong&gt;，参见这张官方指南。如果想计划去Brooks Fall看熊，&lt;strong&gt;建议7月或9月去&lt;/strong&gt;，能够有最大的可能看到更多的熊。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/katmai-season.png" alt="看熊时间表" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;看熊时间表&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;推荐出发前通读一下这份&lt;a href="https://www.nps.gov/katm/learn/news/newspaper.htm" target="_blank"&gt;官方指南&lt;/a&gt;
，其中还有不少其它有用的信息。&lt;/p&gt;
&lt;h3 id="king-salmon和交通方式"&gt;King Salmon和交通方式&lt;/h3&gt;
&lt;p&gt;去Katmai基本上都需要先到附近的King Salmon小镇，然后搭乘当地的交通工具进入Katmai。&lt;/p&gt;
&lt;p&gt;King Salmon这个小镇&lt;strong&gt;基本没有手机信号&lt;/strong&gt;，我们一行四人合在一起拥有AT&amp;amp;T, T-mobile，Verizon和Mint四家运营商的手机，但基本没有一个有信号（只有T-mobile有过非常短暂的一段信号）。当地司机的通信方式都是靠无线电。另外，整个小镇的&lt;strong&gt;Wifi信号也十分有限&lt;/strong&gt;，我们住的Airbnb就只提供非常有限的Wifi，告诉我们如果想要更多Wifi就要去镇上的图书馆……所以最好在去King Salmon之前把行程安排和联络都落实妥当，不要太依赖抵达之后的通信。King Salmon当地基本只有一两家出租车公司，只收现金，没有Uber/Lyft。&lt;/p&gt;
&lt;p&gt;从Anchorage飞King Salmon可以搭乘Alaska Airline或者Ravn Alaska的航班。我们在搭乘Ravn Alaska去King Salmon时发现他们家是&lt;strong&gt;没有TSA安检&lt;/strong&gt;的（可能是因为都是小飞机的缘故吧），也就是说没有携带液体的限制。我们之前不知此事，白白扔掉了不少饮料和防蚊喷雾。&lt;/p&gt;
&lt;p&gt;从King Salmon到Katmai，基本分为水上飞机（floatplane）和水上出租（water taxi）两种交通方式。水上飞机略贵一些，但毕竟是独特的体验。水上出租基本就是有人过来把你接到港口然后坐40分钟的船到Katmai。在其它条件都相似的情况下，我会&lt;strong&gt;更推荐水上出租&lt;/strong&gt;一些，因为它受恶劣天气影响的可能性略微小一些。我们在抵达King Salmon那天听当地司机说第二天可能下大雨所以可能会取消水上飞机，虽然之后天气并没有那么糟，但可见水上飞机是最容易受天气影响的。&lt;/p&gt;
&lt;h3 id="brooks-camp"&gt;Brooks Camp&lt;/h3&gt;
&lt;p&gt;从水上出租下船之后会先抵达Brooks Camp的Visitor Center。如果是第一次来，需要先经过一个10分钟左右的防熊安全培训。之后便可自由在附近区域观赏棕熊。最佳的Brooks Falls Platform距离Visitor Centor需步行约20分钟左右。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/brooks-camp-area-map.png" alt="Brook Camp地图" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;Brook Camp地图&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;Brooks Falls Platform在旺季人多时需要排队。平台最多可容纳40人，如果超过这个人数，会有ranger为每组人登记计时，每人每次可以在平台上待30分钟，出来之后可以重新排队，没有次数限制。在旺季尤其是下午的时候，排队时间可能会超过1.5小时。所以我会非常建议&lt;strong&gt;当天越早去越好&lt;/strong&gt;。我们是坐7点的水上出租，8点Visitor Centor一开门就做了培训然后直接去看熊。第一轮无需排队，看了大概一个多小时。出来重新排队后第二轮等了不到半个小时。再出来时大概是上午11点左右，此时就需要排至少1个小时以上的队了。&lt;/p&gt;</description></item><item><title>迈阿密周围旅游攻略</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/miami-travel-log/</link><pubDate>Sun, 02 Jan 2022 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/miami-travel-log/</guid><description>&lt;p&gt;我和老婆今年年底（12/24/2021-12/31/2021）这段时间在迈阿密一带玩了一圈，大致行程如下：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Day 1: （大部分时间在飞机上）, South Beach&lt;/li&gt;
&lt;li&gt;Day 2-4： Everglades National Park（大沼泽地国家公园）, Biscayne National Park（比斯坎国家公园）&lt;/li&gt;
&lt;li&gt;Day 5-6: Key West&lt;/li&gt;
&lt;li&gt;Day 7-8： Miami, South Beach
我俩都是更喜欢自然风光和野生动物多过人文景观，以下的攻略总结也可能会在这方面有些偏向性。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="总体经验"&gt;总体经验&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;12月底到2月份左右是这个地区的黄金季节，刚出雨季没多久，没有很多蚊子，气温适宜，也没有很潮湿，国家公园里的野生动物也都比较活跃。&lt;/li&gt;
&lt;li&gt;总得来说，如果能在这段时间内避开假期高峰，旅行体验会更佳，尤其是在城市地区和人文类景点。我们去的时候是圣诞到新年这段时间，游客非常多，尤其是Key West简直人满为患。看着人头攒动的酒吧、饭店、景点，除了让我们对暴露新冠的风险瑟瑟发抖之外，也降低了旅行的体验，到哪儿都要排很久的队。&lt;/li&gt;
&lt;li&gt;在假期这段时间去Key West的话，往Key West方向的道路几乎天天都会堵车。虽然Google Maps说是3个小时左右能从Homestead开到Key West，实际上会耽搁更久，一口气开完的话可能要4个小时左右。如果你要卡时间点制定行程的话可能需要考虑这一点，预留堵车的时间。&lt;/li&gt;
&lt;li&gt;我们租的车有个轮胎开了几天之后有低胎压警告，打了几次气过了一段时间又会出现。去了好几个不同的租车公司网点，都没有可以替换的车（既是因为高峰时期，也是因为新冠以来一直存在的库存短缺）。最终我们找了和租车公司合作的修车店，花了一个小时修理了这个轮胎问题，费用直接记在租车公司账上，不需我们支付。如果你们也碰到这样的车辆问题而租车公司没法替换的话，可以直接问问租车公司的员工附近有没有这样的修车店。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="everglades-and-big-cypress-national-preserve"&gt;Everglades (and Big Cypress National Preserve)&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;非常推荐Shark Valley的Tram tour&lt;/strong&gt;。沿途能看到很多动物，路上有ranger的解说。一般是整点出发，总共2个小时，比较建议提前预定（尤其是高峰时期）。我们看到不少攻略都是没有提前订，到了那里发现时间凑不上或者没位子，错过了非常好的体验。当然你也可以选择租自行车，骑完一整圈可能也要2-3个小时，自由度更高一些，可以想停就停，野生动物看个够。不过没有解说，也更费体力一些。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;也非常推荐Gulf Coast的Ten Thousand Islands Boat Tour&lt;/strong&gt;。坐船一个半小时，既在附近海岸浅水地区寻找鸟类、乌龟、和海牛（manatee），也到开阔海域寻找海豚。我们去的那次正好遇到一个小的野生海豚群，绕着我们的船玩耍并跟在我们船后面冲浪，完全值回票价。&lt;/li&gt;
&lt;li&gt;除了以上两个Visitor Centor之外，Everglades的另外两个Visitor Centor我们体验比较一般。Ernest F. Coe提供了不少信息，也有一些tour可以参加，但附近（包括不远处有名的Anhinga Trail）的景色和野生动物丰富程度并不如Shark Valley。而Flamingo有点像Gulf Coast，都是面向海湾，可以坐boat tour或者租水上用具。也许是我们在Gulf Coast的体验太好，所以Flamingo有点显得平平无奇。&lt;/li&gt;
&lt;li&gt;除了四个Visitor Center之外，&lt;strong&gt;强力推荐北面41号公路旁边的Loop Road Scenic Drive&lt;/strong&gt;。这是一段开车可以经过的林间小路，风景优美，也能看到很多动物，甚至鳄鱼可能就趴在路边。我们在Everglades里面读到过但没有看到过的动物在这里基本都看到了。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="biscayne"&gt;Biscayne&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;这个国家公园有95%在水下，非常独特。如果你是划船或者潜水爱好者，这里会非常适合你。在Biscayne National Park Institute可以预约各种相关的tour或者用具租赁。&lt;/li&gt;
&lt;li&gt;之前在别的攻略上看到了一些潜水不佳的体验，加上队友不会游泳对此有点恐惧，于是我们没有选择潜水相关的tour，而是去参加了一个Heritage Tour，总共3个小时，坐船在附近海域转了一圈，到北面的Boca Chita Key上面待了一阵。沿途向导会讲一些当地的历史和野生动物知识，内容平平，Boca Chita Key还算比较好看。&lt;/li&gt;
&lt;li&gt;我们事后总结，可能对于我们来说这个公园更好的玩法是租kayak划到海边红树（mangrove)丛中，既有景色也可能有野生动物。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="the-keys"&gt;The Keys&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;非常推荐Big Pine Key和旁边的No Name Key。这里是本地特有物种key deer的聚集地，它们是一种体格比较小的白尾鹿。在这里有非常高的概率能看到这种野生鹿，我们大概看到了七八只。这块区域游客不多，我们之前在各种网上的攻略里都没有看到过，只是在Lonely Planet上看到过一次，于是便去看了看，很值得。&lt;/li&gt;
&lt;li&gt;Key West的日落很好看，但热门的观景点肯定人很多，不妨试试不那么热门的地方。我们在Key West的那天日落的时候正好在Key West International Airport附近，差不多是Fort East Martello Museum的位置，从那里看日落也非常开阔美丽，同时也没有太多游客。&lt;/li&gt;
&lt;li&gt;我们迅速打卡了一些Key West的标志性景点（比如Southernmost point, Sloppy Joe&amp;rsquo;s, Duval Street沿途的一些店），都因为游客太多而没有逗留，体验一般。附近负有盛名的Bahia Honda State Park我们也是开到门口发现进去的车辆排起了长龙，于是当即决定放弃了。&lt;/li&gt;
&lt;li&gt;The Keys沿途酒店的设施和体验各不相同，选择的时候可以根据你的偏好仔细选择——有的交通方便但没有什么设施，有的交通不便但设施齐全。我们住的几家之中，在Courtyard by Marriott Marathon Florida Keys的体验最佳。离Key West固然有些远（1个小时车程），但离附近的几个景点（Bahia Honda, Big Pine, Turtle Hospital等等）却是很近。而且他们家有一小片自己的沙滩，有躺椅也有遮阴树叶，在那里躺躺颇为舒适。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="miamisouth-beach"&gt;Miami/South Beach&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;South Beach的Ocean Dr沿途可以走走逛逛，到了晚上很繁华热闹，感觉和洛杉矶Santa Monica的Ocean Ave有些相似。因为我们住在洛杉矶，所以也没有觉得太惊艳。&lt;/li&gt;
&lt;li&gt;负有盛名的古巴餐馆Puerto Sagua确实不错。不过也不要把预期设得太高哈，不然即便食物可口，也很难达到超高的预期。我觉得我一开始就有点预期过高，觉得“就这？”……后来仔细想想，确实还是一家很不错的餐馆。对于其它有名的餐馆（CVI.CHE 105, Joe&amp;rsquo;s Stone Crab)也应是如此。&lt;/li&gt;
&lt;li&gt;市中心的Little Havana感觉也平平，在那里逛了逛吃了顿午饭，有几个可以拍网红照的地方，除此之外似乎没有什么别的亮点。&lt;/li&gt;
&lt;/ul&gt;</description></item><item><title>运筹学在实际工作中如何运用</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/using-or-in-reality/</link><pubDate>Tue, 09 Feb 2021 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/using-or-in-reality/</guid><description>&lt;p&gt;在咨询公司给很多不同行业用基于运筹学的技术做过各种解决方案。分享几个有代表性的例子：&lt;/p&gt;
&lt;h2 id="石油公司钻井船工程师调度"&gt;石油公司钻井船工程师调度&lt;/h2&gt;
&lt;p&gt;钻井船上的工程师团队需要共同处理复杂的技术问题，包括科学钻探、采油、修井、船体维护等等。除了不同的技术工种各自术业有专攻之外，有些复杂任务需要不同工种协作完成。另外，很多复杂机械设备也有使用限制，比如不能多人同时使用、或者一天使用累积时间不能超过8个小时等。综合这些复杂因素，一个优化的调度机制就显得极其重要，可以让工程师的效率最大化，同时最大程度降低生产事故的可能性。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/operations-research/agbami.jpg" alt="钻井船" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;钻井船&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;这里部署的解决方案就是用运筹学中的&lt;strong&gt;车间调度问题&lt;/strong&gt;（Job Shop Scheduling）为框架建模。&lt;/p&gt;
&lt;h2 id="工业电池公司供应链"&gt;工业电池公司供应链&lt;/h2&gt;
&lt;p&gt;工业电池制造过程中的一个商业难点是：多少原材料应该直接买，而多少材料应该靠回收废电池循环利用。一般情况下回收电池成本很低，但是取决于不同的加工技术，循环利用率（即从废电池中提炼出来的可使用原料占比）各不相同，成本也有差异。所以整个供应链网络需要综合考虑所有成本（采购、提炼、运输、存储），进而做出最优的供应链选择——在哪里买多少原材料、从哪里回收多少废电池、分别运送到哪些地方进行进一步处理、甚至包括送货到下游零售商家的时候顺便带多少废电池回来。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/operations-research/battery.jpg" alt="废电池循环利用" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;废电池循环利用&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;这里部署的解决方案是求解一个运筹学中的&lt;strong&gt;网络优化问题&lt;/strong&gt;（Network Flow Problem）。&lt;/p&gt;
&lt;h2 id="汽车4s店款式配置"&gt;汽车4S店款式配置&lt;/h2&gt;
&lt;p&gt;买车的顾客希望走进4S店的时候各种款式齐全，卖家也希望你看中一款之后直接提走，等得越久变数越大。然而4S店空间有限，不可能做到车库里每款都有。所以在各个门店分别配置什么款式、各自配置多少就是一个复杂的决策。在大农村地区的门店就要多放些卡车；都市区的门店可能就要多些混合动力的款式。另外即便是同一款车，还要考虑到颜色、尺寸、附加选项的多样性。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/operations-research/dealership.jpg" alt="4S店" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;4S店&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;这里有很大一部分决策需要基于需求预测，同时真正执行的时候也可以通过运筹学中的&lt;strong&gt;背包问题&lt;/strong&gt;（Knapsack Problem）建模，来决定怎样给每家店进行款式配置，使得在空间和成本限制范围内最大化预期收益。&lt;/p&gt;
&lt;h2 id="主题游乐公园季节性员工招募与调配"&gt;主题游乐公园季节性员工招募与调配&lt;/h2&gt;
&lt;p&gt;季节性是运营主题公园的重要因素：大部分高峰期集中在暑假和节假日。因此，很多主题公园的员工构成中有很大一部分是季节性临时员工，便于应对极具弹性、迅速变化的入园顾客数量。那么在每个忙季，需要招多少临时工、分别分配到什么岗位？这里主题公园既要考虑到短期直接收益（比如园区里的各个零食小摊都要有足够人手来保障餐饮营收），也要考虑到长期收益（需要有足够人力来疏导排队、减少排队时间，提高游客满意度），还要考虑到临时工的个人情况（比如能否操作复杂设施、工作时长限制）。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/operations-research/theme-park.jpg" alt="主题公园" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;主题公园&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;综合各方因素，可以使用运筹学做出最优决策。这里部署的解决方案是先用一个&lt;strong&gt;混合整数规划模型&lt;/strong&gt;（Mixed Integer Programming / MIP）构建最优的人力方案，再求解一个&lt;strong&gt;排班问题&lt;/strong&gt;（Scheduling Problem）将具体工作分配到每个员工。&lt;/p&gt;</description></item><item><title>AWS认证解决方案架构师SAA-C02考试经验</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/aws-certificate/</link><pubDate>Sun, 22 Nov 2020 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/aws-certificate/</guid><description>&lt;h2 id="背景"&gt;背景&lt;/h2&gt;
&lt;p&gt;我目前在美国一家咨询公司任职数据科学家。在日常工作中，除了本职的搭建和实施数据模型，也经常会和客户的IT和数据部门打交道，帮助他们设计合理的系统架构，以便发挥出数据模型的最大价值。在这个过程中，逐渐对AWS的很多架构设计和服务耳濡目染，因此想系统地学习一下相关的知识。作为新手，也顺理成章地以助理架构师资质（SAA-C02）为目标。经过一个月的准备最终顺利通过。如果你和我一样，之前对AWS架构不甚了解，想以助理架构师作为系统知识学习的第一步，此文或许会对你有些借鉴意义。&lt;/p&gt;
&lt;h2 id="关于认证助理级解决方案架构师saa-c02"&gt;关于认证助理级解决方案架构师（SAA-C02)&lt;/h2&gt;
&lt;p&gt;AWS认证解决方案架构师是亚马逊诸多认证资格的其中之一。其它认证资格也有云计算开发者、网络安全专家等等。在这些认证考试中，架构师（Solution Architect）的内容相对比较全面，可以帮助你对AWS的云计算服务有比较广泛的了解。架构师的资格认证分为助理级（associate）和专家级（professional），一般如果不是资深从业人员，都是从助理级（Solution Architect Associate，简称SAA）开始考起。由于在2020年7月进行过改版，对考试内容进行了更新，因此现行的考试版本被称为SAA-C02（以前的老版本是C01，已经不再使用）。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/aws-certification.jpg" alt="官方进阶示意图" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;官方进阶示意图&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;AWS的官方介绍会告诉你，经过认证的架构师会知道“如何使用 AWS 技术构建和部署安全可靠的应用程序的知识”，可以“在 AWS 上设计可用、经济高效、容错且可扩展的分布式系统”。如果你从事相关的工作，这些技能可能都会对你的日常工作有所帮助。而即便是在日常生活中，这些知识或许也能派上用场——你可以自己搭建一个VPN用来翻墙、搭建一个博客网站用来发文章照片视频、或者给你的爬虫程序搭建一个稳定持久的架构。通过SAA的学习，以上这些操作都应该可以信手拈来。在这个信息数字化时代，&lt;strong&gt;个人级别的信息处理容量也会逐渐成为每个人的核心竞争力的一部分，而像AWS这样的云计算架构则是帮助你培养这方面能力的重要助力&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="准备过程"&gt;准备过程&lt;/h2&gt;
&lt;p&gt;我这次总共用了一个月左右准备。主要步骤如下：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;听一遍A Cloud Guru网课&lt;/strong&gt;（下文简称ACG）。这门网课在Udemy上大概是10美金左右（常年打折），包括2套模考题。网课总共大约18小时，基本覆盖了所有重要的考点，并且也会随着考试内容的变化更新课程的内容。我觉得这种网课形式是比较好的入门课程，比起直接读很多文档要容易接受得多，既能在比较短的时间内迅速接触AWS架构的重要知识点，又是被提炼过、专门针对助理架构师考试的内容。网课也包含一些Lab，让你自己动手实际操作，在实践中巩固知识，这些练习也很有帮助。当然，网上还有很多其它别的网课，很多网评也都不错，你可以自行斟酌选择。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;听AWS的官方介绍课程Exam Readiness&lt;/strong&gt;。这个免费课程是AWS对这个考试的官方详细介绍，大概2个小时左右。这个课程总结了一下考试范围包含的四个主题：弹性架构（30%），高性能架构 （28%），安全的应用程序和架构（24%），成本优化架构（18%）。在初步了解入门知识之后，这门很短的网课可以帮你梳理一下知识结构，将AWS各个服务的知识点和考点联系起来。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;挑重点的章节（S3，EC2，VPC等）读了一下AWS的FAQ&lt;/strong&gt;。AWS上有很多官方文档可以读，除了FAQ之外也有每项服务自己的网页以及白皮书。我一开始雄心勃勃想要全都读完，后来发现很多东西和考试的相关性不大，所以建议选择性地阅读，挑重要的部分重点掌握。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;读Jayendra的&lt;a href="https://jayendrapatil.com/" target="_blank"&gt;博客&lt;/a&gt;
&lt;/strong&gt;。如果你浏览一下网上准备SAA-C02的攻略，会发现很多文章都提到Jayendra的博客。这位印度小哥是资深专业人士，在博客上详细整理了SAA考试的知识点（也还有其它AWS考试），十分完整全面。推荐在你有了自己完整的知识体系之后和他的博客做交叉对比，拾遗补缺。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;做Whizlab的14套专题测试&lt;/strong&gt;。如果你买Whizlab的模考题，他们还会附赠14套专题考试，比如EC2、S3、API Gateway等重点考核内容都是单独的专题。这14套题可以作为知识学习向实际考试的过渡 ，开始逐渐将之前所学的内容应用到考题中。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;混着做Tutorials Dojo（下文简称TD）、Whizlab和ACG的模考题&lt;/strong&gt;。TD上有6套题，Whizlab有7套，ACG的网课最后有2套题，总共加起来我做了15套题。这些模考题中，ACG的2套题不算很标准：正式考试是65题共130分钟，但这2套题大概是70多道题，时间5个小时，等同于不限时。所以ACG的题目更多是扫荡知识点，建议早点做，不要作为模拟真实考试的依据。剩下的两组模考题都是标准形式，各是10美金左右，内容方面总体也和真实考试比较接近，而且对每道题的答案也有比较完整的解释。不过，所有三个来源的模考题都有少数的题会比较细枝末节，问某个具体服务的具体细节（比如题目4个选项中哪个是不属于Route 53支持的12种DNS record type之一），这种很犄角旮旯的记忆题在实际考试中基本不会出现，在备考过程中不需要过于纠结。实际考试还是比较“光明正大”的，不会问得很刁钻，基本都是考核你对重要的服务掌握得是否扎实。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;从&lt;strong&gt;备考时间分配&lt;/strong&gt;来说，差不多是前2周用来积累知识（步骤1-4），后2周通过模考做题来拾遗补缺（步骤5-6）。在最后模考的阶段，不像早期上网课或者读文档可以利用碎片时间，你可能需要规划好整段的时间（每次约2个小时），用来做模考和复盘。考试限时是130分钟，我自己模考做题本身不需要那么久，差不多每次1个小时多一点就能把题做完，但提交之后还要花将近一个小时把所有的题都过一遍，看看自己为什么做错，以及为什么做对（确保不是蒙对的）。&lt;/p&gt;
&lt;p&gt;如果你是完全的新手，之前完全没接触过AWS，我会建议你多预留一些时间，尤其是在ACG的课程和Jayendra的博客上多花些时间。我大约2年前（考试版本还是C01的时候）也曾想过要考，当时已经把ACG上的网课差不多上了一遍。后来因为工作上突然忙了起来就没去考。而且在日常工作中也会用到EC2、S3等一些基本服务，所以总体来说之前还算是有一点熟悉度。这次备考的时候重新完整看了一遍ACG的网课，有不少内容都更新过了，但也还是有熟悉的部分。你如果是纯新手，可能会需要更多时间熟悉一些基本概念。&lt;/p&gt;
&lt;p&gt;从&lt;strong&gt;考试策略&lt;/strong&gt;来说，模考和实际考试时都可以标记任何一道题目，之后回来再重新考虑。另外，SAA的考试是答错不扣分的，所以即便你完全没有把握，也应该盲选一个答案。综合这两点，我自己的策略是先把所有的题目都过一遍，如果碰到不确定的题不要耽搁太久，先随便猜个答案然后标记一下，等把所有的题都过了一遍了之后再回来看。这样的话不会因为部分的难题而失去对全局的掌控。最后即便来不及看完剩余的难题，也不会因此丢更多的分。&lt;/p&gt;
&lt;p&gt;最后附上一些私货：我自己在备考过程中记录整理的&lt;a href="https://github.com/MarkFu/AWS_SAA_study_material/blob/main/SAA-C02_notes.md" target="_blank"&gt;所有笔记&lt;/a&gt;
。不过如果你像我一样走完1-6这个流程的话，你应该也有一套这样的笔记，也不需要参考我的了。&lt;/p&gt;
&lt;h2 id="考试体验"&gt;考试体验&lt;/h2&gt;
&lt;p&gt;我人在美国洛杉矶，2020年11月参加的考试。因为疫情的关系选择了PSI的网上考试（proctored exam），全程在网上进行。大致流程和感受如下：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;网络考试需要你在一个独立私密的房间，房门关闭，桌面没有杂物。考试前30分钟可以登录，系统会要求你下载一个考试专用的浏览器。你可以在考试之前在注册考试的账号中下载一个类似的浏览器提前体验一下，但到实际考试时还是要下那个专用于你这场考试的。&lt;/li&gt;
&lt;li&gt;打开浏览器后，它会自动检测你的系统，确保你所有不必要的进程都被关闭，比如Chrome之类的其它浏览器。我当时开了个虚拟机，也被检测出来需要关闭。所以这里比较建议你用自己的电脑，不会出现什么权限问题以至于没法关闭某些进程。&lt;/li&gt;
&lt;li&gt;检测通过之后，系统会要求你用摄像头拍摄一张你ID的照片，然后是拍摄你自己的照片，用于身份验证。&lt;/li&gt;
&lt;li&gt;这些自动流程完毕之后稍等片刻，会有监考人员（proctor）通过对话框和你交流，你看不到他/她，但是他/她能看到你。监考人员会让你用摄像头展示一下房间和桌面，你的手臂（应该是确保没有小抄），你的双耳（应该是确保没有佩戴耳机之类可以作弊的设备），然后就应该可以开始考试了。&lt;/li&gt;
&lt;li&gt;我个人的体验是PSI的考试专用浏览器不是很稳定。之前自己用测试浏览器的时候就出现过网络信号不好的报错信息然后自己闪退的情况。实际考试的时候我用了专门的网络，确保我这边的网络信号没有问题，但做到第10题左右，它也还是出现了网络信号不好的报错信息，然后整个系统就自动关闭了。我重新打开登录了系统，等了大概15分钟左右，总算重新回到了原来的界面和进度，但对于心态和节奏还是产生了一些波动的。对此我只能说，&lt;strong&gt;你需要尽可能保证你自己这边的网络情况良好，然后做好可能会闪退的心理准备。闪退之后理应可以回到原来的进度，不用过于焦躁&lt;/strong&gt;。&lt;/li&gt;
&lt;li&gt;我觉得总体来说实际考试的难度比我之前做的模考题要略难一点。模考中有不少送分题，正式考试中几乎没有。实际考试中很多题都比较考验你对核心知识点掌握的是否扎实，有不少干扰选项相当有诱惑性。相比模考而言，我标记了更多题目做回顾，最终考试用掉的时间也比我自己模考要久一些。&lt;/li&gt;
&lt;li&gt;考完提交答案之后，会有大概10个系统反馈问题（比如你对注册考试的流程是否满意这样的问题）。提交之后，你就能马上看到你是否通过了考试，然后详细的分数和报告会在5个工作日之内发给你（我实际上第二天就收到了）。如果你看到了类似“Test has completed and your results have been saved”之类的信息，你就可以直接关掉窗口，结束这场考试了。我当时还不确定是否还有后续的步骤，问了一下监考人员，但监考人员完全没回答我，我就只能关掉了窗口，后来发现也确实没什么问题。&lt;/li&gt;
&lt;li&gt;总得来说，我自己的体验是整个考试的系统和监考人员不是特别靠谱，会有一些小的掉链子的地方，但应该不至于有什么大问题。&lt;strong&gt;如果你在实际考试中碰到这种类似的小插曲，不要焦躁，控制好自己的心态，不要让它影响到你完成整个考试&lt;/strong&gt;。&lt;/li&gt;
&lt;/ol&gt;</description></item><item><title>战略规划中有哪些常用的数学模型和方法</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/math-model-in-strategic-planning/</link><pubDate>Wed, 21 Oct 2020 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/math-model-in-strategic-planning/</guid><description>&lt;p&gt;&lt;em&gt;&lt;a href="https://www.zhihu.com/question/426189960/answer/1536349504" target="_blank"&gt;点此&lt;/a&gt;
见原知乎回答&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;战略规划所需的精度基本上用不着数学模型。数学模型更多被用在&lt;strong&gt;战术&lt;/strong&gt;制定，而不是&lt;strong&gt;战略&lt;/strong&gt;规划上。
硬要说的话，可能是线性回归吧，不会更复杂了。&lt;/p&gt;
&lt;p&gt;举个例子：比如我是一家卖运动饮料的大型外企，现在想要制定是否进入中国市场的战略。在这个过程中，我会考虑许多非量化的因素——比如消费者偏好、政府监管、进出口贸易政策、竞争环境、供应链布局等等。当然也会有一些量化的因素，比如市场体量、落地成本等等。这些量化的部分只是所有决策因素中的一部分，并没有特别重要。我们只需要大致知道市场未来5年的体量即可，并不需要——也不可能——预测自己具体的营业收入。切记：战略不是“我们明年要在中国市场达到1千万营收”，而是“我们要在未来5-10年在中国市场立足，建立竞争优势和完成供应链布局，使得中国市场成为我们新的全球增长点。”所以对于支持这样的战略决策，在量化的部分用线性回归预测一下市场体量就已经绰绰有余了。战略被拆解成目标和手段之后，数学模型才能起到更大的作用——比如在哪些城市建厂可以优化供应链的整体成本。&lt;/p&gt;
&lt;p&gt;事实上，在企业目前的实际操作中，在这些战略问题上很多时候就只是&lt;strong&gt;看看过去几年的数据然后拍个脑袋&lt;/strong&gt;。这么做大多数时候也没毛病，因为行业的总体量足够大，大部分时候也足够稳定，所以偏差不了多少。2018年我国功能饮料零售总额约为460亿元，哪怕预测偏差个几亿元，也只是零头而已。&lt;/p&gt;
&lt;p&gt;以目前企业的信息化程度，&lt;strong&gt;人们都更相信拍脑袋而不是数据模型&lt;/strong&gt;。对于未来5年运动饮料市场的趋势预测，假如你殚精竭虑搞了个复杂的机器学习模型，算出来每年8.46%的增长率（精确到小数点后两位哦），会有决策者来问你：为什么不是9%？为什么不是20%？数学模型是怎么算出这个数的？你费尽心思去解释这一切，到头来还不如有人说“过去五年的增长率大致为8%并且逐年递增，所以未来五年大约是每年10%”。所以你看，这里线性回归已经是天花板了。&lt;strong&gt;任何需要复杂数据模型来解释的论据都很难被作为战略决策的依据，因为大部分人（大部分决策者）搞不懂，也不需要搞懂到那么精细的程度。&lt;/strong&gt;&lt;/p&gt;</description></item><item><title>加州山火，是从哪里开始出错的？</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/california-wildfire/</link><pubDate>Wed, 16 Sep 2020 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/california-wildfire/</guid><description>&lt;p&gt;2020年9月初的一天，美国加利福尼亚州人民从昏暗的晨光中醒来，发现自己仿佛一觉睡到了世界末日，红橙色的天空映衬着远方的火光和烟雾。这一刻，加州人民再次感受到了被山火支配的恐惧。&lt;/p&gt;
&lt;p&gt;为什么要说“再次”呢？因为山火对于加州来说并不陌生。2000年以来，加州平均每年要经历8千多场山火，平均每年要烧掉75万英亩（约合3千平方公里），相当于一年烧掉一个优胜美地（Yosemite）国家公园，或者是半个上海。&lt;/p&gt;
&lt;p&gt;但2020年格外不同。不仅因为刚刚才到九月初，焚烧面积就已经直追过去的任何一年，更因为很多人这次直观感受到了地狱般的景象和生化级的空气污染。于是，拷问加州人民灵魂的问题再次摆在了所有人的面前：&lt;strong&gt;为什么加州的山火那么彪悍&lt;/strong&gt;？&lt;/p&gt;
&lt;p&gt;仔细一琢磨这个问题，你会发现这其实包含了&lt;strong&gt;偶然因素&lt;/strong&gt;和&lt;strong&gt;长期因素&lt;/strong&gt;两个层面——分别对应了“为什么今年山火能烧出世界末日的程度”以及“为什么加州的山火年年成灾”这两个不同的问题。就像是问“明朝为什么会灭亡”：一种回答是“李自成起义打进了北京推翻了明王朝”，另一种回答是“明王朝经年累月的腐朽制度”。这其实是两个不同维度的回答。很多关于山火的报道分析会把两者混为一谈，容易混淆视听，因此我们需要谨慎地加以区分。&lt;/p&gt;
&lt;p&gt;对于加州的山火，造成今年创历史记录规模的偶然因素并不难找：高温和雷电。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;em&gt;&lt;strong&gt;高温&lt;/strong&gt;&lt;/em&gt;：今年8月到9月，加州经历了两波历史级的高温。在南加，洛杉矶郡9月6号记录到了摄氏49.4度的历史最高气温；在北加，多个地区打破了历史同期最高气温记录。极端的高温使得植被变得异常干旱，成为了山火的最佳燃料，任何一星半点的火花都极易造成一场大火。&lt;/li&gt;
&lt;li&gt;&lt;em&gt;&lt;strong&gt;雷电&lt;/strong&gt;&lt;/em&gt;：这“一星半点的火花”从哪里来？最常见的自然因素就是雷电了。不巧的是，今年加州（主要是北加）遭遇了前所未见的雷电活动。仅8月16日一天，湾区就被雷劈了2500多次。加州有记录以来焚烧面积最大的前四个山火中，有三个是由今年8月份的雷电导致的（August、LNU和SCU）。&lt;/li&gt;
&lt;/ul&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/wildfire/thunder.jpg" alt="图片来源：Noah Berger (AP)" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;图片来源：Noah Berger (AP)&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;高温和雷电两者叠加在一起，再加上加州原本就秉承着年年受山火洗礼的“优良”传统，无异于火上浇油，因而使得今年达到了历史级的规模。&lt;/p&gt;
&lt;p&gt;那么为什么加州每年都要遭受山火荼毒呢？相对于偶然因素，加州山火的&lt;strong&gt;长期因素&lt;/strong&gt;要难找得多，不仅因为多种成因交织在一起错综复杂，更掺杂了政治经济因素，多方各执一词，搅成了一团浑水。咱们试着来捋一捋。&lt;/p&gt;
&lt;h2 id="季风"&gt;季风&lt;/h2&gt;
&lt;p&gt;先从最没有争议的原因说起：&lt;strong&gt;季风&lt;/strong&gt;。每年到了9月份，从美国西南部内陆的大盆地和莫哈维沙漠都会向加州刮来两股季风：大恶魔焚风（Diablo）和圣安娜焚风（Santa Ana）。这两个一听名字就知道不好惹的季风，前者吹向北加，后者吹向南加。它们裹挟着热量，快速吹过加州广袤的山地树林地区，风助火势、火借风威，“只需要一分钟，一团野火就能烧成一个足球场那么大”。这种气象现象每年都会发生，躲无可躲，就像是中国夏季东南沿海的台风、江南地区入夏前的梅雨季、北方入冬之后的“来自西伯利亚的寒流”，这两个焚风也是加州人民每年都要经受的历练。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/wildfire/wind.jpg" alt="图片来源：地球知识局" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;图片来源：地球知识局&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;h2 id="树林"&gt;树林&lt;/h2&gt;
&lt;p&gt;除了季风这个因素之外，加州可以给山火提供的燃料也异常充沛。首先是树林面积庞大：2016年的数据显示，加州的森林面积在美国仅次于的德克萨斯和阿拉斯加两个州（而那两个州都没有焚风这样的土特产），约3300万英亩，占整个州的三分之一。其次，加州偏干旱的气候条件将这些树木变成了山火的上佳燃料。过去的10年里，加州都处于或多或少的干旱状态，今年2月份北加部分地区更是几乎滴雨未下，创下了历史最低降雨记录。在如此干旱的状态下，连偶尔的甘霖甚至都起到了反作用——2017年的北加和今年的南加在年初雨季时的雨量都达到历史平均甚至以上的水准，使得当地的植物重新复苏生长。然而到了夏季干旱和季风到来之时，这些繁茂的植物在干枯之后反而成为了更多的燃料。所以你可能很难想象，像我这样的洛杉矶居民在今年3月份的日子里看着窗外的滂沱大雨，心里浮现的却是未来熊熊山火的恐怖景象。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/wildfire/fire-threat.jpg" alt="加州高危山火地带分布（图片来源：LAO）" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;加州高危山火地带分布（图片来源：LAO）&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;h2 id="防火政策"&gt;防火政策&lt;/h2&gt;
&lt;p&gt;像季风和雷电这样的自然因素是人力很难掌控的，但树木就不同了——人类可以采取行动来影响森林的面积，进而控制山火的风险。也正因如此，不给力的森林防火政策既是山火肆虐的原因之一，也是人类推卸责任、互相甩锅的最大焦点。为了搞清楚其中的来龙去脉，咱们先说说给力的防火政策应该是什么样的，再看看现状为什么不是那样的。&lt;/p&gt;
&lt;p&gt;要说给力的防火政策，我们来看一下加州政府机构的两份官方报告。一份来自于加州林业与火灾预防部（CAL FIRE），另一份来自于加州立法分析办公室（LAO）。前者是加州首当其冲负责山火的部门，后者是向加州立法机关提供中立分析的机构。两份报告都详尽罗列了需要采取的防火措施，CAL FIRE的报告甚至给出了35个需要立刻采取防护行动的区域。这些防火措施总结起来基本就是尽可能减少山火的燃料（fuel management），具体措施包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;植物去除（thinning）&lt;/strong&gt;：砍伐易燃树木和去除枯枝杂草&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;预防性焚烧（prescribed burning）&lt;/strong&gt;：对于山火高风险的区域，我们可以提前人为可控地将这部分枯树杂草烧掉&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;可控山火（managed wildfire）&lt;/strong&gt;：山火本来就是自然现象，过多过早的扑灭反而会留下以后卷土重来的可能性。在保证安全和完全可控的情况下，可以适当允许山火自生自灭。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;草甸及土地保护（meadow restoration）&lt;/strong&gt;：尽可能扩大水草繁茂的森林面积，减少枯树出现的可能性&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;LAO的报告指出，截至2018年，加州每年对1.75万英亩的非联邦林地和25万英亩的联邦林地采取以上这些措施。而理想情况下，这两个数字都应该至少是50万英亩。在汹涌而来的山火面前，我们所采取的预防措施还远远不够。&lt;/p&gt;
&lt;p&gt;那到底是从哪里开始出错了？先说说植物去除（thinning）。根据华尔街日报的报道，加州、联邦政府以及多个组织机构在2017年联合推出了一项名为Tahoe-Central Sierra的计划，旨在对240万英亩的森林进行预防性的植物去除（thinning）。然而，这个计划（以及类似的其它倡议）遭到了环保组织和自然资源保护论者的反对和阻碍。以Sierra Club和Global Witness为代表的多个组织认为，任何破坏原始森林的工业行为都应该被严格禁止。在环保组织的游说下，树木砍伐（logging）的政策都十分严格，使得大规模的砍伐几乎毫无可能。到2020年，这项Tahoe-Central Sierra计划只覆盖到了2万英亩，不到原计划的1%。&lt;/p&gt;</description></item><item><title>进入智库工作是怎样的一种体验</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/think-tank-experience/</link><pubDate>Thu, 09 Feb 2017 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/think-tank-experience/</guid><description>&lt;p&gt;&lt;em&gt;&lt;a href="https://www.zhihu.com/question/31470598/answer/67204506" target="_blank"&gt;点此&lt;/a&gt;
见知乎原文&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;总体的感受是“&lt;strong&gt;原来政策是这样制定的&lt;/strong&gt;”。&lt;/p&gt;
&lt;p&gt;在细讲之前，先说明一下，在智库的体验会根据国家（中国、美国还是其它国家）、职位（高级职位还是低级职位）、领域（宏观政策还是具体细分行业）有明显的不同。我自己曾经在美国华盛顿的一家智库任职，做经济政策方面的研究助理（Research Assistant）。本科（美本文理学院）毕业就入职，级别上算是最低级的了吧，仅高于实习生，2014年离职。我所讲的以下这些显然不会是全貌。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;先讲讲我自己的个人经历和体验。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;日常工作主要围绕政策研究展开。由于是在经济政策部门，我们日常研究的课题包括“应不应该提高最低工资”、“资本利得税怎么改革”、“房产交易市场是否存在泡沫、如何监管”等等。我自己主要的工作包括收集数据、分析数据、建立回归模型或者其它数理经济模型、整理报告、编辑文章、组织研讨会等等。主要都是跑腿工作，给比我们高一个级别的研究学者打打下手。当然，如果你有专门的技能，也可以有一定程度的自由带一些项目，比如我带过一个通过分析Twitter数据预测选情的项目和一个用旅行商模型（TSP）安排募款路线的项目。这些属于比较少有的情况。&lt;/p&gt;
&lt;p&gt;我们的产出有多种形式，有的是学术论文，有的是报刊专栏，也有专门的政策报告。可以面向民众，也有面向政策制定者（主要是参众两院）。面向民众主要通过大众媒体；面向官员的话有很多方法，有的是作为政策专家通过参加政府的政策听证会，有的是我们自己组织研讨会邀请专家、官员和企业界大佬来一起探讨，有的就直接靠私交……&lt;/p&gt;
&lt;p&gt;写文章对我们来说是家常便饭，是最日常的工作；政策研讨会也经常办，我们这些研究助理会负责整个活动的组织和策划；偶尔也会去参加听证会，给出席听证会的我们智库的学者做助手。&lt;/p&gt;
&lt;p&gt;通过这些工作，我们经常可以观察甚至参与到一个政策的制定过程中。以最低工资为例，作为民众我们平时基本只能通过媒体报道得知政府决定提高还是不提高最低工资。但是通过在智库的工作，可以了解到这中间涉及哪些考量因素、任何政策的变动会导致怎样的变化（比如就业率、经济增长等等）、有哪些重要的利益相关方、诉求不同的各方如何沟（si）通（bi）、政策制定者在考虑这个问题的时候有哪些顾虑和需求、整个提案如何发展以及如何最终通过或被否决，等等。每个政策的制定都有背后的故事，都有背后的政治。在智库的话就会看到得更多一点，明白“原来政策是这么制定的”。&lt;/p&gt;
&lt;p&gt;其它方面：工作朝九晚五，没什么加班。工资不高，大概是全美本科毕业生的平均水平。食堂饭菜不错。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;再说一下对行业的观察和所见所闻。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;先说一下智库的组织构成，以我工作过的智库为例，其它华盛顿的大智库也基本相似。前面提到我们这些助（cai）理（niao）都是给研究学者打下手。这些中层级别的研究学者是智库的主力，绝大部分都有博士学位，有不少是退休教授或者兼职教授。文章都是以他们为第一作者发表，研讨会都是他们主持，听证会都是他们出席。然而他们并不是智库里最大牌、最有影响力的人。&lt;/p&gt;
&lt;p&gt;最大牌的人都是那些真正把智库当作“旋转门”使用的人，也就是把智库作为与政界商界过渡的跳板的人。最明显的例子就是前任美联储主席伯南克卸任之后去了布鲁金斯学会，小布什任内的副总统切尼卸任后挂名于美国企业研究院（AEI）。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/bernanke.jpg" alt="前任美联储主席伯南克" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;前任美联储主席伯南克&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;这些人是智库的门面，也是真正翻手为云、覆手为雨的人，一个政策的走向有可能就取决于这些人的一顿晚餐、一场对话。我工作时候的老板——经济政策部门的主任（director）——曾经多次给共和党做过经济政策顾问，据说小布什当政那会儿大量机密的经济政策邮件都来往于我老板的邮箱，搞得大家很紧张，纠结了一阵要不要升级一下网络安全系统什么的，后来不了了之。由于当时中美政府并不特别友好的关系，我老板去中国出差的时候还被查过水表，这是题外话了。&lt;/p&gt;
&lt;p&gt;或许是因为这些人的关系，让外界对智库的看法大都围绕于“神秘”、“高大上”、“肯定上面有人”等论调，甚至和各种阴谋论联系在一起。空穴来风事出有因，智库给外界留下这些印象不无道理，但这些解读也都比较片面。对于在智库的大多数人而言，这只是一份正常的工作，和研究机构或许多NGO的工作内容很相似。你看我一个外国过去的小本不也一样进去打了一圈酱油，码了几行代码么。《纸牌屋》里说的好：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;Proximity to power deludes some into thinking they wield it.
靠近政策制定的权力并不等于我们（智库）有这个权力。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;更重要的是——这也是我写这篇回答的初衷之一——**大家或许需要对智库的社会价值有更深刻的认识和思考，而不是把它仅仅看做门客聚集之地。**在美国，智库是政界与商界之间以及决策者与民众之间的润滑剂。复述一段我在以前一个回答里提到过的对智库角色的描述：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;美国智库，上可以与政府要员往来密切参与政策制订，中可以和大学、研究机构联手开展政策和社会科学研究，下可以向民众普及政策、倾听民众呼声，还可以接受企业捐助然后向其提供政治政策顾问。因此，美国智库可以游走于政府、民众、企业之间，彼此之间都是互有往来。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;举几个例子吧。如果政府的经济政策不管用的话，第一个站出来说话的往往是智库。一个政策的推行，都会有一大批专家学者虎视眈眈，不会放过任何蛛丝马迹，科班出身的他们比政策制定者的嗅觉要更为灵敏。当然，站出来说（si）话（bi）的一般都是对面党派的智库（民主党的政策不好使那么站出来的就多半是共和党的智库）。你可以说这是党派斗争，但这至少让我们大家都对这个政策的好坏两面看得更清楚了一些。&lt;/p&gt;
&lt;p&gt;再说说和商界的关系——君不见，现在硅谷的Google等科技企业给智库的捐款数量已经超过高盛等金融巨鳄了。为什么程序猿要给智库捐钱？因为智库是个中间人，懂得怎么跟政策制定者打交道，可以帮助他们推动与政府的关系，沟通他们的诉求。Uber要克服政策监管的问题，少不了在这上面花钱花工夫。就连中国企业也有跟华盛顿的智库合（juan）作（qian）的——前一阵子有家中国大企业被美国政府追得很紧，各种监管条例和诉讼缠身。吃一堑长一智，它现在经常找智库帮忙，在监管者面前说说好话，现在的日子和之前相比过得颇为滋润。&lt;/p&gt;
&lt;p&gt;习大大几年前说要发展中国的智库，近年来国内涌现了不少官方和民间智库。中美体制不同，美国的智库运作近百年，在社会中有它自己的独特位置。中国的智库应该承担什么样的责任、起到什么样的作用，还有待大家的思考和探索。&lt;/p&gt;</description></item><item><title>如何专业地预估票房</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/predict-box-office/</link><pubDate>Fri, 11 Mar 2016 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/predict-box-office/</guid><description>&lt;p&gt;&lt;em&gt;&lt;a href="https://www.zhihu.com/question/21432862/answer/90368646" target="_blank"&gt;点此&lt;/a&gt;
见知乎原文&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;前一阵子刚给一个客户（好莱坞六大电影公司之一）做了这方面的项目，希望可以从数据分析的角度给大家提供一些有参考价值的经验。&lt;/p&gt;
&lt;p&gt;概括地说：&lt;strong&gt;短期预测有可能，长期预测很难&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;从短期预测来看，如果选的变量足够多、足够好，还是可以做出一些相对准确的预测的。当然最大的问题始终是：&lt;strong&gt;用什么数据来预测票房&lt;/strong&gt;？我们先看一下Google那篇&lt;a href="chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://dl.icdst.org/pdfs/files1/350427db54ce5dcf1e46ad7f00d2e2cf.pdf" target="_blank"&gt;文章&lt;/a&gt;
：Quantifying Movie Magic with Google Search. 当时这篇文章也算轰动一时，吸引了不少注意。这篇文章给的结论是，如果用以下四个变量做线性回归提前一周预测首周末票房，模型的R2是0.92——即这四个变量可以反映票房数据92%的方差：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;上映七天前的电影名字Google搜索量&lt;/li&gt;
&lt;li&gt;上映七天前的电影Google搜索广告点击量&lt;/li&gt;
&lt;li&gt;上映影院数量&lt;/li&gt;
&lt;li&gt;是否为系列电影（0-1变量）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果用以下变量，提前一个月预测首周末票房的模型R2是0.94：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;预告片搜索量&lt;/li&gt;
&lt;li&gt;是否为系列电影（0-1变量）&lt;/li&gt;
&lt;li&gt;是否在假期上映（0-1变量）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;看起来结果不错，但我们认为它有很多漏洞，使得它派不上什么实际的用处。最大的问题是，我们不知道文中的这些模型有没有过拟合（overfit）。文章说用了2012年99部电影的数据做了这个分析，这个样本实在太小了（IMDb上有360万title，按照250年的跨度计算的话平均一年也有1万多部电影）。文章也没有提供关于过拟合的任何分析，使得我们十分怀疑如果换一个数据集会不会结果就不那么准了。可惜我们没有搞到“上映七天前的电影Google搜索广告点击量”和“预告片搜索量”这两个数据，不然就可以验证这个猜想了。事实上，我们尝试用了相似的变量，包括文中提到的一些没有使用的变量（比如MPAA rating之类的），在新的数据集上并没有得到这么好的结果。&lt;/p&gt;
&lt;p&gt;于是我们只能自己想办法。经过一番折腾（这里省略五百字血泪搬砖史），我们最终决定采用了以下数据：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;同类电影同期票房&lt;/li&gt;
&lt;li&gt;同期上映电影票房预测&lt;/li&gt;
&lt;li&gt;上映影院数量&lt;/li&gt;
&lt;li&gt;是否为系列电影（0-1变量）&lt;/li&gt;
&lt;li&gt;是否在假期上映（0-1变量）&lt;/li&gt;
&lt;li&gt;上映七天前的电影名字Google搜索量&lt;/li&gt;
&lt;li&gt;上映七天前的电影名字Wikipedia搜索量&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这里解释一下1和2这两个数据。每部电影准备上映之前，电影公司（至少我们客户）会标出一些这部电影的过往同类电影（comparable movies），用来分析新电影是否表现相对出色。这些同类电影的选择是人为的，并非靠算法，都是靠电影公司的经验。我们是从客户那里获取了这些数据，调出了这些同类电影的同期数据。另外（2）同期上映电影指的是同一时间上映的电影，比如功夫熊猫3在美国和Zoolander同时上映，他们就是同期上映电影。可以想象，如果哪部动画电影和《疯狂动物城》同时上映，票房一定会受影响。我们用了这些数据，得到的预测平均绝对误差结果如下图：
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/box-office-prediction-error.png" alt="预测误差随时间增长" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;预测误差随时间增长&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;我们随机选用了客户数据库中2010-2015年的150部电影，用以上数据建立线性模型提前7天预测票房，将误差绝对值的平均值画出来就是这张图，横轴为周数（9表示上映9周之后）。最显而易见的结论是长期预测真心不靠谱，这个等会儿再细说，先说短期预测。我们的预测在前8周都可以误差在1%左右，这是很令人满意的。然而，过拟合的问题依然没有解决。我们这里预测的都是美国票房，如果把同一个模型用来预测中国票房，预测值就彻底跑偏了（当然，也要先把Google搜索换成某度搜索指数……）。而且150部电影的样本量还是不够大，如果选一些老电影的话（比如2005年之前的电影），这个预测也不准。所以我们也不敢说比Google做得更好，可能只是在某些方面略有改善而已。&lt;strong&gt;总的来看，如果继续花工夫寻找好的变量和模型，还是有可能把短期预测做得更好的&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;长期预测就没那么容易了。长期预测可以分为两种，一种是上映时预测很长时间之后的票房（比如第10周、第20周的票房），还有一种是离上映还很遥远的时候预测整体票房，这两个都很难。前者就是我们在上图里面看到的现象了，Google也表示做不好这种预测。我们揣测主要的原因是上映之前所有人所知道的信息都有限，此时用那些变量做预测可以做到八九不离十；但上映之后观众群体对电影掌握了更多信息，可能会产生互相之间的影响——我可能是因为身边的人安利了我才去看，而不是自己搜了Google/百度。这样的潜在信息未必能从数据中反映出来。&lt;/p&gt;
&lt;p&gt;后一种长期预测——离上映还很遥远的时候预测整体票房——就更难了，有很多因素会影响到票房的走向。举例来说，很明显的影响是营销的投入：一般来说在广告上的投入和票房呈正相关（当然也有一些例外）。营销做到什么程度、会不会产生爆炸式的传播效果，都是之前难以逆料的，要等社交网络或者市场调查的数据出来了才能知道。此外，还有很多深层次、很难用数据捕捉的信息，比如大众审美的变化等等，都会影响到票房。&lt;/p&gt;
&lt;p&gt;说到底，短期预测可以做而长期预测做不准，对于电影公司和影院来说并没有什么用。因为提前7天哪怕有了准确的预测，他们也无法相应地调整任何策略，做出更优的部署（这时候换上映地点什么的也已经来不及了），所以只是看个预测、求个心安而已，别无它用。我们也和客户深入地讨论过为什么这么难预测，得出的结论是：&lt;strong&gt;卖电影不像卖车，电影与电影之间的不同之处很难衡量，因此在别的电影上获得的经验很难应用到新电影上&lt;/strong&gt;。车与车之间，我们可以用各种量化的指标去衡量差异：发动机、外型、内饰、颜色等等。所以从过往车的销量数据可以预测新车的销量数据。但是电影怎么衡量相似程度呢？时长、卡司、类型……这些方面都能给我们一些信息，但显然不能给我们全部的信息——知道了这些我们也依然无法知道电影的质量、观众对它的观感和未来的票房。从数据分析的角度出发，我们需要找到更好的度量（metrics）来衡量电影与电影之间的差异；从行业的角度出发，我觉得这也是电影行业的魅力所在，或许并非只用数据可以衡量和预测的。&lt;/p&gt;
&lt;p&gt;所以回到题主的问题：如何专业地预估票房？我想“专业”需要同时来自于数据分析的更多探索以及对电影行业的深刻认识吧。这个结论其实放之四海而皆准，在很多其它领域也一样适用。略有不同的是，数据分析（或者说“大数据”）虽然在很多领域都被炒得火热，在电影行业其实并没有太多好的实践，和其它行业相比还有非常多与业界结合的提升空间。&lt;/p&gt;</description></item><item><title>亲历美国国会听证会：激辩贫富分化</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/congressional-hearing/</link><pubDate>Fri, 09 May 2014 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/congressional-hearing/</guid><description>&lt;p&gt;&lt;em&gt;本文刊于《社会观察》2014年第4期&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;自金融危机和“占领华尔街”运动以来，贫富分化和收入不平等始终是美国举国上下热议的焦点。它不仅是街头巷尾人们常常议论的话题，也是美国政府的烫手山芋——如果政策干涉力度不足就会因为不作为而挨骂，可是过多地干预又会被指责是扰乱正常的市场经济规律。美国总统奥巴马在2014年的国情咨文中也着重强调了缓解贫富分化的决心。近日，美国国会参议院就此召开听证会，邀请学界和智库的精英，共同谋划一个解决收入不平等的良方。对于贫富差异日益显著的中国，这番讨论或许也不无借鉴意义。&lt;/p&gt;
&lt;h2 id="国会听证影响国家政策的辩论赛"&gt;国会听证：影响国家政策的辩论赛&lt;/h2&gt;
&lt;p&gt;美国国会的听证会由来已久，凡是遇到国内外重大事件需要调查，或者是初步拟定立法政策时，都有可能需要收集分析各方意见，听取当事人、相关方以及专家学者的证词。“棱镜门”事件之后，美国国会就曾举办过多次调查听证会，传唤包括前CIA官员在内的多人到国会提供证词。此次关于收入不平等的听证会则属于立法听证会，由参议院下属的经济联合委员会（Joint Economic Committee，简称JEC）举办，旨在为以后的经济政策制订广开言路，邀请了来自顶尖大学或者智库的四位专家学者。经济政策深奥繁复，牵一发而动全身，参议员们也不能全盘了解每种政策的利弊，因此需要请这些专家学者来共同出谋划策。&lt;/p&gt;
&lt;p&gt;与以往的诸多类似听证会一样，此次请来的四位专家学者背景各自不同，却又十分平衡：两位倾向于自由派民主党，两位倾向于保守派共和党；两位来自大学，两位来自智库；两位男性，两位女性。这也是参议院中的这些联合委员会举办听证会时候的惯例，尽量保证各种观点都能得到应有的关注，避免一边倒的情况出现。这些出席听证会的专家需要各自向与会的参议员阐述自己的观点和建议政策，随后接受参议员的询问。观点的碰撞与冲突在所难免，到场的其中两位学者甚至曾经在财经节目上已经打过嘴仗，因此国会听证会从某种程度来说，也是这些专家们之间的一场辩论赛。而他们所提出的建议和政策，很有可能会影响参议院最终制订的法律法规，甚至直接被全盘采纳。可以说，这是一场可能影响到国家政策的辩论赛。&lt;/p&gt;
&lt;h2 id="收入不平等正在加剧数据背后另有隐情"&gt;收入不平等正在加剧？数据背后另有隐情&lt;/h2&gt;
&lt;p&gt;听证会伊始，四位专家学者的观点碰撞就已火花四溅。收入不平等虽然是事实，但是它在现实中到底有多严重，有没有比历史水平更加恶化，四位专家却各执一词。一位学者指出，自金融危机以来，美国范围内的收入有95%流入了收入最高的1%的人群，这已经到了极度不平衡的状态。但另有学者指出，在计算收入的历史水平之时，首先要折合通胀率进行调整，计算现值；其次不同关于收入不平等的研究报告使用的统计口径各不相同，有的没有计算税收抵扣，有的没有计算食物券等低收入人群福利项目。因此，如果考虑到这些因素，美国自1960年以来的收入不平等现象只是在微幅上升，并没有出现大幅的剧烈恶化。&lt;/p&gt;
&lt;p&gt;另有学者指出，正因为收入统计口径不一，难以客观了解经济全貌，衡量消费水平才是真正衡量贫富差距的正确途径。消费水平不但比收入更容易统计衡量，不存在税收抵扣等诸多干扰因素，而且一个人的财富水平和生活质量更取决于他消费多少，而不是收入多少。毕竟，一个人如果收入多而消费少，他的生活质量也不见得高，因此也不能称得上富裕。如果从这个角度来看，美国的低收入人群在过去的二十年间的消费水平和生活质量基本都能得到保证，但是却也没有更显著的进步，因此贫富差距的问题始终存在。&lt;/p&gt;
&lt;p&gt;作为平民百姓，我们或许不太能理解这些数据和研究方法代表了什么，甚至有什么重要性为什么一定要吵个明白——贫富差距我们能够自己感受到，这不就已经是现实了吗？但是对于专家学者和政策制订者来说，正确地理解现实中发生的问题及其原因才能更好地制订有针对性的政策。也就是说，他们不仅要知其然更要知其所以然。如果收入不平等会被食物券等政府福利项目影响，那就要考虑是扩张还是缩减这些项目；如果贫富差距会因人们的消费水平而变化，那么政府就要制订相应的鼓励消费或是遏制过度消费的政策。对症下药，才能药到病除。&lt;/p&gt;
&lt;h2 id="最低工资该多低"&gt;最低工资该多低？&lt;/h2&gt;
&lt;p&gt;在诸多“药方”之中，提高最低工资一直是最热门的候选方案之一。事实上，一些参议员正在推动一项法案，希望能将联邦最低工资从现在的每小时7.25美金提升至10.10美金。这也是参议院在此时召开听证会的原因之一。很多人都认为，提高最低工资有助于提高最低收入人群的收入水平和生活质量，缓解收入不平等的现状。&lt;/p&gt;
&lt;p&gt;出席听证会的学者中也有人持支持态度。该学者指出，在1996-99年这段时间最低工资的提高伴随着一段时期的就业率上升。而从更长的时间段来看，美国的真实最低工资（去除通胀率）一直处于比较低的水平，甚至不及1968年，他认为目前正常的水平应该在每小时15美元甚至更高。然而也有学者对此持异议。有学者认为，如果提高最低工资，受影响的不仅是直接拿最低工资的人，因为企业的总体工资水平可能会上升，所以根据研究，总体可能会影响到大约3500万人，而不仅仅是拿最低工资的那一小群人。而且，将最低工资提高至10.10美金意味着在原有基础上40%的提升，如此大规模的最低工资涨幅在美国历史上都前所未见，需要谨慎而为。&lt;/p&gt;
&lt;p&gt;更有学者指出，提高最低工资并非良策。最低工资提高之后，企业的成本上升，很有可能将会不得不进行一定程度的裁员。对于被裁员的人来说，他们并没有拿到更高的工资，反而什么工资也拿不到。何况，最低工资的工作基本都是没有技术含量的入门性工作，比如快餐店的营业员。从政策制定者的角度来说，并不希望这些拿最低工资的人一直都只做这份工作，如果他们不能进一步从事技术含量更高、工资更高的工作，那么不但无法提高社会总体经济的劳动生产率，对于缓解总体的收入不平等也毫无益处。因此，提高最低工资并非缓解收入不平等的“必杀技”。&lt;/p&gt;
&lt;h2 id="面对贫富差距专家各出奇谋"&gt;面对贫富差距，专家各出奇谋&lt;/h2&gt;
&lt;p&gt;相比提高最低工资，有多位学者都赞成使用更成熟的替代方案，即劳动所得税抵扣（Earned Income Tax Credit，简称EITC）。简单来说，这是一项针对低收入人群的租税抵扣制度，尤其倾向于有儿童的家庭。当劳动所得低于政府规定的一定金额时，这些人可以不用缴纳部分税额。这项政策的优势在于能够鼓励失业和低收入人群努力工作，并且由于刚进入此项目（phase-in）时，收入越高税收减免越多，所以他们有动机去努力赚更多钱。对于政府来说，这也能够更好地将资源集中于在职贫穷家庭，并且因为对有儿童的家庭提供更高的抵扣制度，能够有效地防止跨代贫穷的出现。&lt;/p&gt;
&lt;p&gt;除此之外，四位专家都一致同意，政府需要在教育和培训上加大投资。在一个健康的经济体中，缓解失业和减少贫穷并不是直接给穷人发钱，而是要让他们找到与他们能力相匹配的工作。因此，教育和职业技能培训都是人们改变自身贫穷处境的重要途径。其实增加教育领域的投资已是老生常谈，无论民主党共和党都一致赞成，但要有效地提高教育质量却也并不容易。在场的学者指出，除了加强给教育领域的投资和政策鼓励之外，保证学校的教学质量也尤为关键，这就意味着要敢于解雇能力不足的教师。由于美国一直以来都对教育极其重视，因此在很长的一段时间里，教师权益得到了极大的保护，以至于学校想要解雇一位教师需要经过复杂的手续，十分困难，甚至几乎是不可能的。如今，很多人都意识到这对于教育质量的提升也可能是一种束缚，也有专家提出对此进行改革。此外，也有学者提出开放各个学区学校的自由竞争，免除政策壁垒，通过市场自由竞争来提高教育质量。&lt;/p&gt;
&lt;p&gt;也有学者指出，除了小学到大学的学堂教育之外，社会机制的顶层设计者需要给职业技术人员提供职业发展的轨道，让职校技校毕业的人能够有良好的社会地位和充足的职业发展空间。美国可以参考德国为例，很多德国人在接受教育时就是以职业技术为主，而德国的社会机制又能很好地保证这些人有充足的就业和发展前景。同时，政府还可以出资给失业人群提供技能培训，并成为失业人群和企业的中间人，为彼此牵线搭桥，帮助失业人群实现再就业。&lt;/p&gt;
&lt;p&gt;方案虽多，但四位学者在听证会中一直强调，贫富分化和收入不平等并非是某个单独的原因造成，冰冻三尺非一日之寒。因此，世上也不存在一劳永逸的万灵药，能够一举解决这些社会问题。即便美国找到了有效的方法，拿到中国也未必适用。但以什么态度去面对这类社会问题，却值得我们借鉴与思考。唯有坦然面对现实，客观了解现实状况，广开言路进行讨论，对各种可能方案进行科学地研究，并且不断地尝试可能行之有效的政策方案，我们才能离一个更加健康的经济体与一个更加成熟运作的社会更近一步。&lt;/p&gt;</description></item><item><title>资本回报率太高，劳动回报率太低的说法正确吗</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/high-roi/</link><pubDate>Fri, 02 May 2014 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/high-roi/</guid><description>&lt;p&gt;&lt;em&gt;&lt;a href="https://www.zhihu.com/question/23598991/answer/25126402" target="_blank"&gt;点此&lt;/a&gt;
见知乎原文&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;由于Thomas Piketty的新书《Capital in the Twenty-First Century》，这个问题现在正是大家（主要是经济学家们）讨论的焦点。虽然很多人都倾向于认为这个论断是正确的，但还是有很多反对的声音，所以&lt;strong&gt;还不能说有定论&lt;/strong&gt;。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/roi/return.jpg" alt="资本回报率" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;资本回报率&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;Piketty的观点是资本回报率远高于劳动回报率，并且也高于平均的实际经济增长率（二战时期除外，如图）。长此以往，富人更富，穷人更穷，这是资本主义（capitalism）的根本性弊端，如果不施加外力，最终会毁灭它自己，所以需要通过政府的强力干预来改变，比如对富人征收80%的税。&lt;/p&gt;
&lt;p&gt;Piketty此书堪称今年（2014年）最红火的一本书（至少在美国），在Amazon上卖到脱销，紧急加印了八万册。从报纸到电视，媒体对此进行了铺天盖地的报道，包括克鲁格曼等众多经济学家都参与了&lt;a href="https://www.nytimes.com/2014/04/25/opinion/krugman-the-piketty-panic.html" target="_blank"&gt;讨论&lt;/a&gt;
。他之所以受到那么多的关注，在我看来至少有以下几个原因：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用了大量数据证明他的观点，与很多“畅销书”不同，并非只有理论&lt;/li&gt;
&lt;li&gt;提出了一个对于现实的犀利观察。我们或许想到过搞金融的都很赚钱，资本回报率很高，但却没有像他这样深入地剖析这个现象，与其它经济数据进行对比，并且以此来诠释我们社会的经济发展模式&lt;/li&gt;
&lt;li&gt;迎合了美国目前的政治氛围：走自由派经济路线的奥巴马当局这些年来一直在加强政府对于经济的干预，包括金融监管、全民医保、以及最近如火如荼的提高最低工资。Piketty的观点是自由派（liberal）经济路线的强力佐证，很容易被拿来说事儿（换句话说，它火起来不仅有学术的因素，也有政治的因素）。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因此，尤其是考虑到第三个因素，如果你站在保守派（conservative）的视角来看，Piketty说的就不那么在理了。保守派的著名智库美国企业研究院（AEI）发表了多篇文章反驳Piketty的观点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Thomas Piketty wants income equality (&lt;a href="https://www.aei.org/articles/thomas-piketty-wants-income-equality-and-the-hell-with-growth/" target="_blank"&gt;LINK&lt;/a&gt;
)&lt;/li&gt;
&lt;li&gt;Piketty and Krugman admit the Laffer Curve is real (&lt;a href="https://www.aei.org/articles/piketty-and-krugman-admit-the-laffer-curve-is-real/" target="_blank"&gt;LINK&lt;/a&gt;
)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;总结下来如下：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第一&lt;/strong&gt;：Piketty计算的收入虽然是税后，&lt;strong&gt;但没有计算转移支付&lt;/strong&gt;（transfer payment），即各种形式的政府福利和财政转移，比如社会保险（social security）、各种救济金、对中小企业的补贴等等。美国政府的转移支付从70年代起就一直在增长：
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/roi/transfer.jpg" alt="转移支付" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;转移支付&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;所以算上这个因素，美国的贫富差距并没有明显恶化，参见1984-2009的基尼系数：
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/roi/gini.jpg" alt="基尼系数" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;基尼系数&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;</description></item><item><title>美国宏观经济与普查数据下载渠道</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/macro-econ-data/</link><pubDate>Fri, 21 Mar 2014 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/macro-econ-data/</guid><description>&lt;p&gt;在智库工作了近一年，找数据查文献这类搬砖的工作没少做。整理了一下我们比较常用、智库研究人员都比较信得过的数据渠道，既是给大家做个参考，也是供我自己方便记忆和检索，同时也欢迎大家添砖加瓦。&lt;/p&gt;
&lt;p&gt;首先介绍两款利器，都是获取数据的平台，且都包含不止一个数据库。首先是&lt;strong&gt;DataFerrett&lt;/strong&gt;，这是US Census Bureau提供的数据获取工具，能下载多个普查数据库的数据（包括以往历史数据）。普通美国人每个月拿多少薪水，交多少税，房租多少，电费花了多少，几乎都被囊括其中。这些普查数据是经济政策制订的基础，除了失业率等比较显而易见的宏观经济指标外，我们大部分对经济现状的理解和对未来政策制订的方向都源自于这些数据。这里是&lt;a href="https://www.census.gov/data/data-tools/dataferrett.html" target="_blank"&gt;主页&lt;/a&gt;
。以下几个是我们比较常用的普查数据：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Consumer Expenditure Survey (CEX)&lt;/li&gt;
&lt;li&gt;Current Population Survey (CPS)&lt;/li&gt;
&lt;li&gt;Survey of Income and Program Participation (SIPP)&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;DataFerrett的一大优点就是可以直接下载用于Stata/SPSS/SAS的数据格式（xlsx和txt自然不用提），在下载的时候它就已经帮你做好了label的工作，省去了很多data cleaning的工作。&lt;/p&gt;
&lt;p&gt;另一款利器就是&lt;strong&gt;Bloomberg Terminal&lt;/strong&gt;了，关于它本身无需赘述。相比而言，它在普查数据方面稍弱些，不够详细。但业界数据十分齐全，并且远不局限于美国（或是任何一个国家）国内的经济数据。我们使用的时候更多是取用业界数据，金融部门用Bloomberg Terminal用得比较多。&lt;/p&gt;
&lt;p&gt;这两个利器基本上能够涵盖平时所需的大部分经济数据。不过很多时候杀鸡焉用牛刀，我如果只想查过去几年每个州的最低工资标准这样还算宏观的数据，没有必要大动干戈用这么复杂的数据系统。对于这种情况，我们经常去两个网站，上面既有很多已经整理好的数据，也可以通过简单的界面选取自己想要的数据（只是数据没有之前两个利器那么全面细致）。一个是Bureau of Economic Analysis (&lt;a href="https://www.bea.gov/" target="_blank"&gt;BEA&lt;/a&gt;
)，另一个是Bureau of Labor Statistics (&lt;a href="https://www.bls.gov/" target="_blank"&gt;BLS&lt;/a&gt;
)。&lt;/p&gt;
&lt;p&gt;如果再要简化，我个人比较推荐一个数据库叫&lt;a href="https://data.nasdaq.com/publishers/QDL" target="_blank"&gt;Quandl&lt;/a&gt;
，上面可以找到世界主要国家的经济、社会、人口数据。虽然这些数据Bloomberg Terminal上都有，但Quandl更加简洁易用，方便操作。我曾将其推荐给多个同事，大家纷纷点赞。从两款利器到BEA/BLS再到Quandl，数据量越来越少，但复杂程度也相应递减。&lt;/p&gt;
&lt;p&gt;除了以上所说的一手数据（raw data）之外，我们也经常参考各种二手数据，即别人的报告或论文。首当其冲的是
The National Bureau of Economic Research (&lt;a href="https://www.nber.org/" target="_blank"&gt;NBER&lt;/a&gt;
) ，上面集合了大量经济论文，如果我们想要知道有没有对于某个话题的现有研究，这是我们的go-to place。我刚入职的时候拿到一份经常使用的数据库列表，上面对NBER的描述我到现在还记得：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;NBER - the place to answer: &amp;ldquo;what does economics research say about&amp;hellip;&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;NBER上也有数据，但这些数据都可以从之前提到的渠道收集，一般大家都还是冲着论文来的。除了NBER之外，我们也经常关注Congressional Budget Office (&lt;a href="https://www.cbo.gov/" target="_blank"&gt;CBO&lt;/a&gt;
)和&lt;a href="https://www.pewresearch.org/" target="_blank"&gt;Pew Research Center&lt;/a&gt;
的报告。前者是联邦机构，专职分析经济数据、提交经济报告，其提供的数据十分权威，从政界到学界都唯其马首是瞻。举例来说，当时国会债务危机的时候，两党都是照着CBO公布的数据和预测来制订方案的。Pew则是华盛顿的一家年轻智库（算是我们的同行），其政治影响力不曾与闻，但经常发布各类研究报告，以善做研究著称。我们日常的研究和文章中，经常会引用CBO或者Pew的数据。
至于Wall Street Journal、New York Times上面的内容，看看可以，但是引用起来总觉得没什么信服力。&lt;/p&gt;</description></item><item><title>“数”中自有黄金屋：美国智库如何用数据提升募款</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/data-and-fundraising/</link><pubDate>Wed, 08 Jan 2014 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/data-and-fundraising/</guid><description>&lt;p&gt;美国的智库往往被外界蒙上一层神秘的色彩。这群被称为“影子内阁”的非营利机构雇佣了大批顶尖学者和专家，为政府的政策制定出谋划策，虽然名不见经传，但其一举一动实际上牵动着整个国家的政策实施。为了保持其研究成果的独立性，这样的智库多半是非政府非营利机构，靠社会、个人和企业的募款维持运营。一流的智库，为了延揽一流的人才和保持对政府和社会的影响力，每年的支出都在千万美元以上。为了募得这笔数额不菲的运营经费，各个智库都有自己的秘诀。其中，数据分析往往会起到至关重要的作用。&lt;/p&gt;
&lt;h2 id="收集什么数据定量化的优先性排序"&gt;收集什么数据？——定量化的优先性排序&lt;/h2&gt;
&lt;p&gt;一家智库的募款对象往往成百上千，他们有的是基金会，有的是社会团体，有的是企业，也有的是个人。除了极少数对这家智库有高度兴趣并主动来捐款的个人或团体，绝大多数都需要智库自己主动去“化缘”。为了对这些募款对象进行有效的内部管理和追踪，使整个募款过程有条不紊地进行，智库往往会采用定量化的优先性排序，用数据进行募款方管理。&lt;/p&gt;
&lt;p&gt;最直截了当的数据显然是预期的募款额，这个数字可以基于对募款对象往年捐款数额的预测，或是募款对象之前的口头承诺，或是对其经济实力的预测。在这个数额的基础上，智库的募款团队还会通过往年募款的经验和对募款对象的了解评估募款成功的概率。预期募款额和募款成功概率这两个数据一般都通过管理层和募款团队的经验来判定，因为他们会对比较熟悉的潜在捐款方会有一定的了解，有时候甚至是私交，所以可以通过经验来判断募款成功的概率。近年来募款团队也逐渐开始使用定量化的方法。&lt;/p&gt;
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/donor-list.png" alt="募款对象加权列表" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;募款对象加权列表&lt;/figcaption&gt; 
&lt;/figure&gt;
&lt;p&gt;假如一位捐款人过去五年每次捐款都大约是预期数额的50%，我们也可以假设今年募款成功的概率是50%。在这基础上我们还可以增添各种外部因素的考量，比如宏观经济条件——如果今年经济情况比前五年提升很多，或是又有新的减免税收政策出台，那么向捐款人成功募款的可能性会比往年平均水平更高，这就会用到更复杂的回归模型。不同的机构会择取适合自身情况的方法。这两者综合可以获得加权预期募款额，用这个指标可以更稳定地预测捐款额。如果前一年募款对象A破天荒地给了100万美元，今年对其募款成功的概率评估下来或许只有百分之一，其加权预期额只有1万美元。相比之下，每年都捐款5万美金的募款对象B，如果其募款成功概率是80%，那其加权预期额也可达到4万美元，高于A的预期值，因此这个指标能够更好地反映B的稳定贡献。&lt;/p&gt;
&lt;p&gt;除了加权预期值之外，募款团队还会加上时间限制这一变量。很多捐款方有其自身的资金流动周期，不是说捐款便能拿出一笔钱的。根据过往的经验和与募款对象的初步沟通，募款团队会为每个募款对象初步确定一个预期的募款时间，并据此排列募款对象的先后。有了加权预期值和时间先后这两个变量，募款工作便可有条不紊地逐步展开。&lt;/p&gt;
&lt;p&gt;如图所示，每个潜在捐款人对应预期捐款时间、预期金额、募捐成功可能性以及据此计算得到的加权预期值。根据时间和加权预期值进行排序，安排募款工作。&lt;/p&gt;
&lt;h2 id="如何运用数据最需要的地方最重要的资源"&gt;如何运用数据？——最需要的地方，最重要的资源&lt;/h2&gt;
&lt;p&gt;谋定而后动。有了对募款对象的优先性排序，机构就可以根据募款对象的重要性来战略性地分配自身的资源。如果是加权预期捐款额相当高的募款对象，智库往往会不遗余力地去争取，比如由机构总裁亲自拜访，志在必得。&lt;/p&gt;
&lt;p&gt;在管理层原本就忙碌的日常工作中增添了这个额外的任务，需要募款团队更好地规划募款的行程。如果机构的管理层成员，比如理事长在国外出差，而那里正好有个潜在的大额捐款人，那么不妨安排一次会面，增加彼此的了解互信，更增加募款成功的可能。如果管理层在出差时附近城市有多个潜在的重要捐款人，那又该如何安排呢？实际上，在运筹学中有个著名的“旅行商问题”，正是为这种情况量身定做的。“旅行商问题”解决的是如果一个旅行商要去多个城市，怎样找到一条最短路线走遍所有的城市并回到原点。这一算法可以被很好地应用在管理层的行程规划上，帮助机构更好地分配资源，达到募款的目标。
&lt;figure style="text-align: center;"&gt; 
 &lt;img src="https://d4xm6ha8xilrh.cloudfront.net/img/tsp.png" alt="旅行商模型" style="display: block; margin: auto; max-width: 100%;" /&gt; 
 &lt;figcaption style="color: #666; font-size: 14px; margin-top: 8px;"&gt;旅行商模型&lt;/figcaption&gt; 
&lt;/figure&gt;&lt;/p&gt;
&lt;p&gt;如图所示，如果机构的管理层需要去以上红点标注的城市出差并且附近有潜在重要捐款人，旅行商模型的算法可以设计出最优路线，以最短的路程走遍所有目标地点并回到出发点。这样能够最优化地支配机构管理层的时间和资源。&lt;/p&gt;
&lt;h2 id="美国智库的成功经验可否为我所用它山之石可以攻玉"&gt;美国智库的成功经验可否为我所用？——它山之石，可以攻玉&lt;/h2&gt;
&lt;p&gt;美国的智库依靠数据提升了自身的募款能力 ，使得募款工作得以用最有效率的方法开展，并将关键资源分配到关键对象上。对于中国的非营利机构，这些方法是否有很好的借鉴意义？值得一提的是，美国非营利机构的募款环境与中国十分不同。根据相关数据，2011年美国国内公益捐款达到3000亿美元，以人均捐款而言数倍高于以高慈善支出闻名的欧洲诸国，更遑论中国等其它发展中国家——中国在2013年的捐款额只有近9亿美元。相比而言，美国的捐款和募款体系更为成熟，募款的成功率也相对更高。美国运营成熟的公益组织也早已建立起数据化的募款管理体系，定期更新和维护自己的资金募集数据。对于中国公益组织来说，积累这样优质的、能够用于分析的数据才刚刚开始。此外，中美两国对于捐款的法律法规并不相同，相比之下中国的非营利机构在募款时受到更多的限制，这也影响到了美国非营利机构这些募款方法的借鉴意义。&lt;/p&gt;
&lt;p&gt;然而，中国的非营利机构不必狭隘地拘泥于“公募”这一个领域。美国智库运用数据管理募款的方法同样可以被举一反三地应用到管理非营利机构的其它重要募集资源，比如设备、空间、物资捐助，以及企业捐助等等。其核心借鉴价值在于，非营利机构能够通过理性的分析来战略性地管理自身的资源，据此做出正确的决策。这对每一家非营利机构，都应适用。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;&lt;strong&gt;作者&lt;/strong&gt;： 符号，iJoin 2011夏季项目咨询师，撰写此文时就职于美国华盛顿一家知名智库，担任助理研究员（Research Assistant）&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;贡献者&lt;/strong&gt;：iJoin全球社会创新研究团队成员（谢烁、陶鑫、李敦阳、邓晓音、林子亮）&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;&lt;em&gt;发表于iJoin社会创新咨询，2014年1月&lt;/em&gt;&lt;/p&gt;</description></item><item><title>舶来的美国梦：中国第一代官派留美幼童的历史碎片</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/imported-american-dream/</link><pubDate>Tue, 26 Nov 2013 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/imported-american-dream/</guid><description>&lt;p&gt;1863年秋天，一个穿着洋气的年轻人走进了曾国藩的安庆大营。与其他前来谋求一官半职、“三千里外欲封侯”的幕僚不同，这个人却有另一个目的，一个“大计划”（此人日记中原话）。八年后，他的“大计划”将成为中国历史上的一个里程碑。
他的名字叫容闳，1854年毕业于耶鲁，是中国第一个有记录的毕业于美国大学的留学生。&lt;/p&gt;
&lt;p&gt;也许容闳的名字不为人熟知，但他却是近代教育史上不可或缺的人物。容闳不仅是美国大学毕业的第一个中国人，日后更是一手拉扯大了中国历史上第一个官方的留美学生项目，可谓真正意义上的留学教父。作为耶鲁大学的第一个中国学生，容闳懂得希腊文、拉丁文，修过数学、生理学、心理学、哲学等各类课程，两次夺得英文论文的首奖，“校中师生，异常器重，即校外人亦以青眼相向。”&lt;/p&gt;
&lt;p&gt;更让这个教父名副其实的，还有他在自传《西学东渐记》中写下的这段话：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;予之一身，既受此文明教育，则当使后予之人，亦享此同等之利益，以西方之学术，灌输于中国，使中国日趋于文明富强之境&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;容闳本可以“彻底归化……留在美国并找到职业”（1878年友人Twichell语），但他却放弃了原本轻而易举的生活，走上了一条格外艰险的路。为此，他从耶鲁毕业后等待了足足十七年。而当一切尘埃落定，他却不得不远赴美国避难，最后客死他乡。人天生是自私的动物。为了自己谋幸福的人，是常人；为了别人而谋求幸福的，你可以说他是傻子，但我们更经常会认为他是英雄。&lt;/p&gt;
&lt;p&gt;抱着“为中国谋福利”（容闳原话）的雄心壮志，容闳走进了曾国藩的安庆大营，希望能促成更多学生到美国留学。可是老天却跟他开了个玩笑。曾国藩只给他安排了一个到国外购置机器的差事。此时的曾国藩，认为制船造炮是“今日救时第一要务”。容闳虽然才华横溢罕逢对手，但是碰到这位之后被誉为“挽狂澜于即倒”的中兴第一名臣，也只能依了他的安排。
七年后，并没有放弃的容闳通过江南制造局首任总办丁日昌再次向曾国藩进言，提议安排学生赴美留学。此时的曾国藩，正为安庆军工厂和江南制造局的人才短缺头疼不已，而那一年刚刚发生的天津教案更让他意识到船坚炮利只是徒有其表，而想要在真的成为世界强国就一定要有人才。于是在1871年，两江总督兼南洋通商大臣曾国藩和直隶总督兼北洋通商大臣的李鸿章联名（这两个头衔的长度和份量值得注意），向朝廷奏请“拟选聪颖子弟前赴泰西各国肆习技艺以培人才”。一个多月后，朝廷批复：“&lt;strong&gt;依议，钦此&lt;/strong&gt;”。通往美国留学的大门，正式打开。&lt;/p&gt;
&lt;p&gt;1872年，第一批30名留美幼童搭上了从上海前往旧金山的轮船，在那里，他们又坐上了刚刚建成三年的横穿美国的铁路，直达位于新英格兰地区的Springfield。容闳年轻时曾在那里待了好几年，熟人比较多，照应起来比较方便。此后的数年里，另外三批留美幼童也纷纷抵达，共计120名幼童。在那里，这些平均年龄12岁的幼童们被分配到当地居民的家里。这个决定很快会让朝廷的高官老爷们后悔莫及。&lt;/p&gt;
&lt;p&gt;这些孩子们学的很快。按照李鸿章的想法（曾文正公已于1872年去世），他们应该只是来学习先进的科学技术的。对于西方技术，李鸿章向来是持开明态度的。1864年，李鸿章在给总理衙门的信中写道：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;中国士大夫沉浸于章句小楷之积习，武夫悍卒又多粗蠢而不加细心，以至所用非所学，所学非所用。无事则嗤外国之利器为奇技淫巧，以为不必学；有事则惊外国之利器为变怪神奇，以为不能学&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;一语道破腐儒们的天朝心态。不过，那个时候的士人也有自己的一番道理。咸丰、同治年间被士大夫阶层崇敬的理学大师倭仁上了奏折，称：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;立国之道，尚礼仪不尚权谋；根本之图，在人心不在技艺。今求之一艺之末，而又奉夷人为师，无论夷人诡谲未必传其精巧，即使教者诚教，学者诚学，所成就者不过术数之士，古今来未闻有恃术数而能起衰振弱者也&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;言下之意，西学只是“一艺之末”，是智巧；想要强国，要靠气节，靠民族精神，靠孔孟之道。光靠西方的先进技术而没有民族精神，是不可能强国的。什么是本，什么是末，无论是在百年前的清廷，还是愈渐西方化现代化的当下，始终是国人挥之不去的疑惑。&lt;/p&gt;
&lt;p&gt;慈禧当时还没有这样的顾虑。她一道谕令摆平了倭仁，同意了曾国藩和李鸿章的构想。在美国的孩子们得以有机会放开手脚学习西方的先进技术。他们的确做到了。41个学生回国后被分配到刚刚建立起来的现代海军；17人被分配到电报学堂，8人将来成为了中国各省电报局的骨干；7人回国后被分配到开平矿务局的路矿学堂。另外，还有一个中国人耳熟能详的名字也在这批名单中，这个名字叫詹天佑，中国铁路之父。&lt;/p&gt;
&lt;p&gt;这群孩子在美国文化的潜移默化熏陶下，绝不仅仅只学会了这些东西。他们西化得很快，快得超过所有人的想象。脱下了长袍马褂，盘起了辫子，他们和美国同学一起打球，和马克吐温的女儿一起跳舞，有的长大后和美国人结婚生子。有人成为了耶鲁赛艇队的舵手，也有人成为了自己高中的棒球明星。八个中国学生还组建了他们自己的棒球队——东方人棒球队（Orientals）。詹天佑也是东方人棒球队的一员（图中后排右数第二）。&lt;/p&gt;
&lt;p&gt;容闳评价道：“终日饱吸自由空气，他们平时性灵上受到的沉重压力，一旦排空飞去，言论思想便都和旧教育的规范不合”。一不做，二不休。两个孩子，谭耀勋和容揆，干脆剪了辫子入了基督教。清朝当即勒令这两个学生中止学业提前回国。没想到正处于青春期叛逆期的两个幼童直接从回旧金山的火车上逃走了。不久，他们宣布与清朝脱离关系，在美国娶妻生子。容揆在日后给子女的家书中写道：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;他们【清朝】大概觉得理应像在中国对待任何一个孩子那样对待我们，那里的孩子会毫无怨言地忍受。但是，一个人一旦品尝到自由的滋味，他自然希望享受自由的空气。一只生下来就被囚禁的鸟感觉不到森林的气味，可一旦让他舒展飞翔的翅膀，这时，再豪华的禁闭空间也不能遏制他希望飞到即便是暴风骤雨的自由天空的愿望。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;这两个人逃走了，可苦了剩下的孩子。1878年，清朝任命了一个叫吴子登的官员成为新一任留学事务局监督。“留学事务局的大敌来了”，容闳在他的回忆录中写道，“吴子登本是留学事务的反对派，历来把学生留洋看成离经叛道之举；过去又与曾国藩、丁日昌不和，对曾、丁二公所创的事业，存心破坏，不遗余力。”于是，新一波对留学事务局的攻击开始了。这一次，为留学事业挡风遮雨曾文正公不在了，中美关系恶化了（十九世纪末期的排华浪潮正渐渐涌现），留美幼童又给朝廷里的人留下了不少把柄。最终，容闳和李鸿章扛不住了。1881年，总理衙门上奏，请“将出洋学生一律调回”。是日奉上谕：“&lt;strong&gt;依议，钦此&lt;/strong&gt;”。十年前，同样的四个开启了留学的大门，改变了120个孩子的命运。如今，同样的四个字再次改变了这些孩子和容闳的命运。&lt;/p&gt;
&lt;p&gt;除了詹天佑之外，也有几个昔年幼童成就过一番事业。梁诚，Phillips Andover Academy这所堪称全美第一高中曾经的棒球明星，日后成为了中国的外交官。二十世纪初，他一手促成了美国退还庚子赔款、用于选派更多留学生赴美的计划，接过容闳的接力棒成为新一代留学教父。内务府将皇室赐园——清华园拨给学务处，更名为“清华学堂”，用以选派留学生进行出国前的培训。这个清华学堂便是如今清华大学的前身。一百多年前，清华就是用来培养出国的人才的；一百多年后的今天，似乎，还是这样。&lt;/p&gt;
&lt;p&gt;有个叫李恩富（Yan Phou Lee）的学生也值得一提。回中国前他在耶鲁读了一年，1884年在传教士的帮助下回到美国完成了学业。他是继容闳之后又一个天才级的学生，隐隐有容闳当年的影子。大学二年级时，他就在第一学期的英文作文比赛中获得一等奖。之后他又在讲演、辩论等多种语言文字的比赛充分展示他超人的语言天赋。毕业后三年，他在美国出版了自己写的书《我在中国童年的故事》，很有可能是美国第一个亚裔作家。之后结婚生子。当他似乎可以过上一个富裕的中产阶级生活时，他却像容闳一般，走上了一条异常艰辛的道路——对抗排华浪潮。他在美国四处演讲，写下“Chinese Must Stay”等多篇至今被收录在美国历史教材中的著名文章，希望能改变在美国铺天盖地的排华浪潮。然而西部华工一盘散沙，美国社会也不待见李恩富。他只能四处漂泊，居住过无数城市，为无数报纸打过工。最终客死香港。&lt;/p&gt;
&lt;p&gt;回国的那些人中，大多数被李鸿章分配到祖国最需要他们的岗位——发电报，挖煤矿，修铁路，驾驶军舰。1884年，回国三年后，一个叫黄季良的昔年留美幼童从福州马尾的“扬武”号上给在上海的父亲写了一封信：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;今法人犯顺，已入马江……望父亲大人勿以男为念，惟兵事究不可测，男既受朝廷豢养之恩，自当勉尽致身之义，犹记父亲与男之信，嘱以移孝作忠，能为忠臣即是孝子等语。男亦知以身报国不可游移胆畏，但念二十五年罔极之恩未报，于万一有令人呜咽不忍言者，男日来无刻不思亲，想亲思男愈切也。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;字字泣血。一个月后，中法海战爆发，福建水师全军覆没。黄季良和他的三个同学（薛有福、杨兆楠、邝咏钟）阵亡于此役。东方人棒球队的照片上，前排右数第一人便是邝咏钟。这三个人，都是麻省理工的学生，均被提前召回国。这一年，本该是他们毕业的一年。&lt;/p&gt;
&lt;p&gt;同样地，整整十年后，甲午海战爆发，又有三个昔年留美幼童阵亡。&lt;/p&gt;
&lt;p&gt;冥冥中，似乎有个宿命在操纵着这些昔年留美幼童的人生。无论是耶鲁毕业，还是麻省理工的高材生，似乎终究难以逃脱悲剧的宿命。少数幸存者，如詹天佑、梁诚和唐绍仪（民国第一任总理），民国中后期也泯然众人，未能为中国放一异彩。1881年7月23日，留美幼童启程回国之际，美国纽约时报发表了一篇社论。这篇社论的最后几段，或许是对这代留美幼童命运最准确的预言：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;令人不可思议的是，政府认为这些学生，他们花的是政府的钱，就应该只学习工程，数学和其它自然科学，对他们周围的政治和社会影响要无动于衷。这种想法是非常荒唐可笑的。这些孩子已经学会了电报技术，而眼下中国政府还不准许在天朝圣国的土地上建设哪怕是一英里的电线。他们已经学会了铁路建设知识，而大清国刚刚拆除了国内唯一一条铁路线。他们深知公民的自由意味着什么，而他们要把这些危险的学问念头带回一个不负责任的独裁政府那里。这个政权如此的复杂神秘，以至于他大多数高贵的臣民根本不知道这个政权的准确的位置在什么地方。&lt;/p&gt;

 &lt;/blockquote&gt;




 &lt;blockquote&gt;
 &lt;p&gt;中国不可能只从我们这里引进知识、科学和工业资源模式而不引进那些带有病毒性质的政治上的改革。否则，她将什么也得不到。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;那年李鸿章和倭仁唇枪舌战，举国之内却似乎没有人意识到西方的制度是因，而船坚炮利是果。橘生淮南则为橘，橘生淮北而为枳，只是把结果引到中国这片体制环境全然不同的土壤上，终究无法枝繁叶茂。又想船坚炮利，又想不改变自身腐朽的制度，注定了晚清这场救亡图存的改革只是水月镜花。舶来的美国梦，终究，是外来的。其实中国文化本自博大精深，权力制衡、科技发达、经济繁荣早见于唐宋时代。或许追本溯源，找到适合中国文化土壤的社会体制之根，才能结出繁荣富强之果。全盘西化是福是祸，尚未可知，或许真如纽约时报所言，会是一场“病毒式”的改革。第一代留美学生开启了“开眼看世界”的大门，却只执果为因，囿于科学技术的细枝末节，未能得窥西方文化制度土壤如何催生富强之果的全貌。时至今日，国门开放，更多留学生远渡重洋求学，或可不再重蹈覆辙，而是更深入地了解成熟社会的运作方式，取其精华去其糟粕，成为中国新发展道路上的他山之石。&lt;/p&gt;
&lt;p&gt;&lt;em&gt;发表于《社会观察》2013年11期&lt;/em&gt;&lt;/p&gt;</description></item><item><title>三分大学，七分生活</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/30-college-70-life/</link><pubDate>Thu, 29 Aug 2013 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/30-college-70-life/</guid><description>&lt;p&gt;在电影《史密斯夫妇》中， 布拉德皮特曾说过：what happens in the end… you start to miss the beginning. 一晃四年，光阴荏苒，当我厚着脸皮忝居Vassar学长、自己已然卷铺盖滚蛋却又看着一波新生正在接近之际，不禁想起刚入学还是小弟的时候，和当时大四学长一起吃的一顿饭。学长仙风道骨，当时已经手握大把Top 10 研究生院的offer，看着我这只初来乍到的菜鸟，悠悠地来了一句：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;我一直觉得，&lt;strong&gt;你从大学之中得到什么，不取决于大学能够给你什么，而取决于你自己想从中获得什么&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;学长抛下这句话，飘然去了哈佛，留下我在大学四年间细细回味，如今想来，堪称我在大学期间得到的最受用的建议之一。Vassar算是典型的文理学院（liberal arts college），在普通学校、文艺学校和二B学校之中介乎于文艺与二B之间。学什么学科的都有，尤以英语文学为盛，唯独理工科不怎么受待见。虽然受此影响我在历史、哲学、经济等学科打了一圈酱油，但最终还是决定学数学。两年后无论是申研究生院还是找工作，面试我的人前五句话中必然有一句：“你丫干嘛跑到Vassar学数学？”其实我们数学系反而粥多僧少，每年不到二十个学生能够享受所有的资源。即便去了一所数学教育质量更高的大学校，我个人所能分摊到的资源（比如教授的个人指导）却未必能比得上。每条路有每条路的走法，所以我在这所山村学校数学系的走法就是我与导师和教授的关系都还不错，借着他们的人脉认识了我这个领域的大牛教授，在她的指导下写了些东西，凭此去参加了一些学术会议，写了些论文……你能想象的节奏。好的机会和成就不会主动来找你，还是要自己一步步去实现。Vassar众学科中当属表演系（drama）最强，全国驰名，而我对此一窍不通也不感兴趣。倘若当年手滑选择了大学能给我最多资源的表演系，只怕今天依然泯然众人，找不到人生方向。&lt;/p&gt;
&lt;p&gt;再比如我大三半年去了牛津大学交流，这个看似高端大气的项目其实很水很轻松，每周规定上课时间2个小时，其它随意，期末成绩竟然还不计入大学四年总成绩。那么我们这些交流生这半年得到什么，显然就不取决于牛津能给我们什么，而是看我们自己想获得什么了。我有同学花了很多时间找实习找工作，各种准备、四处面试；也有同学游山玩水，游遍欧洲列国，增长一番见识。我则主要做了两件事：第一是利用牛津丰富的图书馆资源看了不少数学文献，借机写了篇论文，之后拿去参加学术会议，在通往PhD的不归路上一去不回头。第二则是狂练体能，每天绕着风景还不错的校园跑步，左三圈右三圈。刚回到瓦村那会儿隔天和校篮球队的人打两个小时的全场，满场飞奔毫无压力。同样是去牛津的交流生，我们各得其所，走了全然不同的路。&lt;/p&gt;
&lt;p&gt;不过生活不像人民日报，处处顺心如意心想事成。满场飞奔打球的代价，就是我在大四第一学期结束的时候得了跟腱炎。这再次体现了一个让人略感不安的事实：岁月无情。如果你不是神童提前入学，大学毕业大概二十二三岁，和十七八岁的时候的体质已然大不相同。如果落下什么慢性伤病，那以后多半会一直与之相伴；反之如果养成健身的习惯，心肝脾肺肾全面达标，那么也大有可能为祖国健康工作五十年。&lt;/p&gt;
&lt;p&gt;我在大学四年间最受用的第二条建议，是读到John Dryden曾经说过的一句话：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;起先是我们造成习惯，后来是习惯造成我们 (We first make our habits, then our habits make us)&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;很多人好奇我是如何在大学四年间几乎天天去健身房的，其实真没什么秘诀，只是习惯使然，去多了之后每天到了4点都觉得骨头痒。如果你想成为一个积极上进的好少年，每天学术、读新闻、定期读书、健康饮食、外加合理锻炼，其实都在于你坚持这么做的前三五个月，之后就都是惯性的作用，想停都停不下来，到时候吃垃圾食品觉得腻，不读书觉得闷。&lt;/p&gt;
&lt;p&gt;不过双刃剑也有另一面，我朋友也好奇我左肩的伤为何迟迟不能痊愈，总拿来做笑柄嘲笑我右手锻炼得太好，同时没有刘翔的命而跟腱却得了刘翔的病，这也只能说是拜习惯所赐，每天不去健身房总会浑身不自在，所以有点慢性伤病也很难养好。我有一哥们进大学时候也算是个文青，后来谈了场恋爱，女朋友算是话多的人，于是他每天陪女朋友扯淡聊天。现在和女朋友已经分手了，却发现自己成了话痨，每天不找人唠嗑不舒服斯基。面具戴久了，就再也摘不下来。&lt;/p&gt;
&lt;p&gt;比这些生活习惯更重要的是，大学四年也是逐渐形成思维定势的黄金时间。大一大二时候的我对于大多数学科当真是来者不拒，也曾一个学期上五门不同学科的课。选了数学专业之后，思维定势逐渐成型。到了大四第二学期，我悍然选了一门宗教课，想要了解一下穆斯林、基督徒们是怎么看待这个世界的。结果直接被虐成了狗，论文甚至被打回重写，因为我和教授的思维方式几乎是完全相反的。学了很长时间的自然科学，似乎就很难去以宗教的角度思考了。在Prison Break中，T-Bag曾有一句良言：We are captives of our own identity, living in the prison of our own creation. 三观形成和思维方式定型会帮助你沉着应对生活中的潮起潮落，却也有可能让你自己禁锢自己。所谓破山中贼易，破心中贼难。我们都是习惯的产物，最难打破的往往是自己给自己戴上的枷锁。大学四年是塑造自己精神和肉体的黄金时段，与其到后来积重难返，不如从一开始好好选择自己的习惯，选择自己认同的思维方式。&lt;/p&gt;
&lt;p&gt;说到选择——大到选专业选职业，小到选课选社团——只怕是我辈中人最头大的问题。无数前辈告诉我们说要遵循自己的内心，做自己喜欢做的事。这特喵的简直就是一句废话。我要是知道自己那么想做医生或者做律师，早就在通往医学院或者法学院的道路上撒丫子狂奔了。更现实的情况是，我们对自己感兴趣的领域一知半解，浑然不知这条路走下去会意味着什么，所以也不知道自己对这个领域的兴趣到底有多深。对此我也没有一劳永逸的万灵药，但去研究生院看学校的时候，那里系主任给的建议倒是称得上金玉良言：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;做决定的时候，要考虑每个选择背后更多的选择。&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;她说：“你们以为你们知道读PhD会是什么样的，但是呵呵，读PhD的生活和你们想象的肯定是不一样的。你们其中有人会喜欢，也有人会不适应。在那个时候，你就要看到你的其它选择余地。”然后她接着就开始兜售自己学校，说如果这里各路神仙都有，氛围也很自由，你完全可以转行尝试新的机会，找到自己的真爱。言下之意，做选择的时候不要只盯着眼前的一亩三分地，更要看到未来的可能性。&lt;/p&gt;
&lt;p&gt;后来，我在一份工作和一所学校之间摇摆不定，向我的一个教授征询意见。他建议我去那个学校，理由是那个PhD项目向来以学风严谨、把关严格著称，相对而言我会在那里获得真才实学，亲炙学术大师。倘若真的能学到一招半式，出来找份工作应该是妥妥的。果然英雄所见略同，我这个教授所说的正合那位系主任所言，开拓格局，着眼未来。若非后来我申请到了延期一年入学而侥幸得以两全，我也准备言听计从，直接去那个PhD项目蜕层皮。&lt;/p&gt;
&lt;p&gt;为免文章拖沓，中间略去很多技术性细节不提，比如申学校和找工作有什么血泪史等等。若有兴趣，不妨私下交流，就不啰嗦了。尤其是瓦村的朋友，我这沙滩前浪也大概更为适用。这些经验“贬值”的速度很快，三五年后再来问我，就算我还勉强记得，只怕也未必适用于到时候的情况了。四年虚度，思来想去也就只有这三条值得一说，再要第四条就说不出什么了。不过三分大学，七分还是生活，在哪儿过日子不是过呢。跟GPA掰命，和朋友鬼混扯淡到深夜，为前途迷茫纠结，总都是必经之路。三五年后回头看，不也就一笑而过，云淡风轻。不管当下欢喜也好忧心也罢，早点洗洗睡了就好。因为，还有明天。&lt;/p&gt;</description></item><item><title>雅言难再</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/shanghainese-dialect/</link><pubDate>Wed, 18 Apr 2012 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/shanghainese-dialect/</guid><description>&lt;p&gt;09年的时候，上海本地报纸《新民晚报》发表了一篇文章，指称“说上海话是没有文化的表现”，引起舆论一片哗然，市委书记俞正声亲自下令处理该事件。一年后，俞正声在接受媒体采访时，“建议上海人世博期间不说上海话”，再次引火上身，把自己推到风口浪尖。在上海能不能讲上海话，该不该讲上海话，一直是舆论的焦点。主禁者认为上海作为国际都市，应当推广普通话，减少方言对文化和社会融合的阻碍；反对者则认为说上海方言是上海人的权利。双方你来我往，论据又常常升级到“排外心态”、“素质高低”等攻击性言论，常常在网上吵得不可开交。&lt;/p&gt;
&lt;p&gt;以现实而言，上海话走向没落甚至濒临灭绝已经是不争的事实。09年的数据显示，上海0－14岁的人口中只有4%的人以上海方言为母语，也就是说96%的小孩在家里也以普通话为母语。在这个年龄段的儿童中，一百个里面只有一个能像他们父母辈那样流利地说上海话。按这个年龄层次推算，到2075年－也就是60年后－上海话就会不复存在。&lt;/p&gt;
&lt;p&gt;争议的核心不在于怎么保护上海方言，而是应不应该保护。主禁者的论点主要是推广普通话有利于建设国际大都市，促进不同地域人群的融合。更有言论认为说上海话是没有素质的体现。不过哪怕只以上海方言本身，也确实有其历史文化价值。从语系划分来说，上海方言属于吴语，是上古汉语的分支（而普通话则被认为是中古汉语的分支之一），吴语这个分支可以追溯到6000年前甚至更早。换句话说，上海方言里面保留了一些古代百越民族的文化痕迹（“百越”为南方民族泛称，所谓“北方胡、南方越”），可以说是中原正宗雅音的传承者之一。&lt;/p&gt;
&lt;p&gt;晋代五胡乱华时期，晋室分裂国力衰弱，北方游牧民族（也就是一般我们所说的“胡人”）趁机南下抢班夺权。最后导致的结果是晋室南迁，定都建康，东晋开始，史称“衣冠南渡”。所谓衣冠南渡，是因为当时迁移的人中以士族为代表，大都衣冠楚楚，极易辨识。士族是当时社会的重要结构，一个士族门阀可以是一个完整的经济体，自己掌控一个县一个州，一般的当地农民也是依附于这个士族而生存的。所以衣冠南渡时，往往是整个士族成千上万的人一起南下，把整套北方的文化都带到了南方，其中也包括语言。五胡乱华后，北方语言不再在是原来的古汉语，而是与北方民族融合之后演变而产生的中古汉语，亦有人直接称之为“胡音”，因为是由胡人所传来的。再后来，北方方言又经历北魏魏孝文帝改革、金、元、和明清，反复与北方民族语言融合。到了明清时期，中国官员被葡萄牙人称做Mandando，意为管理中国的游牧民族，此后这成为英文单词mandarin的词根。到了清末，由张之洞等人倡议，“以京城声口统一天下，以一统国民”。于是北方官话在全国通行（其实在这之前曾有个叫卢戆章的人提议以南京话为全国统一语言），再后来中华民国和中华人民共和国都没有做本质上的更改。1955年，国务院发布了《关于推广普通话的指示》，明确指出“以北京语音为标准音，以北方话为基础方言，以典范的现代白话文著作为语法规范”。所以我们现在所说的“现代标准汉语”，也就是普通话，可以说是脱胎于胡音。&lt;/p&gt;
&lt;p&gt;而真正的古汉语，则在南方互相融合，史家多认为在江南一带保留了很多上古汉语。因此吴语，也就是上海方言所在的分支，往往被视作中原正统语言的传承者之一（我们比较熟悉的闽南语和客家话也被认为是传承者）。上海本是松江府的一部分，而华亭松江的历史，从青浦出土的文物来看已有六千年，所以不但自己一脉相承，而且经历了所有与古汉语的融合。因此上海方言本身就有很高的历史文化价值，并不低普通话一等。&lt;/p&gt;
&lt;p&gt;当然这一切已成往事。推行统一普通话的好处是不言而喻的，否则我们还会处于张之洞所说的“中国民间各操土音，致一省之人彼此不能通语，办事动多扞格”的状态。不过推广普通话是否要以牺牲有历史文化价值的上海方言为代价，却是值得商榷的。以史为鉴，建国之后的北京城是一个相似的轮回。当时，是否要保留老城区、七千条胡同还有古城墙，是一时的争论焦点。支持者如梁思成、陈占祥、贝聿铭等等，称北京是“现存中古时代都市之最伟大者”（梁思成语），其布局风格也符合中国传统的“九经九纬，径涂九轨，左祖右社，面朝后市”（《周礼》），是一座文化宝藏；反对者则认为应当顺应历史潮流，“应该过去的总是要过去的”（朱自清语）。除了知识分子的反对，普通民众还有执政党的考虑是：连饭都吃不饱，还留这些砖头做什么？其实说句公道话，执政党并非不知道这些古迹的历史价值。1948年在攻打北平时，解放军还派了专员请教梁思成北平城中的古迹，以免被战火毁坏。然而物是人非，如今当家执政，要喂饱6亿人口，国家又是一穷二白，所以执政者迫切地希望迅速看到经济和工业的增长，而非守着一堆古董饿死。加上毛主席在天安门上城楼上说了那句著名的“将来从这里望过去，要看到处处都是烟囱”，老北京就此成为历史的回忆。&lt;/p&gt;
&lt;p&gt;执政党请来了苏联专家，把北京城规划成了一个行政中心和工业城市。梁思成和陈占祥合力提出“梁陈方案”，希望与苏联专家提出的规划抗衡，建议模仿英国政府的大伦敦规划，在西郊三里河另立政治中心，而非建于原来的古城。但这无异于螳臂当车。半个世纪之后的今天，北京确实成为了一座新的国际都市，人口密集、经济发达。但是，不仅曾经的文化印记已经几乎无处可寻，将行政中心建于旧城的弊端也正如梁陈两人预言的那样日益凸显。这种以旧城为核心、以新区包围旧城、同心同轴向外蔓延的发展模式，被建筑学界成为“摊大饼”。如此发展下去，交通拥堵、环境状况恶化都是必然的结果。&lt;/p&gt;
&lt;p&gt;经济发展，生产模式变更，如此旧事物存废的问题总会时时浮现，比如现在的是否应该保留上海方言之争。毁掉一个千百年来流传下来的东西，要比建立和维系一个这样的东西要容易得多。光阴荏苒，我们在向前迈进的同时，也应当学会维系和建设。柴静有句话我觉得说得很好，“岁月让人从批判走向建设”。&lt;/p&gt;
&lt;p&gt;即使没有维系和保护，政府和社会也没有必要打压上海方言，甚至出现“公共场合不能说上海话”这样的规定。我现在在美国读书的时候，发现韩国思密达们有一个很不错的习惯：虽然他们如果坐在一桌吃饭往往会讲韩语（这当然是公共场合），但只要有一个不懂韩语的人在座，他们就都会说英语，不管是不是在和这个人说话，以示尊重。这一点其实已经是非英语圈约定俗成的规矩，中国和其它地方的留学生也往往能做到。这个规矩，完全可以移植到对待方言的态度上——如果有哪怕一个人不懂方言，就说普通话；如果所有人都懂，就没有必要坚持说普通话。亚非拉文化可以在美国融合交汇，繁荣共生，一国之内想必更应该可以。&lt;/p&gt;
&lt;p&gt;其实沧海桑田，这些变迁所引发的社会争议总是一面照射社会自身的镜子，将社会中的人心照得通透。50年前的北京城墙，铭刻下了时人对弃旧迎新的渴望，也铭刻下了一代知识分子的殚精竭虑；如今处在争议核心的中原雅言传承者，亦折射出一些人对文化统一的盲目追求，或是某些人的狭隘排外。我们在这之中说什么，骂什么，想什么，都只是佛心自现罢了。&lt;/p&gt;</description></item><item><title>抓住老鼠就是好猫</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/utilitarian/</link><pubDate>Mon, 13 Feb 2012 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/utilitarian/</guid><description>&lt;p&gt;离我在牛津大学交流的Worcetser College往南不远，便是牛津大学年轻的商学院Said Business School。这座建立于1996年的商学院不但富丽堂皇，而且门禁森严。这日我想去听一个讲座差点被堵在门外，幸好碰到一个乌克兰人带我暗渡陈仓，连过两道安全门冲破层层盘问，带我到了那个举办讲座的会议室，让我有恐怖分子潜入机要的错觉。一进房间果然大感不妥，这原来是一个给十几个MBA做的讲座，听众一个个都是商界精英高富帅的模样，只有我一个穷困本科生鹤立鸡群。于是我故作镇定，拉过一张椅子默默地坐了下来，专心听这个得来不易的讲座。&lt;/p&gt;
&lt;p&gt;讲座的标题是Understanding the size and profitability of firms: The role of a biological factor（理解企业规模和盈利能力：生物因素）。我看到标题的时候想，这怎么能跟生物扯上呢，显然是借用生物学的理论比如遗传算法、仿生之类的技术来研究市场和企业嘛，值得一听。结果没想到这个意大利人真心研究的是生物因素：论睾酮荷尔蒙如何决定你是否会成为创业家——就这居然还有十几个MBA在听？！这位意大利人滔滔不绝地讲了一个多小时他的统计研究，作为来自数学系的童鞋我表示毫无压力，不过这帮MBA虽然不都有专业背景，但付了几万磅的学费显然不是来打酱油的，于是对他的研究和模型提出各种问题，搞得意大利人应接不暇。这群在商界摸爬滚打多年的老兵油子是何等精明，统计模型又都不尽完美，被他们挑刺实在是在所难免。&lt;/p&gt;
&lt;p&gt;在被统计模型和计量相继摧残了一年多之后，你让我给他挑刺我也挑得出不少。这事儿关键的问题是，统计模型从本质上说就不是在阐述真相而是在推断真相的，所以任何模型都有可能是错的，都能被挑出刺来，而不像数学证明那样可以滴水不漏无懈可击。什么叫“不在阐述真相而是在推断真相”？先仔细考虑一下统计模型背后的逻辑吧。不管是生物、经济金融、社会学还是其它用到统计模型的学科，都是先有一小撮现实经验（比如历史数据、抽样调查结果、实验结果等等），然后根据这些现实经验建立模型和理论推断广泛意义上的真相（比如睾酮荷尔蒙是否会决定一个人能否成为好的创业家，油价和金价有神马关系等等）。这种归纳的逻辑，从本质上跟“之前一百天没有下雨，所以明天也不会下雨”没有什么不同，而不是像大家公认的严密三段逻辑那样“如果下雨地面是湿的+下雨了=&amp;gt;地面是湿的”这样对真相的演绎阐述。所以统计模型在本质上就是有逻辑漏洞的。&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;All models are wrong, but some are useful – George Box&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;但是统计模型依旧遍地都是——生物学，经济金融，社会科学等等，靠这个东西发大把论文、赚大把钞票的人比比皆是。统计模型虽然是不正确的，但是却是有用的——而正确和有用这两个不同的概念，常常被混为一谈，以至于我们忘记了加以区分。也许我们可以目测到更具男性气概的人更容易成为创业家，但统计模型会试图去判断这是否只是我们目测到的局部现象，还是更符合广泛现象并且考虑年龄、婚姻状况等其它因素。虽然不能阐明完整真相，但总能比目测更靠谱。如果结论成立，虽然是基于经验并且可能存在逻辑谬误，但至少对于我们预测未来是一个相对更靠谱的借鉴。而整个统计科学，也就基本在研究如何能搞出更靠谱更有用的模型。&lt;/p&gt;
&lt;p&gt;其实大部分学科的逻辑都是如此——&lt;strong&gt;有用的就被默认是正确的&lt;/strong&gt;，“有用”是整门学科的价值导向。这听上去很糟糕，但事实上很多学科就是这样往前发展并且发展地很好的。以历史学为例，读了那么些年历史，有个问题始终困扰着我：读历史到底是个什么逻辑？好吧我们先把读历史的分成两类——第一类是只研究过去的事儿，跟现在和未来毫不联系，就关心拿破仑是怎么死的，和珅家里有多少钱那种；另一类则是跟现在和未来结合起来，所谓“以史为鉴”的，比如罗马帝国是怎么衰落灭亡的，美国宪法是如何制定的那种。前者更像考古，更专注于历史本身，但一般没人会去搞这个，因为这明显是吃饱了撑着。不过也有我朋友司小困这种“我只是想知道真实的发生过的事情”的2货……少数情况暂不予考虑。一般读历史都显意识或潜意识地想要和现实未来相联系，洞悉人性，所谓“充分地了解过去就能预测未来”。哲学家乔治·桑塔亚纳（George Santayana）还说了，“不研究历史的人，注定要重复它。”但是这种联系，如之前所说，是归纳的逻辑、是有谬误的。且不说你能不能为罗马帝国如何衰亡找到明确的因果关系，即使找到了，如果中国出现了罗马帝国衰亡前的那些征兆那些原因，是不是意味着我们就要灭亡了？如果中国像美国那样一步步制定出一套宪法，是不是我们就民煮了？这些借鉴或许是有用的，帮助我们看清当下局面，避免重蹈覆辙（比如现在我们可以好好研究一下20世纪八九十年代的日本），但是这个逻辑却不能保证正确性。其它学科——政治、心理、社会学等等，尽皆如此。芝加哥大学的教授赵鼎新老师是我十分佩服的社会学家，他就曾言道：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;我个人提倡的是一个基本的方法论原则：一个好的理论必须要比一个差的理论能解释和概括一个复杂故事中更多的现象。&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;甚至连物理、化学和生物等自然科学也是如此，&lt;strong&gt;能抓住老鼠就是好猫&lt;/strong&gt;。了解一下科学史就知道，评判科学理论是否牛掰的唯一依据就是它是否能够解释尽可能多的现象——也就是它是否有用。就拿物理来说，一开始牛顿的理论一统江湖，但是后来发现在很多领域都无力解释，被爱因斯坦的理论取而代之，比如牛顿说光线是直线传播的，但人们发现光线经过大引力场时（比如木星啊土星啊这种地方）会弯曲，于是爱因斯坦完胜。能解释更多现象的理论，就是好理论。有用和正确的概念往往被混淆。据我所知，&lt;strong&gt;科学哲学界目前依然认为科学理论更多是预测现实的有用工具而非真相本身&lt;/strong&gt;（也有可能我还读得太少，若有偏颇还请指正）。&lt;/p&gt;
&lt;p&gt;唯一例外的，在我看来就是数学了（哲学其实也可以算是例外，因为它也是强调以严谨的逻辑探索世界的真相。但是哲学界各种鱼目混珠的人太多，有些人提出的学说完全没有逻辑但是能说服很多人，就被认为是正当的哲学，于是，按照卷福的话说，整个哲学界的水平就被拉低了，所以这里就暂时不讨论了）。其它学科比如音乐、戏剧、艺术等等，都是表现世界而非研究世界的，所以不在讨论之列。数学，尤其是纯数学，在我看来是唯一一门以追求正确性为目的的学科。数学的分类（纯数学vs应用数学）待会再说，先来说纯数学是如何追求正确性追求真相的，因而被广大人民群众误解的。纯数学到底是干嘛的？搞纯数学的到底是怎样一个人种？我觉得这是一群因为过分执着追求真相而被世人误解颇多的人。比方说，一开始学微积分的时候我们都说当x趋于0时，f(x)趋于0之类的。这个我们都能理解；但纯数学做的事情就是把它严谨化，用最滴水不漏的语言来叙述——于是有了ε-δ证明，被摧残过的人一定记得。ε-δ证明虽然复杂，但是它是无懈可击的，不像我们说“x趋于0……”时会产生各种歧义——什么叫“趋于”？x和f(x)又是神马关系？到后来整个分析、拓扑学以及所有纯数学的领域都需要ε-δ证明这样严谨的定义，才能推出有效的结论。那这些推导出来的结果有什么用？可能没什么用吧。咖啡杯和甜甜圈是同胚的那又如何？歌德巴赫猜对了又如何？你如果问搞纯数学的人这些结论有什么意义，他多半会说：“&lt;strong&gt;因为这个是真的”（because it’s true）&lt;/strong&gt;，而不是因为它有用。为什么那么多人冒着冰天雪地和严寒去登珠峰？“因为山就在那里”；搞数学的人为什么总是在倒腾一堆没几个人能理解的公式符号？因为真相，它就在那里。从一开始，纯数学就没有想追求有用，而只是想追求正确性而已。为了这个正确性，这群人和这个领域牺牲了可读性，牺牲了被广泛传播和理解的可能，于是有了大家对纯数学这圈人的理解无力。所以说追求正确性也未必是件好事。&lt;/p&gt;
&lt;p&gt;这里如此区分纯数学和应用数学，是因为很多时候应用数学也只是为了其它学科而设计数学工具，因此更多是遵循其它学科的逻辑而非纯数学本身的逻辑，也就因此不能算在追求正确性。数学真是一门很奇葩的学科，它可以身兼正确和有用两个特征，一定是双子座的。但其实仔细想想这很有道理，因为正确的东西就应该是有用，或者过了一段时间以后才体现出实用价值。数论可以算是纯数学了吧——只研究数字，不研究其它任何东西，你还想怎样？大数学家哈代也说了：“数论是一门与现实、与战争无缘的纯数学学科。”结果若干年后，大家发现数论的理论可以运用于加密和信息编码，于是现在大部分的加密方式——信用卡、网络帐号、乃至军事密码，都运用到数论中离散对数的理论。当年大家如火如荼搞非欧几何的时候，也不知道这个两条平行线在无限远处能够相交的几何体系能够有什么用处——欧几里得几何可以用来造桌子盖大楼，你用非欧几何试试？结果爱因斯坦的相对论就建立在黎曼几何之上（again，光线是可以弯曲的嘛）。所以有人认为纯数学已经领先现代科学几百年了，数学家们可以消停个几百年，等大家赶上来了再继续发展纯数学。&lt;/p&gt;
&lt;p&gt;借着这个走出象牙塔的契机，也顺便考虑一下象牙塔之外的世界，看看正确和有用的区分。上个暑假我做了一个实习，启发我思考了几个问题（详见《&lt;a href="https://d4xm6ha8xilrh.cloudfront.net/posts/%E7%AC%AC%E4%B8%80%E6%B5%81%E7%9A%84%E6%99%BA%E6%85%A7/" target="_blank"&gt;第一流的智慧&lt;/a&gt;
》），其中之一就是什么时候选择严谨的逻辑，而什么时候又应该选择向现实妥协？很多现实中的存在是不讲道理的，比如说一个企业有一个项目，它很有可能从最初建立开始就没有明确的战略规划，从流程上来说都是不符合规定的，甚至有可能是有一些伤天害理的；但是它就是能挣钱，它就是神一般地存在了。那么我们是应该遵循严谨的逻辑推倒重来还是应该向现实妥协见招拆招？当时纠结得不轻，现在想来那时还是too young too simple，因为这就是一个正确还是有用的问题。两者在很多时候不可兼得，选择哪一个就要看企业管理者的偏好和信条了。&lt;/p&gt;
&lt;p&gt;说到偏好和信条，我觉得一直以来，我们都被教导得认为有用的就是正确的，往往将两者混为一谈。比如大学报考专业要报有用的、以后有前途（钱途）的专业，否则就是不正确的决定。这也难怪嘛，国家政策都是“能抓住老鼠的就是好猫”，更别说老百姓了。我觉得选择“有用”这条路并没有错——很多学科虽然追求“有用”多过追求“正确”，这并不意味着它们就不好——它们依然很好地帮助我们去理解这个世界；我也觉得人往高处走，谋求一个对自己有利的位置和处境完全是天经地义的；但是如果盲目把有用等同于正确，那也许就错了。如果不知道自己真正想去哪里，不知道自己“正确”的方向在哪里，也许盲目走“有用”的路未必有用。&lt;/p&gt;
&lt;p&gt;值得注意也让人感到欣慰的是，走正确道路的人似乎往往是真的能走到最远的人，比如乔布斯和他的苹果，比如Zuckerberg和他的Facebook。乔布斯的演讲脍炙人口就不必多说了，他说我们要倾听内心的声音做自己最应该做的事情，到死去时不需后悔；而Zuckerberg从一开始就觉得做Facebook是件很酷的事情，一心只想把它做好，之后全力把它打造成社交平台，不急于融资上市，因为他知道什么是正确的应该做的事情，而融资上市只是有用的手段而已。他在公开信中言道：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;We don’t build services to make money; we make money to build better services…We don’t wake up in the morning with the primary goal of making money, but we understand that the best way to achieve our mission is to build a strong and valuable company.&lt;/p&gt;</description></item><item><title>第一流的智慧</title><link>https://d4xm6ha8xilrh.cloudfront.net/posts/first-class-wisdom/</link><pubDate>Mon, 29 Aug 2011 00:00:00 +0000</pubDate><guid>https://d4xm6ha8xilrh.cloudfront.net/posts/first-class-wisdom/</guid><description>&lt;p&gt;临离开iJoin之前，我和苏Bob聊了一个下午，以为已经把参加iJoin一路以来的心得想法都一吐为快，可以了无牵挂地move on了。然而在结束iJoin快一个星期之后，我发现我嘴里还会时常迸出“风险管理”、“流程优化”这种术语。所以说，人只有经历过了一些东西之后，才知道它对自己的影响有多大多深。果然不假。&lt;/p&gt;
&lt;p&gt;iJoin今年所做的事情是，从世界各地五湖四海集合了一群对公益和咨询感兴趣的大学生，在暑假为三家NGO全职提供免费的咨询服务。简单地说，就是我们这群大学生为三家NGO做咨询，不收钱。我们逐渐在前期培训和实际case的摸爬滚打中了解了咨询是怎么回事，也对公益界有了更多了解，为公益组织的发展做出点力所能及的贡献。&lt;/p&gt;
&lt;p&gt;大学生的学习能力和适应能力是惊人的。大家在短短的一个多月时间内掌握了不少咨询工具，和客户做了不少有效的沟通，最后拿出来的最终方案也是各有亮点。战略转型、人力资源架构、绩效评估体系，简直难以相信我们在这么短的时间内搞出了这么专业的东西。当然，后遗症就是我前面提到的，经常在不相关的时候会迸出一些术语，甚至觉得打魔兽都是在练习流程优化（如果你仔细想想，这其实真的挺有道理的……）。&lt;/p&gt;
&lt;p&gt;不过，**大学生究竟可以为公益事业做出怎样的贡献？**如果更批判一点地看，一方面我们不是专业人士，能力不足人脉不足资金不足，一个月的工夫我们走了不少弯路，做出来的东西可能还存在很多可以改进的地方，不如专业人士做得有效率做得专业；另一方面我们把方案（和执行手册）给了客户，客户未必能执行，我们所做的这一切未必能给这些公益组织和公益界带来根本的提升（我的同组队友你们懂的）。&lt;/p&gt;
&lt;p&gt;所以，大学生可以为公益做出怎样的贡献、应该怎样为公益做贡献是可以细细思考的。我们究竟改变了些什么？是不是我们想要达到的效果？往大里说，这可以归结到公益模式的一个对比：公益既可以像是特蕾莎修女那样舍己为人由下而上，也可以像比尔·盖茨那样手握大把资源建立基金会由上而下。那么，你是想在积累了足够资源（能力、人脉、资金等等）之后开始像比尔·盖茨那样做公益，还是想直接投身于公益事业从一点一滴做起？大多公益组织在这两个极端之间徘徊，我们大学生做公益也是。每个进入公益界的大学生或许都应该考虑一下这个问题。你可以甩开膀子就干，但最好知道自己在干什么，不要被理想主义的热情冲昏了头脑，否则事倍功半。在这里摘录两个观点截然不同的quote，供大家思考：&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;有关公益，助人，支持，微薄之力，不要等到条件成熟了再去做，条件永远不会完全具备，真正地开始才是创造条件 ——uJoin语录&lt;/p&gt;

 &lt;/blockquote&gt;




 &lt;blockquote&gt;
 &lt;p&gt;当我们还没有积蓄力量的时候就无法改变什么 ——帕姆.布朗，《南丁格尔传》&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;说完了大学生作为一个整体，再来说说我自己在iJoin的经历。我现在专业是数学，有志读一个PHD摧残一下自己、完整一下人生。iJoin应该是我近年来参加的最接近实事、最接近现实社会的项目之一。需要解决的是客户实际存在的问题，经常要头脑风暴，交叉验证，反复和客户沟通，到各处拜访学习经验（benchmarking），真刀真枪地要解决一些现实问题（也因此学到了很多东西）。作为一个来自数学系、从高中开始读《逻辑学》的童鞋，我发现了一个重要的问题：&lt;strong&gt;现实是没有严谨的逻辑的。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;比如说，我们常用的一个方法是参照（benchmark）最佳实践（best practice）给客户提出建议，也就是找同一个领域做得最好的组织来做标杆。问题是，我们如何证明这是适用于客户的？如何证明这些经验对于客户来说就是最佳的？我们可以列出N条理由证明那个最佳实践与客户的情况有多相似，但没有办法严格地去证明，因为这种逻辑是归纳式的（当然应对之策有风险管理，但总不能一直依靠风险管理）。另外，在实际给客户做咨询的过程中，我也发现有些组织是不严格按照自上而下的逻辑设计项目的。一个组织做一个项目可能仅仅是因为它有能用的资源，而不是这个项目符合它的战略。这样做的结果，就是没有办法证明这个项目做得好还是不好，因为它连预期目标都没有。&lt;/p&gt;
&lt;p&gt;现实是如此的“没有逻辑”，可是我们不能就此止步。没有那么严谨的逻辑，公益组织和咨询机构依然在蓬勃地发展，这个世界还在正常地运行。现实有现实的智慧，不能因为逻辑上可能存在的漏洞就停下脚步，这样只会扼杀更多地创意和热情。&lt;/p&gt;
&lt;p&gt;所以我面临的问题是：**什么时候选择严谨的逻辑和一丝不苟的理性，而什么时候又应该选择向现实妥协，追随热情、理想或者直觉？**这让我想到《黑天鹅》一书中的一个虚构案例：假设硬币是公平的，我把它抛出99次，每次都得到正面。我下一次得到反面的概率是多大？严守逻辑的人可能会说，还是二分之一，因为假设说硬币是公平的，所以从统计学上说依然是二分之一。但现实的人可能会说，必然还是正面。虽然你有那个假设，但既然你已经99次抛出正面，说明那个假设显然是错误的是忽悠人的，我可不上你的当。谁是谁非，可能没有定数。&lt;/p&gt;
&lt;p&gt;除了执着于逻辑之外，我同时也认同中国传统哲学，常反躬内省，秉持中庸之道，相信老子的“为而不争”，习惯于默默做事，不喜张扬。但这种处世之道似乎并不适应现在的潮流，尤其不适合于做企业或做公益。现在做什么都求一个“人气”——玩人人的看重访问量，搞企业的要推广品牌，做公益的要传播理念。于是乎各种营销技巧层出不穷，似乎没人在乎“君子务本，本立而道生”，而只求能有知名度（例：脑白金）。&lt;/p&gt;
&lt;p&gt;我一贯相信“酒香不怕巷子深”。但在这个网络化平民化信息爆炸的时代，我也必须承认再香的酒也需要宣传，否则没人会知道，只会被淹没在茫茫人海中。真的踏足现实社会，也必然要在&lt;strong&gt;务本和技巧中找到平衡&lt;/strong&gt;，正如我们做微博营销技巧的时候也有一条十分重要的建议就是提升被宣传项目本身的质量，只有自己的质量提高了才能吸引人。然而这个平衡点是很难找的，虽有“低调做人，高调做事”的指导原则，但做事和做人有时候没有那么清楚的界限。王阳明所说的知行合一，只怕没那么容易。&lt;/p&gt;
&lt;p&gt;美国小说家Scott Fitzgrald曾说过，&lt;/p&gt;



 &lt;blockquote&gt;
 &lt;p&gt;the test of a first rate of intelligence is to have two opposed ideas at the same time and still retain the ability to function （第一流的智慧莫过于在自相矛盾的情况下仍能够发挥作用）&lt;/p&gt;

 &lt;/blockquote&gt;

&lt;p&gt;上面说的这些——大学生应该怎样做公益、何时选择理性何时选择感性、如何在务本和技巧间找到平衡——好像都是寻找一个合适的度的问题。这次暑假的经历没有给我一个明确的答案（实际上生活中我们很少真正得到终极的答案，不是么），但至少有了一个探索的机会，让自己处于未知的陌生的环境下去摸爬滚打，去慢慢成长。正如坛主所说，当你最感到uncomfortable的时候，就是你成长最多的时候。&lt;/p&gt;</description></item></channel></rss>