研究者的心、道、力、术

前几天和同学聊做研究需要什么,最后总结是四个层面:心、道、力、术。 术,包括写paper的技术,social、marketing的能力,同事称之为“soft skills”,总结就是做出成果之后取得世俗成功的能力。 力,包括做实验,推理论,写代码,做工程的能力,总结就是解决问题的能力。所谓“出活”,主要指的是这个。更新:在不同阶段,力的重点是不同的。比如作为PI,力的重点应该是组织研究,管理团队,创造有利于科研的环境。 道,包括把握科学技术前进方向,提出好问题的能力。 心,是一颗好奇、勇敢、纯粹、乐观的心,是对科学的热爱,对真理的追求,对人类未来的憧憬。 在短期内,术和力是重要的,因为这是做研究、在学术界生存的基础。而长期看,道更加重要的,这是一流研究者需要的能力。而决定一生上限的,应该是心,这是一流研究者的灵魂,是我最珍视的东西。

April 9, 2023 · 1 min · 7 words · Salix

OpenAI与古田军号

“一九一七年,英国步炮兵协同,一九一八年,德国步枪冲锋枪火箭喷射器协同,一九一四年,火炮,机枪称霸战场,一九一六年,坦克出现。你告诉我,你告诉我,打枪有用吗!?打枪有什么用?(捡起枪)八八式,德国枪,一米二五长,八斤重,口径七九二,铁瞄,五发圆头弹。你玩的再好,在永备工事和坦克面前,你能干什么?你能干什么?你能拿着这个打坦克吗?你打给我看看啊!?打枪打枪,神枪手,你一辈子就会干这个!你没了爪子,红军没了你,没了神枪手连,就tn的不干红军了吗!?神枪手,神枪手,去tnd神枪手(摔枪,指同伴)他,还有他,还有我,曾经都是神枪手,有什么了不起!?组织,纪律!你懂不懂!?科学的组织,钢铁一般的纪律,红军有比铁还硬的决心,比铁还硬的信心,你有没有!?你有没有,你告诉我有没有!?”——电视剧《十送红军》 “There is no single development, in either technology or management technique, which by itself promises even one order of magnitude improvement within a decade in productivity, in reliability, in simplicity.” —— No Silver Bullet — Essence and Accident in Software Engineering, Fred Brooks, 1986 ChatGPT和GPT-4的推出,让很多人感叹OpenAI技术的强大。除了OpenAI,DeepMind的很多工作也让我惊叹,他们仿佛可以流水线生产AlphaXXX。AI技术当然是我很关注的东西,不过我也很关心另一个问题:为什么OpenAI和DeepMind可以走到这一步? 和诸位朋友讨论之后,我认为最关键的是两点: “投资开创性技术以求未来的巨大回报”的商业环境 现代化的研究指导思想和组织方式 第一点比较麻烦,要求的是成熟的商业-技术闭环,去产生技术研究的驱动力。美国是老牌资本主义国家,这方面我们一时半会很难追上。也许我们应该用别的方式产生驱动力,这是我不懂的领域,就不讨论了。 第二点是本文的重点。 在硅谷工作一年之后,我意识到,优秀的产品靠的不是一两个技术,而是一系列技术的结合。具体的一两个技术,想学总是可以学的,可是要做一整个系统,需要在更大的规模更好更快地发展一系列技术,这就需要先进的指导思想和科学的组织方式。 这让我想到了三湾改编和古田会议之后的红军,在此之后,红军脱胎换骨,与旧军队产生了代差。红军能打胜仗不是靠神枪手,也不是靠一两个会打仗的将领,而是靠先进的指导思想和科学的组织。有了这样的思想和组织,他们做的事情会和旧军队不一样,就算打输了一场战斗或者战役,也迟早星火燎原。 同样的,OpenAI和DeepMind靠的也不是一两个秘密技术或者天才。他们的指导思想包括 倚靠数据而非人的设计 努力scale up,大力出奇迹 快速迭代 有的放矢地(而非散漫地)做辅助性研究和软件工具,提供“轮子” 他们肯定还有其他我不知道的指导思想。他们也一定有科学的组织方式,可以把100位左右的研究人员组织起来,有的放矢地去做研究,最后实现一个大目标。这个规模远远大于高校实验室,而研究又和寻常的工业界软件开发不同,我认为这种组织方式也是新的东西。可以说有这样的思想和组织,DeepMind可以源源不断地生产AlphaXXX,一两个项目的失败根本不重要;OpenAI也迟早能做出让人惊叹的大语言模型。 这样的思想和组织并不是凭空产生的。就好像红军的思想和组织起源于马克思主义,脱胎于当时的国情以及革命初期的斗争经验。OpenAI和DeepMind也一定是继承了其他地方的优秀部分,并结合自己领域的现实情况以及过去的实践产生的。比如 倚靠数据而非人力是基于“我们有海量数据”这样的现实情况 努力scale up是基于过去研究发现“scale up会有更好的效果” 快速迭代是软件开发的指导思想 注重基建造”轮子“也是软件开发的思想 我不知道他们的组织方式是什么样的,但我相信也一定是结合了高校实验室和工业界软件开发的优秀部分,再有所发展。 不应该单一地、静态地理解这样的思想和组织。虽然我们总喜欢说“最关键的是xxx”,但是指导思想和组织方式本身就是一系列的东西,又是在不断发展的。由于面对的问题不同,条件也不同,我们也没法照抄这样的思想和组织(他们也不会让我们抄)。只能说,我们要重视,并在我们的实践中继承发展属于我们自己的指导思想和组织方式。 最后稍微延伸一点。人和人之间也不是说靠一两个技术就能相处愉快的。依靠一系列共同承认的指导思想和处理问题的方式,可以解决未来一系列的问题。

March 16, 2023 · 1 min · 70 words · Salix

新冠口服药与选择偏差

本文由我的朋友撰写,经其同意发布。 本文中的“作者”指代学术论文的作者,“审稿人”指代学术论文的审稿人,“我们”指代本文的作者(除非出现在英文引用/翻译之中)。 引言 前不久随着国内新冠疫情政策的改变,Paxlovid作为新冠口服药被广泛讨论,在国内一些城市已经可以买到并使用。最近身边感染的人很多,大家也非常期待能有药物来帮助对抗新冠。 这个时候,我们关注到饶毅老师的微信公众号在2022年12月29日的一篇文章《说谎成性的写手编造谣越来越离奇:美国医学院教授吃美国药是听中国抄袭博士的话?》,提及了学术界对新冠口服药的看法。这里粘贴一部分饶老师文章里的话: 能否识别如此简单的伪君子,是判断一个读者是否群盲的一个标准。 而一般人不清楚,中国生物医学的博士现在遍地都是。一个合格的博士(相对于水博士)是不会靠短视频、不会通过微信来了解药物,而是阅读英文原始论文来了解药物效果。 实际上,最新的科学文献,对于Paxlovid对于65岁以上的治疗作用还有疑问(附件1)。 而对于65岁以下似乎无作用还有担忧(附件2) 中国最近推出一个药VV,中文媒体普遍忽略说明的是,这个药是外国药物的衍生物。中国医生在国际刊物发表结果,认为其作用不逊于Paxlovid(附件3)。 饶老师说的“对于Paxlovid对于65岁以上的治疗作用还有疑问” 来自于一个审稿人对一篇论文的意见。这个论文以及审稿意见(也就是他说的“附件1”)很容易查到。论文是2022年9月在新英格兰医学杂志发表的,题目是Nirmatrelvir Use and Severe Covid-19 Outcomes during the Omicron Surge,其中Nirmatrelvir就是Paxlovid的第一种成分。虽然我们不是生物医学的学生,但是可以越俎代庖来看一看,开拓视野也是好的。 审稿人提出的问题 这位审稿人说: Arbel et al. (Sept. 1 issue)1 found that among adults 65 years of age or older, the rates of hospitalization and death due to Covid-19 were lower among those who were treated with nirmatrelvir than among those who were not. We are uncertain whether these results are generalizable to the untreated population for two reasons....

January 7, 2023 · Lotus

挣脱痛苦需要更痛苦更漫长的劳动

我身边的朋友可能知道,国内的疫情让我非常沮丧。 昨天晚上和M兄聊了一会,心情好了一些。M兄的几句话在我脑子里萦绕一宿,醒来时决定记录下来: 疫情对落后地区的人来说尤为痛苦,但是当把直接造成他们痛苦的防控政策打碎后,迎来的是更痛苦的现实。这不是打倒了几个坏人,世界就能变美好的,而是世界本身就是充满痛苦的,挣脱痛苦需要更痛苦更漫长的劳动才行。只有接受了这种设定,才能顶着疫情撸起袖子干。躺下不干情况并不会变好。我现在只盼着自己能尽量不要拖我司后腿,保障手头的一堆项目开展。

December 24, 2022 · Salix

信息堡垒(Infortress): 信息中心在去中心化传播时代的价值

引言 出于某些原因,我开始思考在去中心化信息传播的时代,如何准确、全面、及时、广泛、低成本地传达信息,尤其是当信息的发布方拥有权威时。 比如以下的例子: 老师如何发布信息给多个班的学生 商业公司如何宣传自己的多种产品 有关部门如何辟谣 互联网去中心化传播时代的挑战 有人可能会问,既然信息的发布方拥有权威,信息的传递岂不是非常方便?然而情况并非如此。在这一章,我们简要讨论权威信息发布方所面临的挑战。 各大互联网社交平台是当下主要的信息传播渠道。个人、自媒体、组织,都拥有在社交平台发布信息的能力。本文的去中心化,指信息的发布者的去中心化。平台本身虽然还是中心,但首先并不是信息的主要发布者,其次也不是信息的唯一渠道。 我们都说现在信息越来越碎片化。微博有字数限制、视频越来越短。很多人认为人类的大脑可能更容易接受碎片化信息,互联网社交平台为了吸引用户迎合了这种喜好,也进一步加强了这种喜好。我这里有另一个角度,从商业模式出发。 大多数互联网社交平台,其动机其实不是为了帮助用户发布信息,而是为了让用户接收自己发布的广告。可以说用户发布的信息只是卡车,平台发布的广告才是货物,卡车只是为了把货物递送给平台用户。因此这些平台天然抵触大段信息,因为那样就无处插入广告,至少不利于用户接触广告。这些平台天然亲近碎片化的信息,因为广告就是碎片化的,这样可以方便广告混入其中。 权威信息发布方的一些需求和社交平台是不匹配的: 信息发布方需要准确、全面,而我们刚刚已经论证了,社交平台天然抵触大段信息。 信息发布方需要实时发布或者更新信息,然而如果过于频繁推送信息,反而可能引发受众的反感。 信息发布方需要广泛地传播信息,然而社交平台擅长让情绪化、碎片化的信息广泛传达,反而会淹没高质量的信息。 信息发布方需要低成本维护。然而现实中为了触及最广泛的受众,信息发布者需要维护众多平台上信息的准确、全面、及时、一致,还要适应各个平台本身的限制,是非常麻烦的。 当然,权威信息发布方为了吸引关注或者提升好感度,也会有发布碎片化信息的需求。可是这样碎片化的信息,与重要的正式信息混杂在一起,不但显得混乱,而且无法精准投递给不同受众。有时候受众需要的是带感情的信息,正式的信息起不到安抚的作用,甚至会火上浇油。而有时候受众需要的是正式的信息,却发现不知道去哪里获得。 基于以上的原因,权威的信息发布方在互联网去中心化传播时代算是客场作战,有巨大的劣势。 信息堡垒 既然权威信息发布方在社交平台有巨大的劣势,那不如建设好信息中心,发挥中心化的优势。 这种信息中心需要满足以下要求 单一。一个信息中心只服务于一个信息发布方。信息中心由信息发布方完全控制,不受到社交平台的限制,不被其他发布方的信息干扰。 准确。信息中心的信息是信息发布方意志的精准描述。 全面。信息中心需要容纳信息发布方需要发布的所有信息,同时建立信息的互联。信息受众在其中不仅仅可以找到自己需要的信息,也会被引导接触其他相关信息。这就造成了不同信息的交叉传播。 敏捷。信息发布方可以实时更新信息。信息中心并不推送信息,所以也无需担心受众厌烦。 易用。这体现在三个层面。第一,信息受众可以很容易接触到信息中心,不需要账号。第二,在信息中心内部,用户可以轻松通过搜索/分类/标签等方式找到自己需要的信息。第三,信息本身的表达方式是精心准备的,简明易懂,可以有不同的详细度。 我将这种信息中心称之为“信息堡垒”(infortress)。 有些人可能注意到,信息堡垒更多是被动地提供信息,那么如何做到信息的广泛传播呢? 互联网社交平台提供信息的入口,向用户通知信息的发布并提供链接,也就是将流量引入信息堡垒。信息堡垒也可以提供各个平台账户的信息,引导用户关注,实现平台-堡垒-平台的互联。 当然还有其他办法将流量引入信息堡垒,引入流量嘛,有的是办法。 尽量为信息堡垒建立“最准确最及时最全面的信息来源”的形象,让受众在需要信息时第一反应就是去信息堡垒。 在社交平台上挂链接的不一定要是权威方,如果质量够高,肯定有其他人乐意转发到平台上。 信息堡垒不仅仅是提供干巴的信息,也可以提供更具娱乐性但也有不失权威性的信息(比如专家访谈),使得“逛堡垒”成为有趣的事情,以此吸引受众。 其实有的时候信息堡垒并不需要引入用户,因为在这个低质量信息爆炸的时代,用户有获得高质量信息的需求,会主动寻找高质量信息。信息堡垒只需要做好信息的质量,以及信息的交叉传播就可以了。 值得注意的是,由于不再需要考虑权威性,在社交平台发布的信息也可以更灵活一点,更有感情一点,注重受众的情绪。 一句话总结就是,信息堡垒作为信息源,注重权威,社交平台将流量引入信息堡垒并影响受众情绪,注重传播。信息堡垒与社交平台各司其职,这样的解耦可以解决权威和传播的冲突。 有些组织一味迎合新媒体的潮流,几乎完全放弃了信息堡垒的建设,而把社交平台作为自己的唯一战场,在我看来是比较可惜的错误。 案例 其实现实中就已经很多这样的实践,基于这样的思路也有更多事情可以做。 教学网站。教师尽量把所有的材料都放到教学网站上去。但是学校统一的教学网站和信息堡垒有一定差别,首先是不受教师完全控制,其次是多门课并不方便。我可能更想搭建自己的网站,把我教学和研究需要公开的信息都放上去(给我的其他课程以及研究打广告,这可不就是信息的交叉传播)。学校教学网站可以用于发布成绩等等隐私信息。 个人网站。我已经基本放弃所有的社交平台了,所有的信息发布都在个人网站。由于我不需要吸引受众,我也不会在社交平台介绍这个网站,只会邀请少量好友观看。我发现这样不但更加方便灵活,而且可以让我更系统地组织想法。 商业公司的官方网站。公司虽然有社交平台账号,但是大多只是向用户通知信息的发布和提供链接。有很多公司也会在官方网站上放技术博客和产品文档。这一方面国外的一些公司做的很好,相比而言国内的公司整体差很多,我甚至经常找不到公司的主页,在我看来是值得改进的。 某些部门的官方网站。这方面美国的CDC做的不错,可以借鉴。

November 25, 2022 · Salix