夏天,整科14级半数的学生进入了世界知名的实验室做暑研。
二十一世纪,生命科学与数、理、化、工程、信息等定量科学广泛交叉融合,引发的“第三次生命科学革命”正拉开帷幕。北大在2014年开始在元培学院设立“整合科学实验班”,旨在打破传统学科之间的藩篱,实现数、理、化、生的整合,培养新一代的跨学科创新型人才。
汤超教授是北大整科最核心的定量生物学研究领域的领头羊之一,谈到整科的构建,他认为把各个学科的课程整合起来,对渗透学科交叉思维的科学前沿有更大的帮助。从前北大强调分开,较少强调整合,现在整科的发展恰好填充了这块空白,同时也适应北大本科教学改革多样化的要求。
整科提供了有别于传统学科的另一种可能性。谈及“整合”二字,他以“微積分与力学及常微分方程”这门课程为例,溯源了“牛顿发明微积分,给他的力学系统找一个数学语言”的学科历史,认为数学和物理的整合“更自然,更接近于这个学科的本质”。数院的数学分析比整科的数学更严格更体系化,但整科从问题本身出发的思路,则更适合于纯数学以外的其他自然学科的数学应用。
整科的第一版培养方案是一批不同专业的教授讨论了很多次才确定的,之后在行进中根据遇到的问题进行调整,四年来一直都在更新。
整科其实“学生物”。
教授定量分子生物学的齐志老师陪伴整科走过了四年,但他仍然记得走上岗位之初,他曾问一位老教授,真的把一门课上好要花多长时间;老教授说,十年。四年讲同一门课,内容已经滚瓜烂熟,但他依然不敢懈怠。每一年开课前,他都拿实验室的研究生当小白鼠试讲,根据反馈调整,再给本科生上课;讲义也不是一成不变的,要把最前沿的研究渗透进去;听讲的人也是一茬一茬地换,每一年都要重新掌握学生的情况,比如有些竞赛生知识储存丰富,但要针对他们的薄弱点进行训练,如专业名词的英文学习。
学生时代的齐志老师,深信二十一世纪是生物的世纪;但真正进入二十一世纪,齐志老师发现,二十一世纪确实是生物的世纪,但生物研究已经从定性转到定量。整合科学的定量分子生物学区别于传统的分子生物学就在于——用定量的技术手段描述生物。
北大整科目前的课程设置围绕生物自然体系,最对口的研究方向是定量生物学。但是整科前两年的课程是专门设置的,后两年有很大的自由度,有志于数学、物理、化学、信息与生物的交叉研究,高年级时可以自由选择相关的课程。
整科14级朱宇森有志于工科与生物的交叉,后两年自主选择了相关的课程,跟随黄岩谊老师做了微流相关的实验,目前在中科院半导体所做脑电实验。他和许多整科同学一样,脚踏实地从整科的构架出发,在后两年却走向比狭义的生物定量学更宽阔的研究道路。
除了整合课程,多达26学分的实验课-构成了培养方案另一大部分。整科第一年的综合实验课程是专门设计的,都是些以问题为导向、颇有趣味的小实验。第二年则挑了三十多个与课程相关的实验室,学生从中选八个实验,跟着不同的老师,到不同的实验室,感受不同学科甚至跨学科的真正科研性质的实验。
实验课教师黄岩谊强调,虽然北大的传统就很重视本科实验的训练,但整科更注重的是不同学科实验的整合,它的实验手段和思维方式,是多个学科的整合。有一次他把基础的光学的基本知识穿插在实验里全部讲完——几个小时消化掉大学本科最重要的光学内容,然后做一个小实验——利用手机的摄像头,少数零件、工具和器材,做一个放大倍数尽量高的显微镜。
不同于传统实验,整科实验把真正的科研思维融入到本科实验教学中,每个实验会有明确的主题,但是没有按部就班的实验大纲,要求学生快速学习、快速应用、快速检验,像真正的科研那样,提出一个想法,解决一个问题。比如制作测量振荡的化学反应的实验装置时,需要化学基础,需要设置电路,需要学会编程,与繁重的任务相对的却是极短的时间。每周一次的实验课,整科的学生早晨八点钟来到实验室,往往下午五点钟才走出实验室。
整科是一个传说中学术大神扎堆出没的地方,就如14级的20余名学生里,有奥赛奖牌得主、有自招高分考生、还有省市状元,这些是他们辉煌的过去。而选择做第一个吃螃蟹的人,伴随着整合科学一起成长的四年里,也流传着各种各样的传奇—号称彬神的王彬大时帮全体整科同学补习群论知识:林咏婕同学大一下学期开始旁听整科的课程,最终成功从工学院转入……
数据科学:北大这个学科竟然教“炼丹”?
双十一全天交易额再创新高;微信音视频日成功通话次数较去年增长106%;人工智能在IQ测试中超越人类;人类棋手不敌AlphaGo;AlphaGo Zero 3天击败AlphaGo;……
2017年,一股有关人工智能、大数据的风潮席卷而来。对于北京大学数据科学与大数据方向(以下简称数据科学方向或数科)的同学来说,数据科学成为全社会瞩目的焦点,在情理之中,当然也给他们带来了一些小小的自豪感。
数据科学是什么?能吃吗?
北大数据科学方向15级本科生、北大前数据科学学会会长、现元培学院学生学术协会主席伍维晨就谈到,目前对“大数據”“数据科学”这些概念存在“滥用和误解”。数据科学强调的是对数据进行深入分析,并不必然要求大量的数据。现在的研究主要面向大数据,是为了适应数据爆炸的背景。同时,“大数据”研究也不单指研究数据量的庞大,如果只是采取简单的描述性统计,那么再大的数据量也不能称作“大数据”研究。数科领域现在最火的“深度学习”,大众看来神乎其神,却被业内的人戏称为“炼丹”——只知道炼出来是个丹,但是不知道炼丹炉内究竟发生什么了化学反应。唯一比古代的“炼丹术”好的一点,可能是古代炼丹炼不出长生不老药,而深度学习能“炼”出可应用的东西。
另一方面,由研究到从业,社会对“大数据”人才的需求量都非常大。社会需要这样的人才:不仅要有数学、计算机、统计的坚实基础,也要能懂模型算法、解决实际问题。这些,在单纯的数学或者说统计、计算机的专业难以达到;数据科学便应运而生。北大的数据科学本科方向在数院、信科两院都开设,元培数据科学则进行了培养方案的进一步优化整合。数院、信科的数据科学方向的培养方案强调数学科学和计算机科学的专业性,站在数据科学的角度讲,就包括了一些与数科不直接相关的课程,比如在纯数学领域非常重要的“解析几何”、号称信科“第一大神课”的计算机系统导论(ICS)。伍维晨曾提到的数据科学两大面向,是元培数据科学的培养方案的根据之一:“第一是统计的面向,例如概率论,数据统计;第二是计算的面向,例如数据结构与算法,算法设计与分析,优化算法。”基于这点,数科展现了以数据为核心的学科交叉融合。
鄂维南教授曾经将中国大学生和西方大学生作比较,认为中国大学生往往给人留下勤奋用功、大量刷题,却缺乏学习的主动性和独立思考能力的刻板印象。作为数科专业的建制人之一,他希望改变这种现状,而必要的一个手段,就是用足够的自由解放学生的自我驱动力。
数据科学15级的张宏毅对“数理逻辑”课堂上的“形式化”论题记忆犹新。通俗来讲,形式化过程就是把想要表达的意义用符号表示出来。“数学就是要研究,我们怎样去形式化以使得自然语言最严格”、“我现在说了一句话,如何用符号最能表达我的意思?我把所有的话都写成符号,是不是能表达世间所有的意思?”,从数学符号问题,张宏毅展开丰富的联想。他甚至想到“可计算性”,想到计算机的计算能力和人脑的计算能力的区别界限。虽然这些问题目前可能没有答案,但这些思考,使他不仅将数科作为他生命里的一个职业,更试图为之奠基。
张宏毅选修的数理逻辑,在北大的信科和数院都有开设,但是难度有差异。在数科,同学有较大的选择权。因为对这方面感兴趣,张宏毅选了数学学院开设的稍难的一门。事实上,数据科学方向的培养方案十分自由,2016年的培养方案是学生自己参与制定的。数科毕业的硬性学分要求是130分,比普通院系少十几分,目的就是精简课程、突出核心,同时让大家在选修课上有更多自由发挥的空间。自由的空间让他们将兴趣的触角伸向了各个方向,以数据科学为根,盛放出绚烂夺目的花。
数据科学是一门理论性和实践性并重的学科,它有着非常理论性的面向,比如统计学理论:也有非常实践性的面向,比如数据科学在医疗、交通、环境、金融等各行各业的应用。
在医疗方面,CT图像要用X光照射,但X光对人体有伤害。用比较低剂量的X光照射可以减轻对人体的伤害。但剂量越低,噪声就越大,会加剧检测中的干扰。数据科学可以把模糊的图像还原成清晰的图像,从而解决这一矛盾。
再如无人驾驶。对人的驾驶来说,从目标的确定开始,然后对周围的环境进行判断,再由一系列复杂的生物化学反应得出对情境的判断,最后决定左拐或右拐,加油或刹车。这个过程人工智能应该怎么处理呢?这也需要数据科学。
责任编辑:尹颖尧