或许你不止一次听说过机器学习却不知所云,或许你刚刚接触统计不知如何探得门道,或许你已初窥管豹并想提升自我,这一次,我们有幸请到吴喜之教授接受我们的采访,与我们聊聊统计,为大家指点迷津。其人瑾瑜,其言金玉,听君一席话,如醍醐灌顶,豁然开朗。
真知灼见 高屋建瓴
吴老首先阐释了机器学习、统计学、数据科学的联系与区别,他认为机器学习与统计学研究的内容比较相似,而数据科学包含着机器学习与统计学。在计算机飞速发展的过程中,统计学依旧循规蹈矩,没有及时与新兴技术融合,导致了学界计算机水平的“落后”。至于统计的学科前沿、统计学与数据科学的确切定义,吴老坦言,这在学界至今仍充满争议。
吴老指出,目前学术界是落后于企业界的,其根本原因在于学术界的老师习惯于传授自己研究领域的知识。他认为,数据科学界现阶段仍处于闭门造车的阶段,这一现象亟需改革,然而改革必然是把双刃剑,必须慎之又慎。
而谈到时下热门的人工智能,吴老认为这项新兴技术必然会使部分劳动力失去工作,但也促进了产业创新。他觉得,人工智能更适合运用在医学和法律这样程式化的专业,将其中的规则程序化,以此造福更多的人。他也指出,随着计算机的飞速发展,人工智能的前景非常光明。
良言金句 赤心育人
吴老给统计专业的学生提出了一些学习方面的建议。他认为,统计专业的本科学生应当以自学为主,有目的地、快速地学习计算机并且把知识投入到使用中,在实践中获取经验、获得进步。他幽默地说,学习编程就一条窍门,错得越多,学得越快。而在实际操作过程中,同学们应充分利用网络上的丰富资源,在网络上解决问题、寻找答案。
在编程语言的选择方面,吴老认为,R注重数据分析,Python则是广谱软件,这些软件在不断的发展中,功能越来越强大,已经足够满足行业需求。他建议我们不要拘泥于某个软件,最主要的是掌握编程的方法与技能。
对于同学们经常抱怨的“数学难”问题,吴老指出统计专业的数学并不难,但扎实的数学理论是统计学研究的坚实基础。因此,他希望同学们学习更多的泛函分析、实变函数、随机分析、拓扑这样“真正”的数学课,而不满足于数理统计这种相对浅显的课程。同时,同学们也不能陷在老一辈统计学家的理论中,要学会思考,不断质疑,这样才能取得长足的进步。
勤谨治学 谦虚为人
吴老和我们谈起了自己的求学经历。他曾经学了四个学期数学分析,将没有答案的吉米多维奇习题集一题题做出答案,从中体会到了数学之美。他将英文书反复阅读,听美国之声练听力,长久的积累后,托福考得比大学英语老师还高。他在1976年就开始学习计算机,当时的计算机相当于现在的屋子大小,并且专门为统计服务。吴老认为,我们应当追随时代脚步,不断更新自己,以避免被“out”的结果。他自豪地说:“在当年,比我小二十、三十岁的老师里,有多少会R、会Python?”
吴老现在每天仍坚持工作9小时,他不断地阅读新的文献、了解新的科研成果,没有科研压力的他,致力于多写些有质量的书,引导、造福更多的年轻人。同时,他不愿停滞在已有的知识上,向年轻人学习最新的软件和技能,尝试用更新、更有效的方法进行数据分析,不断提升自己、挑战自己。他虽盛名远传,但仍虚怀若谷,不愿接受任何行政职务,也不愿称自己为“著名学者”。
莫道桑榆晚,为霞尚满天,吴老充满活力的精神面貌、幽默风趣的语言风格和严谨认真的科研态度给在场同学留下了深刻印象。作为一名老教师、老学者,吴老无疑给我们做出了一个好表率,指引我们在学术的道路上铿锵前行。