2020 总结
January 13, 2021 • ☕️☕️ 9 min read
本来打算在元旦的时候写一篇记录一下 2020 发生的一系列事情,但因为期末考试太忙就没动笔。而且直接写的话前九个月一笔就带过了,还不如直接写大三上的总结,当然这也是标题的由来。
后来因为疫情不用考试,直接放假了。回到家里我一直在思考这学期干了什么,好像每天都很忙,好像什么都没学到,但是这学期却是我成长最快的一个学期了。
本来不打算写的,其中有一些温暖的回忆,也有一些痛苦的不堪,我觉得有必要记下来。
开学
九月份开学,在此之前的几个月里都是在家中。我觉得自己学了很多的东西,但是问题在于不知道自己学到了什么程度。需要做一些东西来检验一下。
计算机网络和操作系统两门课的结束令我对计算机世界有了完全的认识。在此之前很多东西都是黑箱,学完这两门课后我认为自己有了一个大局观。
数学建模
来到学校后首先面对的是数学建模,把官网的语法教程敲了一遍就开始了。紧接着是选题,最终选择是 C 题,该题是做一个企业贷款风险的评估预测,根据企业各方面的特征数据来判断贷款额度。该题本质上就是一道数据科学方面的比赛题目。
分析完题目后首要工作是将特征工程做好,将特征数据提取出来。虽然接下来的工作存在分歧等待和老师探讨,但是目前该做的工作是明确的,因为晚上 6:00 发题,确定好题目和思路后就去睡觉了。
最初没有思考太多,写的时候出现了很多问题,当时没有考虑到 Pandas 的存在,这是视野问题。经过一番挣扎后我换了 Matlab 来做,但做到一半后出现了两个问题,首先是 Matlab 写的函数太多,我感觉自己控制不住了,切实体会到了面向过程的复杂。其次是清洗一批数据实在是太慢了,这个问题我没有复查过,现在看来应该是我写的冗余代码多了。以上的两个问题都没有很好的解决,而且我当时觉得即使写出来跑一遍也要花费很久的时间。最终和队友讨论后又换工具了,因为老师说数据库加索引很快就能搞定。
此时已经到了晚上,第一天等于什么工作都没有推进,特征工程做不完后续的所有工作都无法推进。并且已经有一些压力了。于是我们三个人开始做在那里盯着我的电脑研究 Mysql 。但是问题也很大,虽然速度问题解决了,Mysql 确实非常快,几毫秒就能跑完。但是几个查询语句不会写,首先这个逻辑确实比较复杂,我们仨面面相觑。整个过程就是一会我座中间,一会 WHJ 座中间,一会 ZFM 座中间,然后另外俩人在旁边指手画脚,反正就是循环,折腾一番后也没有搞定,此时已经夜里三点了。从夜里十一点后改换 Mysql 后,这中间四个小时什么都没有推进!最初的打算是把特征工程做完后,一点去睡觉,而此时压力已经很大了。其实问题的根源在于 sql 语法部分存在盲区,不知道哪里不会。其次是逻辑没有有点复杂。
三点后两个队友撑不住于是去睡觉了,而我则幻想着明天在他们起来之前我能解决这个问题。由于当时喝了咖啡,加上压力有点大没有一丝困意。
到了四点我有点绝望,此时依旧没有丝毫进展。我决定换回 Python ,因为此时我想到了 Pandas 。这个工具我之前学习过,而且相对比较熟悉。于是开始了在 Jupyter 上写代码,因为此时发送 Jupyter 可以缓存中间结果,可以快速试错,验证想法?
虽然写的过程中存在这样那样的问题,我也意识到了之前学的是多么的不扎实。从实践中学习知识果然是最快的!从夜里四点一直写到七点,此时已经把第一个特征数据提取出来了。看着 201 窗外由黑暗转向光明,阳光逐渐照射进来,一切有都充满了希望。虽然这个问题解决了,但一直写到九点还不见队友来,我以为他俩放弃了,没想到是睡过了。队友来了后,接下来就是 WHJ 分析问题,需要哪些特征数据,怎么计算,给我提需求,然后我来代码实现,一些都步入了正轨。上午已经把所有的特征数据提取完毕了。吃完饭回来后面对的最后一个问题则是将数据存到 csv 文件中,我已经很久都没睡了,所以交给了 WHJ,一点去睡觉了。直到两点我被 WHJ 叫醒,存数据也遇到了问题。这个问题我又花了将近一个小时的时间来解决,本质上还是一些细碎的问题,需要耐心看文档。
老师建议采用 PCA 来提取比较重要的特征,正好 ZFM 查到了 R 中有比较方便的 PCA 处理方式,我把特征数据发给他,这个很快就搞定了!
接下来就迷茫了,因为做这一题的每个老师对于该题的理解都不太一样,同时和老师之间的交流也出现了分歧。接下来不知道该怎么办,到底是设计出来一个策略还是给出具体的贷款数额。但是总得推进,和老师交流之后我们最终采取的策略是用 K-menas 做无监督学习,根据特征数据对聚类,分析出大致的贷款范围,给出贷款额度。第二问根据第一问的贷款额度(标签)做监督学习,用决策树来分析在更多钱的条件下的贷款策略。
接下来就是第三天了,这一天的重点该是论文了,但是第三问还没有写。我本来打算加点东西上去,但是真的是没有时间了。我给论文补了点图,提供了一些数据。ZFM 开始写论文,因为第一天没有明确的分工导致了第三天论文的紧张。
大学生科研基金项目
这个东西我印象当时是快截至了我才知道的,因为当时没什么人报。
周三知道,周五要上报,申请书要写五千字左右。老师通知我的时候我感觉来不及了,正好同学也在弄于是我就开始写了。
这个灵感来源于在此之前评别人的贫困等级之时大家往往会受到人际关系好坏的影响。我觉得这个问题是难免的,人之常情。我在面对自己的熟悉的人采取的原则是尽量不参与,毕竟好几个人一块讨论。虽然有时候也能感觉到有些顺序的不合理,自己也只能尽可能的保证相对的公平。
我觉得可以采用程序来判定,虽然解决了人情问题,保证相对的公平。但难点也很明显,没有统一的标准,国家虽然有贫困标准,但是家家有本难念的经,因为每家每户的实际情况都不同。
我的想法是用往届数据做训练集,往届的评价结果做标签,然后训练一个决策树模型,因为这个标准是以前人们所公认了,面对不合理的情况微调即可。
而数据是分为结构化和非结构化两种类型的数据,对于结构化的数据处理很简单,直接作为特征即可,对于非结构化的数据我认为可以采用 NLP 方面的一些情感打分模型,将其结果作为一个属性。
入党
我本来以为自己退出学生会后就不可能入党了,没想到最后竟然又有了入党资格,有点幸运。
除此之外班级民主评议时是五选四,我一度以为自己是选不上的,八成是出丑,就没报什么希望。毕竟自己没为班里做过什么贡献,人际交往方面什么的也不活泼,没想到我竟然是唯一一个没有反对票的,这大概是一年来最令我开心的一件事情了。
应该是别人问问题之时,或者需要帮助的时候我没有推脱过吧,或者日常生活中与人为善态度。
入党申请的材料真是太多了,写了好多好多天,每天都是在疯狂的补材料。字还不能写错,有些字写错了可以重新打印重新填写,但是有些只能拿刀片或者胶带挂掉。最后交材料的时候也是一堆的格式问题,太折磨人了。
其次交完材料是每周都得上的党课,老师讲的很好,很多老师都挺有魅力,能从中思考很多东西。因为纪律很严所以这大概是大一之后我最认真上的课了。
离开 509
因为每天实在是太忙了,首先是周一到周五满课,其次是作业压力比较大。我几乎没有时间去开发了。在洗数据的工作彻底完结后就退出了 509 ,毕竟占着位置不给老师干活实在说不过去。
数据库课程设计
数据库课程设计最后的大作业老师让做一个学生管理系统。由于之前学过 Spring ,花了几天时间翻阅了几本 SpringBoot 相关的书籍之后我决定采用 SpringBoot 来做。
这个项目是在数学建模之后再次令我感受到成长的,令我意识到之前的东西没有白学。在大一暑假之时做的也是 JavaEE 部分,但当时什么都不懂花费了非常多的时间,而此时确可以在一个星期内做完。
不过这一个星期内是非常累的,因为白天有课,正好党校结业考试完了所以晚上的时间空闲出来了。每天晚上回去做到一点多,而最终睡觉时间一般在两三点左右。这也是为数不多的令我感觉每天都充满斗志的时刻。时间还是比较仓促的,做出来的东西有很多 Bug ,不过我觉得已经达到了令老师满意的程度了。
其他
关于跑步,因为白天都是满课,前期大部分的晚自习都塞满了课,所以晚上也没多少时间了。这一学期前期每周跑步的频次大约在 2 - 3 次。有时候因为连续下雨会中断。但是我觉得这都是心态问题,不能单纯的归结于时间不够,懒。主要还是心态没有转变。因为熬夜我又开启了喝咖啡的生活,双十一之前还有克制。但是因为双十一打折买了一百多条咖啡,元旦的时候就全喝完了,以后不能再喝了。虽然咖啡可以提神,但是常常会导致晚上睡不着觉导致恶性循环。我已经明显感觉到身体的不适,所以周六周末能睡就睡,大部分时间都用来补觉。说实话这样的效率是不高的。而跑步是可以缓解身体的压力的,在 12 月的时候我意识到跑步可以让我的生活变好,于是就将每周跑步的频次提高到了 4 - 5 次。所以即使再忙我都会去西操跑步。最初的心理上限是 5 公里,后来担心膝盖就改为 3 公里,但是常常跑不到 3 公里,最后又改为 5 公里,而现实情况是常常徘徊在 4 公里,偶然 5 公里,果然求其上者得其中。目前回到家后,晚上可以到体育场跑步,这大概是唯一的能够每天都坚持做的事情了。
希望疫情能够早日结束,回到学校,一切生活都步入正轨。
总结
- 对我而言以周为单位的推进一件事情是有效的,以后尽量以周为单位来做计划。
- 激起斗志,对生活充满激情,没有激情会很危险,设置适当的反馈来调节自身。
- 多沟通,多交流,开放心态,不能封闭自己,切忌自以为是。遇见不认同的事情保持尊重。
- 不要盲目的做计划,理想和现实产生差距后会带来严重的挫败感!
这篇文章写了很久,大约 6 个小时。缅怀过去可以更好的迎接未来,我认为这是一件有意义的事情! 写于 2021/01/18 6:25
写于 2023/09/11 22:57 时隔两年回头看,删减了部分内容