<p class="ql-block"><b style="color:rgb(21, 100, 250);"> 2025年正月初七,刘老师在山东翰林科教集团总部举行了以“终身学习终生成长”为主题的新年茶话会,20余位在校大学生或研究生参加了活动。</b></p> <p class="ql-block"> <b style="color:rgb(21, 100, 250);">来自24年直博本校清华大学工程物理系能源动力专业的21级大学生王永堂帅先发言,他介绍了保研前期需做的准备工作及清华大学保研考核流程,让与会者清晰明了了清华大学该专业自主笔试的科目以及面试考核的方向,他的发言管中窥豹,让所有与会者了解到了中国顶级学府对学子们的高标准要求与创新思维引领。</b></p> <p class="ql-block"> <b style="color:rgb(21, 100, 250);">中央财经大学24级会计硕士李文君同学分享了她半年来研究生学习的体会,她重点分享了央财对专业硕士强化应用实践的培养的情况,导师团队基本由央企国企以及各大银行、医院等单位总会计师组成,学生可根据自己未来从业的行业倾向选择心仪的导师。她的发言不但让大家了解了专业硕士成长的方向,也让大家了解到大城市的专家资源确实非同凡响。</b></p> <p class="ql-block"><b style="color:rgb(21, 100, 250);"> 来自东北大学电气工程专业24级研究生孙君洋同学对自己导师团队的研究方向进行了系统梳理:其所在团队主要研究方向有控制理论与控制工程、电力电子技术及人工智能医工结合领域的研究。在电气工程方面,研究涵盖绝缘检测,变频器、整流器、 DC/DC变换器和DC/AC逆变电源的设计与优化,通过先进的技术手段和创新的解决方案,提升各类电气系统的工作效率和可靠性,以满足现代工业和日常生活对高质量电力设备的需求。在人工智能医工结合方面,研究方向包括基于大模型的自闭症谱系障碍识别和医学图像分割。通过构建和优化基于深度学习的大模型,能够对自闭症谱系障碍患者的特征进行精准分析和识别,为早期诊断和干预提供有力支持。医学图像分割是通过开发先进的图像处理算法和模型,能够实现对医学图像中不同组织和器官的精准分割,为临床诊断和治疗提供更加准确的依据,助力医学影像技术的智能化发展。孙君洋同学的分享拓展了所有与会者对电气工程专业范畴的了解以及交叉学科现实应用的认知。</b></p> <p class="ql-block"><b style="color:rgb(21, 100, 250);"> 来自北京航空航天大学人工智能专业22级的刘宇赫同学站在技术角度从三方面分亨了自己对DS的理解。</b></p><p class="ql-block"><b style="color:rgb(237, 35, 8);">一、创新点:</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);">1.DeepSeek在模型架构上进行了大胆创新。例如,DeepSeek-V3模型采用了自研的MLA架构和DeepSeek MoE架构,这些架构通过改造注意力算子、压缩KV Cache大小等手段,实现了在同样容量下可以存储更多的KV Cache,从而大幅提升了模型的学习效率和泛化能力。此外,DeepSeek还解决了“非常大同时非常稀疏的MoE模型”使用的性能难题,成为公开MoE模型训练中第一个能训练成功这么大MoE的企业。</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);">2.DeepSeek在动态上下文优化技术和多模态集成技术上取得了突破进展。这些技术使得DeepSeek模型能够在实时处理过程中动态调整策略,提高模型的适应性和灵活性,并在多语境、多模态任务中表现出色。例如,DeepSeek发布的R1模型就实现了用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上性能比肩美国开放人工智能研究中心(OpenAI)的GPT-4模型正式版。</b></p><p class="ql-block"><b style="color:rgb(237, 35, 8);">二、优势:</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);">1.Deepseek采用自主研发的架构,拥有更强的逻辑性、推理能力以及纠错能力:Deepseek颠覆了推理认知的技术革命,让AI从鹦鹉学舌进化到自主思考。与传统大模型填鸭式的死记硬背的监督学习不一样,DeepSeek通过强化学习的方式让AI真正开启了认知革命,开创了人工智能的新方向。用更专业的方法来说,就是Deepseek“可以直接调用更底层的库,而不是使用高层API。</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);">2.DeepSeek在推理效率方面表现出色,性价比极高:强化学习策略使得人工智能大模型无效训练降低了60%,对高强度计算算力的需求下降了40%。作为一个 34B 参数模型,它实现了 GPT-4 80% 以上的功能,而计算资源仅占其五分之一。</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);">3.DeepSeek将模型开源,对于大语言模型领域技术的发展具有不可估量的价值:Deepseek不仅开放了所有的权重参数,还公开了详尽的技术报告,相当于把自己的知识分享给了整个人工智能产业和全人类,不仅开源模型使用,而且鼓励全球开发者的社区共同参与贡献代码和数据。</b></p><p class="ql-block"><b style="color:rgb(237, 35, 8);">三、局限性:</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);">1.西方流行文化知识和英文知识储备不如西方本地化模型全面。</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);">2.开发者生态系统规模较小,且深度思考所花费的时间还有缩短空间。</b></p><p class="ql-block"><b style="color:rgb(21, 100, 250);"> 宇赫同学的发言拉满了现场氛围的时代感。</b></p><p class="ql-block"></p> <p class="ql-block"><b style="color:rgb(21, 100, 250);"> 刘晓云博士从做自己人生的主人、快乐精彩度过一生角度,谆谆告诫同学们在纷繁复杂的世界里要有自己清晰的目标定位不要迷失自我,时刻保持突破性成长,以保证自己有能力为社会创造较高的价值。她以若干成功的现实案例说明了目标定位的重要性;以自己带的一个中专生两个专科生不断突破性成长最终博士毕业在北京国家智库及赫赫有名的大医院当主治医师的案例,提醒同学们成功来源于自己内心的追求,不在于起点高低。刘博士再三强调了心起念动是成功之始,充满真诚与虔诚的过程追求是捷径,并传授了高效英语学习的方法及顺利保研考研的策略。</b></p> <p class="ql-block"><b style="color:rgb(21, 100, 250);"> 中午分三桌进行了聚餐交流。餐桌上来自全国各地不同高校的学兄学姐学弟学妹们相处甚欢,光筹交错间拓展了朋友圈及对社会的认知,获得了更多的友谊。</b></p> <p class="ql-block"><b style="color:rgb(21, 100, 250);"> 山东翰林科教集团董事长刘晓云博士组织的在校大学生定期交流已经持续了很多年,旨在促进大家共同探讨为中华民族为人类文明发展担当重任的成长路径,互相激励共同成长,同时搭建同学们未来发展拓展人脉的高端平台,期望明年会有更多的同学参加。</b></p> <p class="ql-block"> 2025年2月9日</p>