首页 > 都市言情 > 都大学了,小学系统才来?

都大学了,小学系统才来? 第184节

  “那待遇方面,潘博士你应该也清楚了吧?“

  “清楚。“潘思点了点头,“月薪税后十万,这个我可以接受。“

  “不过,“他顿了顿,补充道,“我希望能拿到一些公司的期权。“

  “毕竟,如果这个项目真的做成了,公司的估值肯定会暴涨。“

  “我也想分一杯羹。“

  陈林听到这个要求,并没有感到意外。

  像潘思这种在国外大厂工作过的海归,对于股权激励这套玩法,肯定是门儿清。

  “可以。“陈林很爽快地答应了,“具体的期权比例,我们后面可以详细谈。“

  “但有一点我得提前说清楚——期权是有兑现期的,而且会和项目的进度绑定。“

  对于这一点陈林之前就有和黄依依做过沟通,给一些愿意加入演海的技术大牛股权激励的是可以的,只要他们在行权以后陈林按市价把股权回购就可以了。

  对于陈林来说股权还是很重要的,毕竟是可以直接被【小小理财师】算作为个人资产数字的。

  潘思闻言,立刻笑了起来。

  “这个当然,我理解。“

  两人又聊了一些细节,最终敲定了入职的相关事宜。

  潘思表示,自己最快能在下周一正式入职。

  送走潘思后,陈林回到自己的办公桌前,长长地舒了一口气。

  白迁和潘思,两个技术大牛,都搞定了!

  接下来,就该正式启动AI项目了。

  ……

  然而,陈林很快就发现,事情并没有他想象中那么顺利。

  11月10日,周一上午。

  演海公司的会议室里,陈林、白迁、潘思三人,第一次坐在了一起。

  会议室不大,一张长条形的会议桌,周围摆了十几把椅子。

  此刻,陈林坐在主位,白迁和潘思分坐两侧。

  孙宇、黄依依、云清、沈妍四人,则坐在稍远一些的位置,作为旁听。

  陈林环视了一圈,率先开口:

  “今天把大家叫过来,主要是想讨论一下,我们接下来AI项目的技术路线。“

  “白博士,潘博士,你们两位都是这个领域的专家,我希望能听听你们的意见。“

  白迁和潘思对视了一眼,随即几乎是同时开口:

  “我先说——“

  两人说完,又同时停了下来。

  气氛,瞬间变得有些微妙。

  陈林见状,笑着打了个圆场:

  “要不,白博士你先说?“

  白迁点了点头,推了推眼镜,清了清嗓子。

  “那我就直说了。“

  他从背包里掏出平板电脑,点开了一个PPT文件,投屏到会议室的大屏幕上。

  “我认为,如果我们要做一个全新的AI大模型,那么首先要做的,就是在架构上进行革新。“

  屏幕上,出现了一张复杂的架构图。

  白迁指着图上的几个模块,开始详细讲解:

  “目前主流的Transformer架构,虽然在并行计算和长距离依赖捕捉上有优势,但它的参数利用效率非常低。“

  “而且,Transformer的自注意力机制,计算复杂度是O(n?),这导致了在处理长文本的时候,计算成本会呈指数级增长。“

  “所以,“白迁的语气变得无比坚定,“我们必须要设计一种全新的架构,来解决这些问题。“

  他点开PPT的下一页,上面是一大堆数学公式和架构示意图。

  “我这几年一直在研究的,就是一种基于动态稀疏激活机制的新型神经网络架构。“

  “简单来说,就是让模型在推理的时候,不需要激活所有的参数,而是根据输入的内容,动态地选择需要激活的部分。“

  “这样一来,计算效率可以提升数倍,同时模型的容量也能得到大幅增加。“

  白迁说得非常投入,整个人都散发着一种学者的光芒。

  然而,坐在对面的潘思,脸上的表情却越来越古怪。

  等白迁终于讲完,潘思立刻开口了:

  “白博士,恕我直言。“

  他的语气很客气,但话里的意思却一点都不客气。

  “你说的这些东西,我在学术界见得太多了。“

  “每年都有无数的论文,声称自己设计出了某种'革命性'的新架构。“

  “但最后呢?“

  潘思摊了摊手,脸上带着一丝嘲讽的笑意。

  “绝大多数,都只是在实验室里跑跑toy model,根本没办法应用到实际的大规模模型训练中。“

  “为什么?“

  他没等白迁回答,便自顾自地继续说道:

  “因为这些所谓的'新架构',往往在理论上很美好,但在工程实现上,要么是训练不稳定,要么是推理速度太慢,要么是对硬件的要求过高。“

  “总之就是不实用!“

第一百九十五章 都有自己的偏执

  潘思说到最后三个字的时候,语气加重了几分,几乎是一字一顿。

  白迁听到这话,脸色立刻变了。

  “潘博士,你这话是什么意思?“

  他的声音里,明显带上了几分火气。

  “我的架构,不是那些toy model!“

  “我已经在中等规模的数据集上,验证过它的可行性了!“

  潘思闻言,冷笑了一声:

  “中等规模?那是多大?百万级?还是千万级?“

  “白博士,真正的AI大模型,训练数据是万亿级token起步的。“

  “你那点'中等规模',和真正的大模型训练比起来,根本不在一个量级上。“

  白迁被噎了一下,脸涨得通红。

  “那你的意思是,我们就应该继续用Transformer这种已经被证明有明显缺陷的架构?“

  “对!“潘思毫不犹豫地点了点头。

  “Transformer虽然有缺陷,但它已经被业界验证过无数次了。“

  “它的训练流程成熟,工程实现简单,而且有大量的开源代码和工具可以直接拿来用。“

  “我们是一家初创公司,不是学术机构。“

  潘思的语气变得无比严肃。

  “我们的目标,是尽快做出一个能用的、有竞争力的产品,而不是去发论文、拿奖。“

  “所以,我认为,我们应该把精力放在数据清洗和模型对齐上,而不是在架构创新上浪费时间。“

  白迁听完,整个人都气笑了。

  “浪费时间?“

  他用一种难以置信的语气,重复了一遍这个词。

  “潘博士,你知道你在说什么吗?“

  “架构创新,才是AI领域真正的核心竞争力!“

  “如果我们只是跟在CloseAI、狗狗这些巨头后面,用他们已经验证过的架构,那我们永远都只能做追随者,永远都赶不上他们!“

  “只有在架构上做出突破,我们才有可能实现弯道超车!“

  潘思闻言,冷哼了一声:

  “弯道超车?白博士,你这话说得好听。“

  “但你有没有想过,弯道超车的前提,是你得先有一辆能跑的车?“

  “如果连车都没有,你超什么车?“

  “我们现在连一个能用的模型都没有,你就想着架构创新?“

  “这不是本末倒置吗?“

  两人你一言我一语,争得面红耳赤。

  坐在旁边旁听的孙宇、黄依依、云清、沈妍四人,全都目瞪口呆。

  他们万万没想到,这第一次技术会议,居然会演变成这样!

  陈林坐在主位上,看着两个技术大牛吵得不可开交,眉头紧紧皱了起来。

  他原本以为,把这两个人招进来,就能强强联手,把AI项目快速推进。

  结果没想到,两个人的技术理念,居然有如此巨大的分歧!

首节 上一节 184/463下一节 尾节 目录

上一篇:我在华娱当导演,宠坏天仙白月光

下一篇:返回列表

推荐阅读