都大学了,小学系统才来? 第184节
“那待遇方面,潘博士你应该也清楚了吧?“
“清楚。“潘思点了点头,“月薪税后十万,这个我可以接受。“
“不过,“他顿了顿,补充道,“我希望能拿到一些公司的期权。“
“毕竟,如果这个项目真的做成了,公司的估值肯定会暴涨。“
“我也想分一杯羹。“
陈林听到这个要求,并没有感到意外。
像潘思这种在国外大厂工作过的海归,对于股权激励这套玩法,肯定是门儿清。
“可以。“陈林很爽快地答应了,“具体的期权比例,我们后面可以详细谈。“
“但有一点我得提前说清楚——期权是有兑现期的,而且会和项目的进度绑定。“
对于这一点陈林之前就有和黄依依做过沟通,给一些愿意加入演海的技术大牛股权激励的是可以的,只要他们在行权以后陈林按市价把股权回购就可以了。
对于陈林来说股权还是很重要的,毕竟是可以直接被【小小理财师】算作为个人资产数字的。
潘思闻言,立刻笑了起来。
“这个当然,我理解。“
两人又聊了一些细节,最终敲定了入职的相关事宜。
潘思表示,自己最快能在下周一正式入职。
送走潘思后,陈林回到自己的办公桌前,长长地舒了一口气。
白迁和潘思,两个技术大牛,都搞定了!
接下来,就该正式启动AI项目了。
……
然而,陈林很快就发现,事情并没有他想象中那么顺利。
11月10日,周一上午。
演海公司的会议室里,陈林、白迁、潘思三人,第一次坐在了一起。
会议室不大,一张长条形的会议桌,周围摆了十几把椅子。
此刻,陈林坐在主位,白迁和潘思分坐两侧。
孙宇、黄依依、云清、沈妍四人,则坐在稍远一些的位置,作为旁听。
陈林环视了一圈,率先开口:
“今天把大家叫过来,主要是想讨论一下,我们接下来AI项目的技术路线。“
“白博士,潘博士,你们两位都是这个领域的专家,我希望能听听你们的意见。“
白迁和潘思对视了一眼,随即几乎是同时开口:
“我先说——“
两人说完,又同时停了下来。
气氛,瞬间变得有些微妙。
陈林见状,笑着打了个圆场:
“要不,白博士你先说?“
白迁点了点头,推了推眼镜,清了清嗓子。
“那我就直说了。“
他从背包里掏出平板电脑,点开了一个PPT文件,投屏到会议室的大屏幕上。
“我认为,如果我们要做一个全新的AI大模型,那么首先要做的,就是在架构上进行革新。“
屏幕上,出现了一张复杂的架构图。
白迁指着图上的几个模块,开始详细讲解:
“目前主流的Transformer架构,虽然在并行计算和长距离依赖捕捉上有优势,但它的参数利用效率非常低。“
“而且,Transformer的自注意力机制,计算复杂度是O(n?),这导致了在处理长文本的时候,计算成本会呈指数级增长。“
“所以,“白迁的语气变得无比坚定,“我们必须要设计一种全新的架构,来解决这些问题。“
他点开PPT的下一页,上面是一大堆数学公式和架构示意图。
“我这几年一直在研究的,就是一种基于动态稀疏激活机制的新型神经网络架构。“
“简单来说,就是让模型在推理的时候,不需要激活所有的参数,而是根据输入的内容,动态地选择需要激活的部分。“
“这样一来,计算效率可以提升数倍,同时模型的容量也能得到大幅增加。“
白迁说得非常投入,整个人都散发着一种学者的光芒。
然而,坐在对面的潘思,脸上的表情却越来越古怪。
等白迁终于讲完,潘思立刻开口了:
“白博士,恕我直言。“
他的语气很客气,但话里的意思却一点都不客气。
“你说的这些东西,我在学术界见得太多了。“
“每年都有无数的论文,声称自己设计出了某种'革命性'的新架构。“
“但最后呢?“
潘思摊了摊手,脸上带着一丝嘲讽的笑意。
“绝大多数,都只是在实验室里跑跑toy model,根本没办法应用到实际的大规模模型训练中。“
“为什么?“
他没等白迁回答,便自顾自地继续说道:
“因为这些所谓的'新架构',往往在理论上很美好,但在工程实现上,要么是训练不稳定,要么是推理速度太慢,要么是对硬件的要求过高。“
“总之就是不实用!“
第一百九十五章 都有自己的偏执
潘思说到最后三个字的时候,语气加重了几分,几乎是一字一顿。
白迁听到这话,脸色立刻变了。
“潘博士,你这话是什么意思?“
他的声音里,明显带上了几分火气。
“我的架构,不是那些toy model!“
“我已经在中等规模的数据集上,验证过它的可行性了!“
潘思闻言,冷笑了一声:
“中等规模?那是多大?百万级?还是千万级?“
“白博士,真正的AI大模型,训练数据是万亿级token起步的。“
“你那点'中等规模',和真正的大模型训练比起来,根本不在一个量级上。“
白迁被噎了一下,脸涨得通红。
“那你的意思是,我们就应该继续用Transformer这种已经被证明有明显缺陷的架构?“
“对!“潘思毫不犹豫地点了点头。
“Transformer虽然有缺陷,但它已经被业界验证过无数次了。“
“它的训练流程成熟,工程实现简单,而且有大量的开源代码和工具可以直接拿来用。“
“我们是一家初创公司,不是学术机构。“
潘思的语气变得无比严肃。
“我们的目标,是尽快做出一个能用的、有竞争力的产品,而不是去发论文、拿奖。“
“所以,我认为,我们应该把精力放在数据清洗和模型对齐上,而不是在架构创新上浪费时间。“
白迁听完,整个人都气笑了。
“浪费时间?“
他用一种难以置信的语气,重复了一遍这个词。
“潘博士,你知道你在说什么吗?“
“架构创新,才是AI领域真正的核心竞争力!“
“如果我们只是跟在CloseAI、狗狗这些巨头后面,用他们已经验证过的架构,那我们永远都只能做追随者,永远都赶不上他们!“
“只有在架构上做出突破,我们才有可能实现弯道超车!“
潘思闻言,冷哼了一声:
“弯道超车?白博士,你这话说得好听。“
“但你有没有想过,弯道超车的前提,是你得先有一辆能跑的车?“
“如果连车都没有,你超什么车?“
“我们现在连一个能用的模型都没有,你就想着架构创新?“
“这不是本末倒置吗?“
两人你一言我一语,争得面红耳赤。
坐在旁边旁听的孙宇、黄依依、云清、沈妍四人,全都目瞪口呆。
他们万万没想到,这第一次技术会议,居然会演变成这样!
陈林坐在主位上,看着两个技术大牛吵得不可开交,眉头紧紧皱了起来。
他原本以为,把这两个人招进来,就能强强联手,把AI项目快速推进。
结果没想到,两个人的技术理念,居然有如此巨大的分歧!
上一篇:我在华娱当导演,宠坏天仙白月光
下一篇:返回列表
