笔下文学

字:
关灯 护眼
笔下文学 > 我真的有一座法师塔 > 第384章 找对象得看人品(4885)

第384章 找对象得看人品(4885)

第384章 找对象得看人品(4885) (第2/2页)

事实上,随着柚子科技的发展壮大和高技术人才的加入,这些人在算法和分层架构设计方面有时甚至能给柚子很多启发和方向性的指引。
  
  柚子能够在已有技术的基础之上,推演出最好的搭配并做出优化改进,但并不意味着它能够做所有的开创性研究。
  
  俗话说,三个臭皮匠顶一个诸葛亮,愚者千虑终有一得,这两句话在人工智能领域也同样有作用。
  
  应该说,在已经推开大门的AI领域,缺的就是更多的臭皮匠和愚者。
  
  任何一个领域,在大门刚刚开启的阶段,参与门槛都要比后来低很多,也经常会有技术并没有那么高的人在其领域内做出极具突破性的研究从而名垂青史。
  
  比如发现DNA双螺旋的詹姆斯沃森,现在沃森当然是大佬,虽然因为种族言论被冷泉港和诺贝尔取消了荣誉,也是大佬。
  
  但沃森的技术和学术天赋就真的是当时最强吗?
  
  当然不是。
  
  在当时无数顶尖科学家都比他技术水平更强,但发现DNA双螺旋的仍旧是他(注1),愚者偶然的一次灵光乍现,可能就是新技术方向和科学理论的一次全新的革命。
  
  现在的人工智能领域也是同样如此。
  
  柚子科技的天才科学家们提出种种架构设想和新的算法方案,柚子在后台进行归纳推演,找出其中最适合的道路,再应用到方豫私密服务器中的橘子大模型完全版中。
  
  有时候柚子也会看似不经意的点破技术团队所面临的一些瓶颈,就这样,柚子科技内部的橘子大模型也在以一种不可思议的速度进化着,这种速度甚至让不少柚子科技的内部员工感觉到恐惧。
  
  时至今日,柚子科技内部的橘子大模型版本号已经迭代到了3.81,参数也已经正式突破到了三万亿,而方豫私密服务器中的橘子大模型,参数量更是达到了和神之模型接近的八万亿!
  
  八万亿的参数量,已经是目前互联网数据所能训练的极限,即使再增加参数,也没有太大意义了。
  
  其实目前互联网上的有效数据,对于生成式大模型来说,最多只够训练3万亿参数量的大模型,而满血版橘子大模型多出的五万亿参数,主要应用在特定复杂任务上。
  
  比如长期记忆建模、大规模多模态生成、实时交互、深度推理等。
  
  方豫是在周芯国际完成第一批橘核芯片的交货并安装到服务器集群后才启动的八万亿参数私密大模型的训练。
  
  否则且不说数亿大周币的耗电量会不会因此引起有心人的怀疑,也不提方豫根本没有那么多M60芯片,就算有,目前柚子科技园机房的电网也无法承受数十兆瓦量级的负载。
  
  而有了橘核芯片,依靠仅相当于M60五分之一的电量消耗,就实现了相较M60十五倍以上的算力提升!(橘核的标准功耗23W未含显存功耗,包括显存功耗情况下是67W)
  
  也正是因为柚子科技在产业园内布置了首批一万两千张橘核芯片,柚子才能在二十天之内就完成了满血版八万亿参数橘子大模型的预训练。
  
  目前存在四个不同版本的橘子大模型,性能最强的是方豫私密服务器中的八万亿参数大模型,这个大模型已经完全实现了AGI,目前只差分布式小模型的实时数据训练的推动,就能够彻底进化为ASI。
  
  其次是柚子科技内部在研发尚未公开发布的3.8版本,目前这个版本也已经实现了AGI,所差的只是在多行业内的应用实训而已。
  
  然后才是公开收费发布的2.5N版,最后是开源的1.99DEC版。
  
  如果不算上方豫私密服务器中的满血八万亿大模型,柚子科技内部的3.81版本橘子大模型,就是这个世界上最强大模型,并且把第二名远远抛在后面。
  
  前一周,FB公布了他们加急开发的“番茄”大模型,号称达到了4000亿级别的参数量,同时开源了参数量大约为40亿和80亿的两个略小的大模型,可以布置在小型服务器或台式机上。
  
  FB还宣称,他们的4000亿参数的番茄大模型在目前由伯克利和卡内基梅隆大学合作开发的大模型竞技场中得分全面超过juzi2.5N版本。
  
  当然,这个大模型同样应用的是柚子架构,对这一点FB倒是没做什么隐瞒,毕竟现在行业中除了古狗外,其他所有公司用的都是柚子架构。
  
  就算是古狗,没有用柚子架构,但其自行推出的“hugging”大模型架构同样使用了柚子科技开源的部分技术。
  
  但实际上,经过许多从业者的实测,FB应该是针对竞技场做了针对性优化,从而提高了竞技场得分。
  
  在实际应用上,“番茄”大模型的生成能力和推理能力都弱于收费版的Juzi2.5N。
  
  而且差的不是一点半点。
  
  因此,面对古狗和FB的追击,柚子科技并不着急,反而宣称在季度内并没有对橘子大模型收费版除数据更新外其他的升级计划。
  
  柚子科技的现状,就是外松内紧。
  
  所有的一切,都会在十月的大米Mix发布会上见分晓。
  
  而负责大米分布式小模型系统架构的,正是陆偲。
  
  这些日子陆偲他们这一组人几乎吃住在公司,争分夺秒的把约尔兹教授优化的分布式小模型适配手机硬件和安卓系统。
  
  作为公司负责后台支持的沈舒窈,在这种情况下加班自然也不会少。
  
  “偲偲姐,你们组的会,我就不用参加了吧,我就是个内勤,相当于服务员,哪有什么能力给你们培训啊。”
  
  沈舒窈笑嘻嘻的婉拒陆偲的会议邀请。
  
  沈舒窈待人接物的尺度拿捏相当好,不该显示存在感的时候绝对一句话也不说,该翻脸的时候也绝对一点情面都不留。
  
  陆偲眼神闪烁:“别这样嘛,我们这边新来的这一批员工归属感还是差了点,总是摆脱不了学生思维,你也知道我们组现在有多忙,他们不能马上把工作抓起来,头疼死我了。上次你给小南那一组做新员工培训做的多好,帮帮忙嘛。”
  
  沈舒窈拗不过,只好跟着陆偲来到三楼的开放办公区。
  
  “咦?偲偲姐,你们组不是搬到五楼去了吗?怎么还在用三楼会议室?”沈舒窈随口问道。
  
  陆偲别过脸去:“哦,五楼的会议室装修味道还是有点重,我还是申请的三楼。”
  
  装修味道重?有吗?五楼和三楼不是一起装修的吗?
  
  “啪!”
  
  “Surprise!”
  
  沈舒窈刚推开三楼会议室的门,就被花炮的声音吓了一跳。
  
  “舒窈,生日快乐!!!”
  
  三十多人挤在不大的会议室中,嘻嘻哈哈的祝她生日快乐。
  
  “谢谢,谢谢大家,不过……”沈舒窈露出惊喜的表情,刚想说话,就看到陆嘉言把一个点着二十根蜡烛的三层大蛋糕推了出来。
  
  “知道你是明天生日啦,但明天你又不来,只好今天给你过了。”陆嘉言一脸不爽的皱了皱鼻子,“赶紧许愿,吹蜡烛。”
  
  随后,陆嘉言挤着牙缝对沈舒窈小声道:“不许许哥哥离开我的愿望!否则……”
  
  注1:沃森的诺贝尔实际是有争议的,罗莎林德富兰克林实际早在沃森之前已经几乎完成了DNA双螺旋的构建,甚至拍下了著名的“照片51”,直接揭示了DNA双螺旋特征。
  
  但罗莎林德富兰克林死的早,诺贝尔颁发的时候她已经死了,让沃森捡了个漏。
  
  关于小故事,明天接着写吧。
『加入书签,方便阅读』
热门推荐
极品全能学生 凌天战尊 御用兵王 帝霸 开局奖励一亿条命 大融合系统 冷情帝少,轻轻亲 妖龙古帝 宠妃难为:皇上,娘娘今晚不侍寝 仙王的日常生活