笔趣阁 > 重回1990:我的科技强国路 > 第227章 小芯AI辅助排查121个工艺

第227章 小芯AI辅助排查121个工艺

    赵静盯着屏幕上不断滚动的数字,眉头紧锁。在她的左侧屏幕上,小芯AI正在运行「工艺缺陷主动学习模型」的第一轮预筛选;右侧则是从14纳米产线传来的实时数据流,包含了过去三个月所有流片批次的三千七百多万个工艺参数记录。

    会议室里坐满了人,但安静得只听得见键盘敲击声和伺服器风扇的低鸣。张京京团队的七位资深工艺工程师丶林薇带来的三位仿真专家丶还有赵静自己的十二名AI算法研究员——这是为121个工艺缺陷点专门组建的「联合诊断组」。

    「第一轮预筛选完成。」年轻的AI研究员小刘抬起头,声音有些沙哑,「基于历史数据的相关性分析,121个缺陷点被分为三类:第一类,35个『高置信度关联缺陷』,AI判断其与特定工艺参数强相关,建议优先排查;第二类,58个『中等置信度关联缺陷』,需要更多实验数据确认;第三类,28个『低置信度随机缺陷』,可能是环境因素或未被监测的变量导致。」

    「35个优先排查……」张京京揉着太阳穴,「按照传统方法,每个点需要至少三轮实验验证,一轮实验两天,总共需要210天。我们没有那麽多时间。」

    「所以不能用传统方法。」赵静调出一个全新的界面,「小芯AI刚刚完成了『虚拟实验平台』的升级。它可以根据物理模型和历史数据,对每个缺陷点进行数万次的虚拟实验,快速缩小可疑参数的范围。实际流片验证只需要针对最有希望的几个假设进行。」

    她演示了一个例子:针对第47号缺陷点——「氧化层厚度边缘不均匀性」。传统排查需要调整温度丶压力丶气体流量丶时间等十几个参数,排列组合上千种可能。而AI在分析了所有相关数据后,提出了一个假设:问题可能不在于氧化工艺本身,而在于前一道清洗工序留下的表面微观形貌差异。

    「AI是怎麽想到这个的?」一位工艺工程师质疑,「清洗和氧化是完全不同的工序。」

    「因为AI发现了时间相关性。」赵静调出数据图,「在每周一的流片中,这个缺陷的出现概率比其他时间高32%。而周一上午,正好是设备周末停机后重新启动的时间点。AI进一步分析了清洗设备的启动曲线,发现温度稳定需要比平时多五分钟,这可能导致清洗液在矽片表面的润湿角发生微小变化,进而影响后续氧化层的成核均匀性。」

    会议室里响起一阵低语。这种跨工序丶跨时间的关联性,人类工程师很难察觉,因为每个团队通常只关注自己负责的工序。

    「验证这个假设需要多少时间?」张京京问。

    「虚拟实验已经完成。」赵静点击运行按钮,屏幕上开始播放模拟动画:矽片表面微观形貌的变化如何影响氧化层生长,「AI模拟了128种不同的表面状态,结论是:如果表面存在纳米级的高度差超过0.5纳米,氧化层厚度不均匀性会增加三倍。而要解决这个问题,只需要在清洗设备启动阶段,增加一个五分钟的『预稳定流程』,让温度梯度更平缓。」

    「实际验证呢?」

    「今天下午就可以安排。我们已经标记了一批晶圆,一半用现有流程,一半增加预稳定流程,晚上就能看到结果。」

    张京京的眼睛亮了。如果这个方法可行,他们解决一个缺陷点的时间可以从六天压缩到一天。

    下午六点,第一批对比实验结果出炉。

    增加预稳定流程的晶圆组,氧化层厚度不均匀性的标准差从原来的4.7%降到了2.1%,完全满足工艺规格要求。第47号缺陷点,确认解决。

    会议室里爆发出掌声——这是121个缺陷清单上第一个被正式「关闭」的项目。

    但赵静很快泼了冷水:「各位,先别高兴太早。47号是相对简单的问题,AI找到了明确的因果链。但更多缺陷是多重因素交织的结果,比如第83号……」

    她调出83号缺陷的档案:**金属互连层电迁移早期失效**。表现是在晶片工作几百小时后,某些金属线电阻异常增加,最终导致开路。问题在于,电迁移通常需要几千小时才会显现,而他们的测试只能覆盖几百小时,无法直接观察失效过程。

    「这个问题我们卡了两个月。」负责互连工艺的金秉洙博士苦笑,「我们试了调整金属沉积温度丶退火工艺丶钝化层应力,甚至换了三种不同的阻挡层材料,都没用。失效像是随机的,但又有一定的空间规律——总是发生在晶片的特定功能模块区域。」

    「AI有什麽思路?」张京京问。

    赵静让小芯AI展示分析结果。屏幕上出现了一个复杂的三维热-力-电多物理场耦合模型,模拟晶片在工作状态下的温度分布丶电流密度丶应力场。

    「AI假设,失效不是工艺问题,而是设计问题。」赵静放大模型中的一个局部区域,「在这个功能模块里,有三条金属线在某个节点处靠得特别近,间距只有设计规则的最小值。当晶片工作时,这个区域会形成局部热点,温度比周围高15-20摄氏度。高温加上高电流密度,加速了电迁移。」

    「但设计规则检查(DRC)是通过的。」金秉洙指出。

    「DRC只检查几何规则,不检查热和电的协同效应。」赵静说,「而我们的14纳米工艺对热效应更敏感,设计规则需要增加『热间距』约束。但这意味着要修改晶片设计,需要架构团队配合。」

    张京京立即拿起加密电话,联系晶片设计部门的负责人章宸。二十分钟后,章宸带着两名资深布局工程师赶到会议室。

    「热间距约束……」章宸听完描述,眉头紧锁,「如果增加这个约束,晶片面积可能会增加5-8%,性能也会受影响。而且需要重新进行全流程设计验证,至少两个月。」

    「但如果不改,良率永远上不去。」张京京坚持。

    「也许有折中方案。」赵静插话,「AI模拟了七种不同的金属线走向调整方案,在不增加总面积的情况下,可以将局部热点温度降低8-10摄氏度,电迁移寿命延长三倍以上。虽然不能完全解决问题,但可以将其从『致命缺陷』降级为『可接受风险』,等下一代晶片再彻底解决。」

    她展示了优化后的布局图:只是微调了几条金属线的走向和宽度,避开了最危险的热耦合区域。

    章宸和布局工程师们围在屏幕前,快速评估。十分钟后,章宸抬起头:「这个方案可行。改动很小,只需要修改三个金属层,验证周期可以压缩到两周内。但我们需要AI给出精确的版图修改指令。」

    「小芯可以生成GDSII格式的修改文件。」赵静说,「但需要布局工程师确认,确保没有引入新的设计规则违反。」

    「成交。」章宸伸出手,「你们解决物理问题,我们解决设计问题。两周后,新版图纸到位。」

    第83号缺陷,找到了解决路径。

    一周过去,联合诊断组的作战室里,墙上的进度图已经发生了显着变化。

    121个缺陷点中:

    已关闭:19个

    已找到解决方案,正在实施:37个

    正在排查中:42个

    尚未启动:23个

    「已经解决了56个,接近一半。」张京京在每日晨会上汇报,「按照这个速度,再有十天,大部分缺陷都能找到方向。但问题是……」

    他调出尚未启动的23个缺陷列表:「这些都是硬骨头。要麽需要昂贵的实验验证,要麽涉及根本性的工艺变革,要麽……我们连问题到底出在哪里都不知道。」

    比如第112号缺陷:**电晶体阈值电压随晶圆位置系统性漂移**。同一个晶圆上,边缘区域的电晶体阈值电压比中心区域高8-12毫伏,导致晶片性能不均匀。

    「我们排查了所有可能的工艺偏差:光刻曝光均匀性丶离子注入角度丶退火温度梯度……」负责电晶体工艺的梁志远博士摇头,「所有参数都在规格范围内,但最终的电性参数就是有系统性差异。就像有一个看不见的手,在晶圆上画了一个渐变场。」

    林薇一直在旁听,此刻突然开口:「也许问题不在制造过程,而在衬底本身。」

    「衬底?高纯矽片是我们自己制备的,检测数据完美。」梁志远说。

    「检测的是宏观参数:纯度丶晶向丶缺陷密度。」林薇调出矽片供应商的数据表,「但有没有可能,在晶体生长过程中,存在微量的掺杂浓度梯度?或者晶格常数有纳米级的区域差异?这些差异在28纳米节点可以忽略,但在14纳米节点就会被放大。」

    这个猜测很大胆。因为如果问题真的在矽片本身,那就意味着他们需要重新评估整个材料供应链,甚至要自建更精密的检测能力。

    「验证这个假设需要什麽?」张京京问。

    「需要做晶圆级的纳米压痕测试和微区X射线衍射,测量每个位置的力学性能和晶格常数。」林薇说,「这种设备国内只有三台,都在国家实验室,预约排队至少两个月。」

    时间又成了拦路虎。

    这时,赵静举起手:「也许……我们可以用间接方法验证。小芯AI分析了过去所有批次的数据,发现一个规律:来自同一个矽锭不同位置的晶圆,阈值电压漂移的模式高度相似。如果是工艺问题,不同批次的模式应该是随机的;但如果漂移模式在矽锭层面就有『签名』,那就指向衬底本身。」

    她展示了AI发现的证据:来自矽锭顶部的晶圆,总是呈现「中心低丶边缘高」的漂移模式;来自底部的晶圆,则是「左侧高丶右侧低」。这种规律性太强了,不像是随机工艺波动。

    「如果真是这样,那我们这一个月都在解决错误的问题。」金秉洙苦笑。

    「但至少现在我们知道了正确的问题是什麽。」张京京倒是很平静,「立即联系徐文渊院士的团队,请他们协助分析矽锭的微观均匀性。同时,调整工艺参数,尝试补偿这种衬底梯度——如果我们知道漂移的规律,也许可以在制造过程中反向校正。」

    「补偿需要精确的模型。」梁志远说,「每个晶圆都要单独测量,生成校正图,然后调整每个晶片位置的工艺参数。这相当于从『大批量制造』转向『个性化制造』,产能会大幅下降。」

    「但在找到完美的衬底之前,这是唯一的办法。」张京京做出决定,「先保证良率,再考虑产能。我们首先要在85天内达到75%的成本线,这是生死线。」

    晚上十一点,赵静还在AI研发中心。屏幕上正在运行第119号缺陷的分析——这是最难啃的骨头之一:**静态随机存储器(SRAM)单元在低温下软错误率异常升高**。

    问题诡异在于:晶片在室温下测试一切正常,但降到零下40摄氏度时,SRAM单元的读写错误率会飙升两个数量级。而他们的晶片设计工作温度范围是零下40到85摄氏度,这个缺陷直接导致产品不合格。

    团队已经排除了存储器设计丶制造工艺丶甚至封装问题。现在怀疑是某种材料在低温下的特性突变,但具体是哪一种材料丶哪个环节,毫无头绪。

    小芯AI已经连续运行了三天三夜的模拟,尝试了七百多种可能的材料组合和工艺条件,仍然没有找到匹配的失效模式。

    赵静盯着屏幕上滚动的数据流,突然想到什麽。她调出小芯AI的学习日志,查看它在分析过程中的「注意力分布」——这是最近加入的可解释性模块,可以显示AI在决策时最关注哪些特徵。

    日志显示,在分析低温失效数据时,AI的注意力高度集中在三个特徵上:一是SRAM单元中某种特殊介电材料的厚度;二是金属接触孔的深宽比;三是……晶片背面的某种封装材料的导热系数。

    前两个很好理解,但第三个特徵引起了赵静的注意。晶片背面?SRAM单元在晶片正面,和背面材料有什麽关系?

    除非……热应力。

    她立即重新设定模拟条件:假设晶片在低温下,因为正面和背面材料的热膨胀系数不匹配,产生巨大的热应力。这种应力可能通过矽衬底传递,导致SRAM单元中的电晶体沟道区域出现纳米级的应变,改变载流子迁移率,进而影响存储单元的稳定性。

    模拟开始运行。五分钟后,结果弹出:完全吻合。

    「找到了!」赵静忍不住喊出声。

    她把结果发给封装团队。一小时后,封装团队回覆:确实,他们为了降低成本,在最新的批次中更换了一种背面散热材料。新材料的导热性能更好,但热膨胀系数与矽的差异比旧材料大30%。在低温下,这种差异会导致晶片弯曲,产生局部应变。

    解决方案很简单:换回旧材料,或者在新材料与矽之间增加应力缓冲层。

    第119号缺陷,关闭。

    赵静靠在椅背上,长出一口气。窗外,夜色深沉,但AI研发中心的灯火依然通明。其他研究员还在工作,屏幕上运行着各种复杂的模型。

    她看向墙上的进度图:121个缺陷点,已经解决了89个,剩下的32个也都有了明确方向。按照这个速度,再有五天,清单就能全部完成。

    这比最初的预估快了整整三倍。

    而这一切,都得益于小芯AI强大的数据挖掘能力和跨领域关联分析。人类工程师的直觉和经验,加上AI的计算和模式识别,形成了一种前所未有的协同效应。

    但赵静知道,这只是开始。解决了已知的121个缺陷,还会有新的缺陷冒出来。制造工艺的优化,是一场永无止境的战争。

    她的手机震动,是林薇发来的消息:「合城那边传来消息,无尘岛先导实验线的关键部件加工遇到瓶颈,需要更精确的TCAD模型支持。宝岛电路那边表示可以提供帮助,但他们要求技术交换。」

    TCAD——工艺和器件仿真软体,这是半导体设计的核心工具之一。全球市场被两家欧美公司垄断,而宝岛电路因为历史原因,拥有深厚的TCAD模型开发经验。

    如果真能获得他们的关键模型,无尘岛的技术验证将大大加速。

    但技术交换……对方会要什麽?

    赵静回覆:「我明天一早去找您详细谈。另外,121个缺陷排查进度良好,预计五天内完成。」

    发送完毕,她关掉电脑,走出实验室。

    走廊里静悄悄的,但透过玻璃墙,她能看到各个实验室里依然忙碌的身影。这个城市,这个国家,有成千上万的人正在为同一个目标熬夜奋斗。