马塞尔·施密特无论如何都不会想到,多年以后,当人工智能研究甚至开始占据诺贝尔奖和菲尔兹奖席位的时候,自己只是为了抬杠而脱口而出一句“神经网络也是数学”将爆火出圈,并被该领域研究人员奉为圭皋。
甚至施密特本人也在某些安抚服务器机魂的仪式当中成为了被参拜的对象之一。
但这些都是后话了。
无论如何,在2004年末这个时间点上,《数学进展》选择发表一篇与全局优化以及数据模型有关的论文,都属于是可以让业内轻微地震的大新闻。
好在论文的作者之一是上届菲尔兹奖的得主,而且这还是其有据可查的第一篇合作论文。
因此业内的关注重点很快就从文章内容本身过渡到了常浩南所关注的研究方向上面——
大佬在顶级期刊上发表文章,本身就可以引领潮流。
而追热点这种事,无论中外,都是绝大多数研究人员都不得不品尝的特色……
荷兰,代尔夫特理工大学。
约瑟夫·布拉特教授正站在一台白光干涉仪前面,神情复杂地翻阅着电脑屏幕上显示出的一系列测试结果。
而在距离不远处,他的学生秦少锋正在埋头检查刚刚被面前设备吐出来的一份测试报告。
“教授,结果已经对比过了……”
几分钟之后,秦少锋把眼镜摘掉放到一边,语气有些失落地开口说道。
不过,还没来得及说出后面的内容,布拉特就提前打断了他:
“应该跟前两次测试都对不上?”
被直接猜出结果的秦少锋先是一愣,接着点点头:
“同样的被测样品,同样的三维立体测量仪,但是三次测试中的峰谷值差距都在1μm以上,均方根也有0.3μm左右,完全达不到甲方的要求……”
作为一所坐落于低地小国,且所在城市也并不出名的高等学府,代尔夫特理工大学的名气不仅远不如哈佛、麻省、牛津这样的庞然大物,就算是跟隔壁阿姆斯特丹大学相比都远远不如。
不过,它在光学和光学工程方面却有着相当雄厚的实力。
而约瑟夫·布拉特,正是该领域最杰出的学者之一。
他在上世纪70-80年代曾先后供职于飞利浦和ASmL,并于1988年转入学术界,随后在光学成像、光存储技术等领域继续做出了一系列杰出贡献。
并且是欧洲光学学会的创始人之一和现任主席。
目前他正在跟进的项目,就是受泰勒霍普森公司委托开发一种新的非接触式三坐标测量技术,以对生产面形峰谷(pV)值优于0.1μm的非球面镜片进行检测。
这个精度对基于原子力分析的接触式测量技术来说并不算夸张,但由于探针需要和工件表面接触,因此并不适用于某些特别脆弱的光学元器件。
相比之下,采用干涉法和几何光线法的非接触测量显然要友好得多。
当然,想要达到跟接触式测量相当的精度,难度也要高得多。
面对已经记不清是这几个月来第几次的失败,秦少锋已经意识到,继续进行重复性试验已经没有太大意义了。
现在需要的是更换一下思路:
“是不是考虑重新标定一下设备的公共观测点,这样位置偏移误差或许能缩小一些?”
他首先提议道。
面形检测过程中的误差主要来源于三个方面:运动轴误差、探头误差和位置偏移误差。
前两者对于接触法和非接触法来说并没有太大差别,因此非接触法的精度问题主要就出现在位置偏移误差上面——
由于没有一个可以直接接触型面,并直接确定测量参考原点的探头,所以非接触设备捕获到的误差数据,本质上相当于面型误差和位置偏移误差的叠加。
只有通过算法分离掉后者,才能得到相对精确的结果。
所以秦少锋的思路其实是没错的。
但重新标定观测点这个办法……
基本相当于电脑出故障以后的“重启一下试试”。
算是实在找不出具体原因之后,带着点玄学色彩的尝试。
虽然有些时候确有奇效,但对于光学工程专业的研究人员来说,就有点上不得台面了。
所以,几乎是立即就被布拉特给否了:
“意义不大。”
他摆了摆手,接着直接开始给秦少锋分析误差原因:
“目前这套设备的校准逻辑是基于非球面二维模型的,虽然已经利用高斯-牛顿法进行了一些修正,但本质上,测量得到的非球面中心仍然不是实际型面的中心,并且二维化之后得到的模型曲线也不是非球面的子午线,所以仅仅重置观测点是不会有效果的……”
能在看到实验报告之前就给出如此具体的解释,让后者不由得感慨,到底姜还是老的辣。
但这种情绪仅仅维持了不到两秒钟。
只听到布拉特稍作停顿,接着继续说道:
“而且更重要的是,我昨天晚上已经试过了,没用……”
“……”
滤镜瞬间破碎了。
当然,活还是得接着干。
一番思索之后,秦少锋又想到了新的路子:
“那如果我们给这台设备升级一部性能更好的控制计算机,是不是就可以略过二维模型计算这一步,直接用三维校正算法获得空间内的圆心和非球型面坐标?”
这一次,倒是没有被直接否决。
“三维校正算法的问题是容易出现局部收敛……导致出现误差特别离谱的离群值,在工业化生产中非常难以接受……”
布拉特显然已经思考过很长时间了:
“实际上,如果能克服局部收敛问题的话,那我们只需要通过仿真生成带有位置误差和面形误差的三维非球面数据,接着把生成的坐标点跟标准的非球面方程作对比,得到各坐标点的误差,最后再利用均方根误差最小原理,就可以迭代优化出相应的位置误差……”
实际上,非球面并不意味着毫无规律,其标准方程一般是二次曲面叠加高次项系数,在三维空间中只存在旋转和平移,无需考虑沿z轴的旋转,也就是仅存在6个自由度的变化,至于位置参数则可以用两个包含二阶偏导的三阶矩阵和三个误差项共同表示。
因此,最后的问题可以归纳为:利用一个合理的全局优化算法优化目标函数,使其误差函数值最小。
而秦少锋的基础也确实扎实,在听过导师的思路之后,很快就捕捉到了一些新的想法。
只不过,还隐约有些模糊:
“所以之前说二维模型经过优化之后仍然达不到效果,是因为高斯-牛顿法在求解这个最优解的过程中不正定?”
“也不完全是。”
布拉特无奈地耸了耸肩:
“实际上,日本那边已经有人将求解黑塞矩阵时正定的Levenberg-marquardt方法用于用于三维测量了,但效果还是达不到预期值。”
“Levenberg-marquardt方法……”
这个名词终于让秦少锋彻底抓住了那一闪而过的灵感,整个人瞬间精神了起来:
“我前两天听一个数学专业的同学说起来过,好像是有个非常知名的学者刚刚发表了一篇跟这个算法有关的论文,就是改善局部虚假最优问题的……而且因为内容和纯数学有点脱节,所以在他们那边还引发了一些争议……”
布拉特本人其实也有一定的数学功底,但确实和正经数学家没得比。
但却已经足够让他意识到这篇论文在光学领域的价值了。
“有没有更详细的信息,我我想去看一下这篇论文。”
他几乎是两眼冒光地问道。
“我有论文的网页链接……”
秦少锋说着摘掉手套,转身准备去办公室取电脑。
然而布拉特已经有些迫不及待,当即指了指旁边自己的电脑:
“或许你可以直接用这个……”
几分钟后,一篇足有二十来页厚度的论文便被交到了布拉特的手中。
“就一篇数学论文来说,篇幅确实有些太长了。”
他半开玩笑地接了过来。
秦少锋的回答倒是颇为正经:
“我那个同学说,如果只对Levenberg-marquardt方法本身感兴趣,那只需要看前半部分就行了……”
“知道了……”
布拉特甚至没有抬起头,只是朝着秦少锋挥了挥手,示意后者可以先去休息了。
然而,长舒一口气的秦少锋才刚回到办公室自己的座位上,旁边的电话就突然响了起来。
“秦,你去帮我联系一下泰勒霍普森公司。”
“就说我有个新的技术方案……但一些具体细节还没有想通,可能需要和他们开会讨论一下……”