网站首页
手机版

563支AI队伍和姜萍答了同一份试卷:最高34分,无一入围决赛

更新时间:2024-06-15 22:06:09作者:未知

563支AI队伍和姜萍答了同一份试卷:最高34分,无一入围决赛

经济观察网 记者 钱玉娟 6月13日,第六届阿里巴巴全球数学竞赛(下称“阿里数赛”)公布决赛名单,17岁的江苏涟水中等专业学校学生姜萍排名12位,成为全球30名里唯一的女选手。

连续多日的热搜,让公众知道了这位天才少女,也让更多人知道了阿里数赛。与往届不同,今年的阿里数赛首次开放了AI大模型挑战赛,共有563支由全球知名高校院所和企业组建的AI队伍与姜萍解答了同一份试卷。

4月13日早上8点,阿里数赛开考,数万名来自全球各地的数学爱好者,需要完成其中选择题、解答题与证明题的考验。但在6月13日公布的决赛名单中,801名晋级者里没有一支AI队伍入围。


姜萍在黑板上解题画面

据赛事官方统计,参与竞赛的AI队伍的平均分为18分,已赶上人类选手的平均水平。但AI的最高分仅为34分,与人类选手最高分113分相比,差距甚远。

经济观察网了解到,AI队伍中的最高分由上海建平中学涂津豪个人推出的AI方案获得。涂津豪通过借鉴自辩论思想,让多个大模型进行多轮的“自问自答自验证”,从而寻求问题的最优解,再让AI从中选出唯一答案。

来自西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队均获得27分,成为本届阿里数赛AI挑战赛的亚军和季军。这两支AI队伍均基于Multi-Agent(多个智能体组成)进行方案设计,前者是让多种大模型扮演不同角色进行思路分析、解题、评价,并通过调用Python等输出答案;后者则动态调整推理、逻辑验证和解释器等多个阶段,并针对每个子问题选择合适的参考案例,经过多重验证整合,最终给出答案。


姜萍介绍采访画面

在浙江大学计算机系统结构实验室从事大模型相关研究工作的陈天楚分析,现有LLM(大语言模型)的工作方法还是以固定的速率根据上下文预测下一个词,一次性输出结果。像数学竞赛这种需要反复、多次试错、思考的任务,LLM在完成复杂推理、严谨思考方面仍存在局限性。

陈天楚透露,目前虽然可以通过Prompt(输入到文生图模型的文字)工程方式,让单个LLM自我质问或多个LLM相互质问,但这种方式对模型性能的增益还比较有限,无法替代经过专业训练的人类。

公布AI挑战赛成绩的同时,赛事组委会给出的AI阅卷点评中,指出了AI的数学短板,诸如逻辑推理能力弱,证明题很难拿到完整得分点等。

在阿里数赛设立AI挑战赛之初,某互联网企业的一位技术总监就对此十分关注,他认为这是“百模大战”后,对AI模型能力的一次考验。虽然在规则清晰、计算密集型的问题上,AI模型的能力表现可以优于人类,但在需要深层次逻辑推理以及高度创新思维的问题上,人类选手仍然占据绝对优势。

从第六届阿里数赛决赛晋级名单看,AI大模型做题还难以超越人类,但上述技术总监觉得,这场数学竞赛的对决或将推动人类对人工智能本质的理解再进一步,甚至有望激发出新的数学理论和AI技术的发展。

今年,563支AI队伍使用模型调优、AI Agent(人工智能体)、提示词工程等多种方式,试图推动AI构建更强大的数学能力。

阿里数赛始办于2018年,由阿里巴巴公益、达摩院共同举办,每年来自全球的数学爱好者可以通过达摩院官网报名,竞赛以不设报名门槛、全民参与著称。一组数据显示,阿里数赛至今已累计吸引了25万人次参赛,成为全球规模最大的在线数学竞赛。

相关新闻

姜萍数学竞赛获全球第12名 参赛选手:感到非常震撼

近日,17岁的中专女生姜萍,以93分全球第12名的成绩入围全球数学竞赛决赛,引发网友广泛关注。姜萍此次参加的数学竞赛题目到底有多难?她取得这个成绩有多牛?6月15日,一位参赛选手告诉极目新闻(报料邮箱:jimu1701@163.com)记者,他是数学专业毕业的,数学成绩一直都不错,这次参加竞赛考了不到40分。他形容该竞赛题目:“难,专研数学并且有数学天赋的人才能做的”,而姜萍这个成绩让他“非常震撼”。


决赛入围名单

近日,2024阿里巴巴全球数学竞赛决赛入围名单公布,最终有来自全球各地的800余名数学高手成功晋级,排在第12位的姜萍显得有些特别。17岁的她是一名中专生,而且不是数学专业出身,最终竟以93分的高分,名列全球第12名,秒杀了一众数学专业的选手。

姜萍参加的这场数学竞赛题目难度到底有多大?有网友直言,别说去解答,就是连题目都看不懂。6月15日上午,一位参赛选手向极目新闻记者介绍该竞赛比较有权威,在谈及竞赛题目难度时,他形容:“难,是数学系的,而且是专研数学并且有数学天赋的人才能做的。”该参赛选手还介绍,他本身就是数学专业出身,从高中到大学,数学成绩一直都不错,而且毕业后也在坚持数学的学习,这次竞赛考了不到40分。“有数学天赋的人,是别人学不来的,没有天赋就是没有天赋。姜萍有热爱数学的心,而且能坚持学习。她现在取得的成绩,是对所有爱好数学的人的一种鼓励。也是让我们看到了一些不一样的地方。我想只要她能接着学习数学,肯定会发光的。”该参赛选手说。

另有做考研数学辅导的老师形容,2024阿里巴巴全球数学竞赛题目“难度极高”,评价姜萍“毫无疑问是天才”。


姜萍的专业是服装设计 图源:潇湘晨报

南开大学数学科学学院大二学生曹同学也参加了此次全球数学竞赛,而且取得了很不错的成绩,成功入围决赛。他在接受媒体采访时介绍,今年初赛是开卷的形式,在48小时内做七道题,而在这七道题中,他完全会答的题有四道,包括两道选择题、一道关于微分方程的题和一道关于概率论的题。剩下的三道题中,其中一道关于高等代数的题包括三问,他回答了其中两问。另一个同样关于高等代数的题目包括两问,他回答了其中一问。最后一道关于椭球的题,他完全不会。

对于姜萍的成绩,曹同学表示“非常震撼”,“对我来说,震撼程度相当于,美籍韩裔数学家许埈珥二十多岁才开始学数学还能拿到菲尔兹奖。”

村支书回应"姜萍上中专":不是因为偏科或家里条件差

学服装设计的17岁中专女生,闯进全球数学竞赛12强!这两天,天才少女姜萍和挖掘她的老师王闰秋两人的故事在全网引发热议,很多人感慨这两人的相遇点亮了彼此的人生,尤其是王老师的栽培,有可能彻底改变姜萍的命运。

今天,包括培养王闰秋的江苏大学在内的多所院校,明确给姜萍抛出橄榄枝,希望她能到高校里再深造。

对于外界的关注,姜萍和王闰秋也表达了感谢,但因为正值期末,以及下周就要参加决赛,婉拒了进一步采访。橙柿互动记者辗转联系了姜萍老家和王闰秋的老师,看看身边人对这两位数学高手的印象。

姜萍的其他科成绩也是数一数二

村里人都替她感到骄傲

姜萍是土生土长的江苏涟水县人。涟水史称“安东”,有着“自古安东出才子”的说法,涟水因此有“教育之乡”的美誉。东汉政治家军事家陈登、南北朝文学家鲍照,当代军旅作家吴强、台湾著名诗人蓉子等,都是涟水的骄傲。《西游记》的作者吴承恩祖籍也是涟水。

不过,因为经济欠发达,此前涟水是江苏有名的贫困县。

姜萍的家在涟水县下面的一个村,村支书孙先生向橙柿互动记者表示,昨天看到姜萍的消息后,全村人都很开心也很骄傲,“毕竟在农村出这么一个人才,太不容易了。”包括他在内的很多村民第一时间跑去姜萍家祝贺。

“我们其实很早就通过家里的小孩知道,小姜数学很好,没想到这么好。”孙书记还透露,“姜萍和姐姐两个人的成绩都不错,姐姐已经上大学,姜萍每个月都会回来几次。”

为什么数学天赋这么好的孩子,读的是中专而不是重点高中?姜萍是不是特别偏科?这是很多网友心中的疑问。

对此,孙书记也曾问过姜萍的爸爸,得到的回复是:“既不是因为偏科,也不是因为家里条件不好。虽然家里不是很富裕,但上学的钱还是有的。”

关于姜萍的成绩,王闰秋老师也表示,姜萍报考中专并不是因为总分低,相反,她的各科成绩都是数一数二,但相对于数学的断崖式领先,其他比较平均,跟别人的差距不是很大。

今天,有网友“考古”考到了当年姜萍中考的成绩是621分,在一堆名单里分数并不低。王闰秋也证实了这个说法,当时姜萍的成绩可以报考当地的四星级中学,也就是重点高中。


有网友“考古”考到了当年姜萍中考的成绩是621分

涟水中等专业学校的任课老师对姜萍的评价也很高,语文老师觉得她是很好的学生,英语在班里也是数一数二。

王闰秋导师:

姜萍身上能看到王闰秋的影子

今天,江苏大学冲到了热搜二。他们趁着这把热度,给自己做起了招生广告:“江大韦神”助力17岁中专女生闯进全球数学竞赛12强,天才遇到伯乐真好!欢迎报考江苏大学,在这里遇见你的伯乐。


江苏大学喊话姜萍“欢迎报考”

这个“江大韦神”,说的就是姜萍的老师王闰秋。

其实推荐姜萍参加阿里全球数学竞赛前,王闰秋本人已是这个比赛的常客。去年和前年他分别取得了预赛166名、预赛432名的好成绩,今年更是冲到了125名,成功入围决赛。可以说也是一等一的数学顶尖高手。


王闰秋在本届竞赛中排名125

在2022年阿里巴巴全球数学竞赛中,一道左右一致的题目让王闰秋想了整整一天,在最后一刻写下证明后,他真实地感受到那个证明的对称性太美了:“对我来说,数学是更本质的东西,就像我戴的眼镜一样,可以提供一种全新的视角,去重新看待日常生活。

在江苏大学读研三年,王闰秋师从数学科学学院卢殿臣教授,算起来他是姜萍的“师爷”。刚刚退休的卢教授昨天也看到了新闻,第一时间转发到了朋友圈,并把链接发到了学生群。


卢教授曾参与编写《高等数学及其应用》一书

仔细看了姜萍的经历,卢教授认为能闯进全球前30名,而且是唯一一名女生,除了天赋外,跟姜萍的刻苦努力分不开。“一方面需要对数学感兴趣,自己想学,这是学好数学的基础。另外,就是能不能刻苦努力。”

这也让他从姜萍身上看到了王闰秋的影子。在读研究生的三年里,这位得意门生几乎所有的娱乐时间都沉浸在数学世界里,即使研究生毕业走上工作岗位后,还在坚持研究数学课程。去年全球数学竞赛最终成绩公布后,王闰秋特意跟老师汇报了自己的成绩:(离获奖)就差了半道题。

刻板印象里,数学学得好的都是男性,不过卢教授并不这么认为,在他的教学生涯中,特别是大学和研究生阶段,男生和女生的比例占一半和一半,“数学好的女生也非常多。”

他一再强调,姜萍是个很难得的正面例子,“因为到了职高或者大学,还能保持吃苦精神的学生其实并不多。”他还觉得从积极的角度看,没能上高中反倒让姜萍有了更多空间释放数学天赋,“因为高中应试教育模式和发挥兴趣爱好是两码事。高考并没有那么多时间去研究更高阶数学。”

现在回想起来,王闰秋说自己读高中的时候连“数学分析”听都没听说过,“但如果能接触到未必就学不懂。”因为没有领路人,他直到上了大学之后,才发现身边已经有人提前学过高等数学建模。

不少高校抛出橄榄枝

浙大教授:欢迎来浙大!

王闰秋老师曾透露,浙江大学是姜萍梦想中的高校,不过由于专业限制,她只能就读江苏省内的三所高校,最好能申请到常熟理工。

就在今天下午,@常熟理工大学发了条微博进行回应:“非常期待小姜同学未来报考常熟理工学院服装设计与工程专业。我们建议可以先来常熟理工打好扎实的本科基础,硕士阶段到浙江大学继续深造。杭州和苏州很近,我们学校会全力以赴帮助你实现梦想。”

刚刚,浙江大学苏德矿教授转发姜萍的相关报道,并表示“欢迎来浙大!”


浙大教授喊话欢迎姜萍到浙大学习

浙江大学教师个人主页信息显示,苏德矿为数学科学学院数学基础课程教学研究中心副主任、浙江省精品课程《微积分》课程负责人、国家(网络)精品课程《微积分》课程负责人,研究方向为数学教育、高等数学。

姜萍的优秀,也引来了更多高校的橄榄枝。@同济大学发博祝贺姜萍:“每一份努力都会有回报。欢迎广大考生报考同济大学,一起来学高数!”王老师此前向姜萍推荐的自学数学教材中,第一本便是同济大学出版的《高等数学》。


同济大学发博祝贺姜萍

在微博上,点进话题词#学数学我们是专业的##轮到数学专业展示了#,还可以看到各大高校花式推荐自家的数学专业。

复旦大学用一则精心制作的视频表示:“数学实力影响着国家实力,作为数学英才的你不可或缺。”

“与你共赴这场数字之旅,用心去感受数字的韵律”,厦门大学搬出了“陈景润院士学习和工作过的地方”这块金字招牌。


厦门大学搬出了“陈景润院士学习和工作过的地方”这块金字招牌

中国人民大学更是直接用实力说话:“2024年度美国大学生数学建模竞赛结果日前揭晓,中国人民大学5支队伍获得特等奖,是全球获得特等奖最多的高校。”

本文标签: 姜萍  宇宙  ai  阿里巴巴全球数学  

为您推荐

563支AI队伍和姜萍答了同一份试卷:最高34分,无一入围决赛

563支AI队伍和姜萍答了同一份试卷:最高34分,无一入围决赛,姜萍,宇宙,ai,阿里巴巴全球数学

2024-06-15 22:06

通向地铁的要道成“断头路”荒废数年,烂尾原因竟是“城中村”拦路

通向地铁的要道成“断头路”荒废数年,烂尾原因竟是“城中村”拦路,烂尾,小路,城中村,大场镇,宝山区,地铁站

2024-06-15 21:10

乌情报总局局长:俄最新型S-500防空系统部分部件已运抵克里米亚

乌情报总局局长:俄最新型S-500防空系统部分部件已运抵克里米亚,乌军,导弹,俄罗斯,乌克兰,克里米亚,防空系统,胡塞武装,乌情报总局,s-500

2024-06-15 21:10

外媒曝美军曾在菲律宾开展秘密行动抹黑中国疫苗,科兴独家回应

外媒曝美军曾在菲律宾开展秘密行动抹黑中国疫苗,科兴独家回应,菲律宾,疫苗,科兴,美军,秘密行动,杜特尔特,国防部

2024-06-15 21:10

凯特王妃穿白衣现身,棱角分明表情严肃,9岁夏公主坐在爸爸对面

凯特王妃穿白衣现身,棱角分明表情严肃,9岁夏公主坐在爸爸对面,威廉,夏公主,威尔士,凯特王妃,剑桥公爵夫人凯萨琳

2024-06-15 21:10

公积金怎么取出来支付宝 公积金怎么取出来支付宝提取方式

1、首先需要用户登录个人的支付宝账号,在选择“城市服务”;2、然后依次选择办事大厅里面的“公积金—公积金提取”;3、进入公积金提取页面之后,根据自己的实际情况选择提取方式,包括有住房提取、其他住房消费提取、销户提取、退休

2024-06-15 21:07