熊猫体育科技有限公司|中国官方网站|熊猫体育公园/校园AI体育/智慧社区 / 🏅熊猫体育是领先的AI智慧体育与城市更新解决方案提供商,专注校园AI体育、智慧公园、智慧社区等场景,平台官网提供AI体测、智慧跑道、体育公园全场景解决方案。熊猫体育拥有自主AI算法平台与大模型数据技术,以“科技+人本+AI算法”驱动智慧化升级,打造互动互知、生态高效的数字化空间,累计服务6000万+人群。 虚拟现实手术大观 /news-detail/1/260.html

【导语】外科医生的首次主刀手术充满挑战,即使经过长期学习与训练,实际操作时仍可能感到力不从心。Fundamental VR公司利用虚拟现实(VR)技术,为外科医生提供了一个安全的、高效的手术模拟训练环境。该平台通过高度仿真的手术场景和触觉反馈技术,显著提升医生的手术技能和练习频率,同时获得专家的即时指导。英国皇家外科学院已正式认可该平台,纳入继续教育学分体系。未来,VR技术有望进一步普及,让更多人能够在家中学习手术流程,推动外科医生培训方式的革新。

外科医生的第一次主刀手术往往充满挑战。即使经过多年的学习和训练,在实际进行开腹手术或骨科截骨时,仍可能感到准备不足。手术成败很大程度上取决于操作的精确程度。

Fundamental VR公司致力于通过虚拟现实(VR)技术加速外科医生的培训进程。该技术使医生能够随时进入模拟手术室的高压环境进行训练。使用者只需佩戴头戴设备和手柄,即可进入虚拟手术场景,选择特定手术类型后,相应解剖部位的数字化模型便会呈现,供其进行手术操作。

Fundamental VR平台为外科医生创造了一个安全的手术试错学习环境,医生可以观察模拟人体对各类手术操作的真实反应,而无需担心对真实患者造成伤害。该平台通过实时数据仪表盘提供精确的操作反馈,并能够根据使用者的实际水平智能调整辅助程度,有效解决了传统外科培训中专家指导受时空限制的难题——所有操作过程均可完整记录供专家后期评估,同时也为罕见病例的练习提供了随时可用的模拟机会。值得注意的是,英国皇家外科学院已正式将该VR培训系统纳入继续教育学分体系,这意味着医师可以通过此平台获取部分所需的50个年度继续教育学分以维持执业资格。

VR技术将让外科医生学习更富效率、更能频繁练习,并获得来自专家的实用意见

VR技术正在革新外科医生的培训方式,通过高度仿真的虚拟现实系统显著提升学习效率和增加练习次数,同时实现专家指导的即时获取。这一被业界称为“全感官VR手术模拟平台”的系统,其核心价值在于精确还原了各类手术场景,从精细的微创手术到传统的开放手术,其数字模型库持续扩展更新。平台采用先进的触觉反馈技术,经过长达一年的研发周期,成功模拟了手术过程中组织纹理、器官重量变化等关键触觉体验。平台创始人强调,正是这种触觉模拟技术将系统从单纯的视觉模拟提升为真正具有教学价值的专业工具,使其区别于普通的VR游戏。

在手术模拟的真实性方面,该系统特别注重还原那些视觉盲区的触觉反馈。例如在骨科手术中,能精确模拟骨锯、骨钻等器械与骨骼的交互感觉;在组织分离操作时,力反馈装置会真实再现器械夹持组织时的阻力变化。这种高度仿真的设计旨在最大限度接近真实手术体验,克服了传统医学人体模型只能单次使用、无法模拟血流动力学等缺陷。系统甚至还原了动脉破裂时的血液喷溅场景,虽然视觉效果冲击强烈,但这对训练医生处理紧急情况至关重要。

开发团队整合了多方面专业资源来打造这一系统,包括真实手术影像资料、器械力学参数、组织工程学数据等,同时结合手术室环境音效营造沉浸式体验。通过精确模拟器官重量、组织质感和术中声响,该系统为外科医生提供了前所未有的高仿真训练环境,使医生能够在零风险的情况下积累宝贵的手术经验。英国皇家外科学院已正式认可该平台的教学价值,将其纳入医师继续教育学分体系,这进一步验证了其在专业医学教育领域的重要地位。

“多人手术”设定可让外科医生像在现实中一样协作

该团队由制造专家和经验丰富的专科医师组成。触觉工程师等会与这些专业人员密切合作,打造高度精确且符合现实的手术模拟体验。

来自全球各地的医学专家积极参与(yǔ)其(qí)中,为设计师和(hé)工(gōng)程(chéng)师(shī)提(tí)供(gōng)专(zhuān)业(yè)建(jiàn)议(yì)和(hé)反(fǎn)馈(kuì)。开(kāi)发(fā)团(tuán)队(duì)将(jiāng)手(shǒu)术(shù)过(guò)程(chéng)分(fēn)解(jiě)为(wèi)多(duō)个(gè)步(bù)骤(zhòu),力(lì)求(qiú)每(měi)个(gè)环(huán)节(jié)都(dōu)尽(jǐn)可(kě)能(néng)贴(tiē)近(jìn)真(zhēn)实(shí)操(cāo)作(zuò)。外(wài)科(kē)专(zhuān)家(jiā)不(bù)仅(jǐn)指(zhǐ)导(dǎo)开(kāi)发(fā)过(guò)程(chéng)、测(cè)试(shì)设(shè)备(bèi)性(xìng)能(néng),还(hái)负(fù)责(zé)指(zhǐ)出(chū)需(xū)要(yào)提(tí)升准确度的具体环节。

触觉工程师根据反馈意见进行修改,调整用于生成触觉反馈的数字网格,并将其与对应的3D模型精准对接。医学专家同时确保每个训练模块都能达成既定的学习目标。

头戴式显示器的空间定位功能允许使用者自由选择观察位置,通过头部移动获得最佳视野,这有助于从不同角度查看手术切口。在传统培训中,实习医生往往只能站在主刀医生身后,从有限的角度观摩手术。

手术影像可能很快就会在市面上的VR头戴式显示器上出现,任何人都可以在家看到手术步骤

未来,手术教学影像很可能通过商用VR头显普及,让更多人能够在家中学习手术流程。虽然创建通用虚拟人体模型很有价值,但若能针对具体患者生成个性化手术模拟则更具临床意义。通过下载特定患者的术前数据,医生可以在实际手术前进行多次演练。

系统部署完成后,多名外科医生可以预先练习当天计划的所有手术。对于复杂或罕见的病例,其他医生可以在术后下载手术数据,评估自己是否具备处理类似病例的能力。

目前已有厂商研发专用触觉手套,旨在让医生能够用手指直接感知虚拟患者的体内状况。现有技术在模拟膝关节手术等操作时仍存在局限:现实中医生需(xū)要(yào)用(yòng)另一只手固定患者膝盖,而未来的触觉手套将支持这种交互效果,使VR模拟更加真实可信。

虽然VR应用种类繁多,但医学领域因其保守特性而具有特殊要求,需要充分的实证支持。严格的验证和认证对该平台至关重要。其核心目标是让所有外科医生都能便捷地使用VR技术,同时帮助资深医师掌握新的治疗方法。

文中图片均来源于《How it works》杂志

本文为{全文关键词}·星空计划扶持作品

作者:《how it works》科普团队

审核:孙轶飞 河北医科大学医学教育史研究室主任 中华医学会(huì)医(yī)史(shǐ)分(fēn)会(huì)委(wěi)员(yuán)

Fri, 05 Sep 2025 06:01:41 +0800
未来的高科技道路 /news-detail/1/259.html

【导语】随着汽车技术的迅猛进步,道路基础设施正经历着前所未有的变革。英国已领先建成644千米的智慧高速公路系统,利用先进传感器实现智能管理。智慧道路不仅调节限速、分配车道,更在能源利用、信息交互方面展现突破,如压电道路充电、模块化智慧系统、自发光路面及智能防冻技术。这些创新技术正逐步将传统道路转变为集安全、节能、智能于一体的新型基础设施,预示着未来交通的无限可能。本文将深入探索这些前沿科技及其对社会的影响。

随着汽车技术的快速发展,道路基础设施也在同步升级。英国已建成总长约644千米的智慧高速公路系统,主要应用于M1等交通繁忙路段。这种道路通过两种核心传感器:埋设在路面下的铜质感应线圈和安装在道路两侧的侧射式传感器,实现智能管理。

铜制感应线圈每隔数百米布设一组,当金属物体(如车辆)经过时会产生感应电流,侧射式传感器则通过双向投射的探测光束监测通行车辆的速度、数(shù)量(liàng)和(hé)间(jiān)距(jù)。

为(wèi)了(le)舒(shū)缓(huǎn)交(jiāo)通(tōng)拥(yōng)堵(dǔ),智(zhì)慧(huì)道(dào)路可(kě)通(tōng)过(guò)路标(biāo)显(xiǎn)示(shì)、路况引导和车道合理分配等缓解交通压力。

英国自2014年大规模应用智慧道路技术以来,在缓解交通拥堵方面取得成效的同时,也暴露出新的安全隐患。例如:系统在车流高峰时引导车辆使用路肩通行,导致与占用路肩的故障车辆的碰撞事故显著增加。针对这一问题,英国交通运输部门正考虑全面取消路肩通行方案,以提升道路安全性。

智慧道路的发展远不止于调节限速和车道(dào)管(guǎn)理(lǐ)。全球(qiú)范(fàn)围(wéi)内(nèi),智(zhì)慧(huì)化(huà)正(zhèng)在(zài)多(duō)个(gè)方(fāng)向(xiàng)实(shí)现(xiàn)突(tū)破(pò)性(xìng)进(jìn)展(zhǎn):

道(dào)路可(kě)以(yǐ)充(chōng)电(diàn)

在(zài)能(néng)源(yuán)利(lì)用(yòng)领(lǐng)域,压(yā)电(diàn)道(dào)路技(jì)术(shù)展(zhǎn)现(xiàn)出(chū)巨(jù)大(dà)潜(qián)力(lì)。通(tōng)过(guò)在(zài)沥(lì)青(qīng)中嵌入压电晶体,可将车辆通行产生的振动转化为电能。英国兰开斯特大学获得450万英镑资助,正致力于解决能源转换效率和储能等关键技术难题。虽然这项技术尚未大规模应用,但其作为新型可再生能源的前景值得期待。

美国"整合道路"公司开发的模块化智慧道路系统代表了另一重要发展方向。这种预制式道路通过内置光纤网络和压力传感器,能够实时监测交通状况,为驾驶者提供天气、事故等即时信息。该公司已在堪萨斯州建成0.8千米的试验路段,验证了技术的可行性。下一阶段将重点研发道路为电动汽车无线充电的功能,这或将彻底改变未来交通能源供给模式。

这些创新技术表明,智慧道路正在从单纯的交通管理工具,向集能(néng)源(yuán)生(shēng)产(chǎn)、信(xìn)息(xi)交(jiāo)互(hù)、电(diàn)力(lì)传(chuán)输(shū)于一体的综合基础设施转变。随着5G通信、物联网等技术的融合发展,未来道路将实现更智能、更安全的交通服务。

透过感知车重、通行频率等,得到车速和交通量

会发光的道路

荷兰设计师达安·罗斯加德在2014年提出的"发光线"概念,为道路照明(míng)带来了革命性改变。他在阿姆斯特丹西南侧一段4.5千米的道路边线涂刷特殊磷光涂料,这种涂料白天吸收阳光能量,夜晚可持续发光8小时。美国犹他州交通运输部的研究人员正在改进这项技术,提升涂料的耐候性和延长发光时间。

罗斯加德工作室(Studio Roosegaarde)发明的“发光线”

继罗斯加德后,又有很多研究人员致力于发光道路的性能研究。例如美国犹他州交通运输部的研究员正设法提升发光涂料的耐候度,并拉长发光时间。

沥青也能防冻

在道路防冻技术方面,以色列SAN Hitech公司开发的"消雪计划"取得了突破性进展。该技术通过在沥青路面铺设发热合金带,配合温度传感器监测系统,能在检测到路面结冰时15分钟内启动加热功能(néng)。测(cè)试(shì)表(biǎo)明(míng),这(zhè)套(tào)系统即使在-50℃的极端环境下也能有效融雪除冰。

测试证明,路面下的发热合金得以融雪、清理路面冰雪

这些创新技术正在改变传统道路的功能边界。从自发光路面到智能温控系统,现代道路已从单纯的通行载体转变为集安全、节能、智能于一体的新型基础设施。随着材料科学和物联网技术的进步,未来道路将实现更多突破性的功能创新。

文中图片均来源于《How it works》杂志

作者:《how it works》科普团队

审核:王航 北京市市政工程设计研究总院有限公司 道交一院副总工

Fri, 05 Sep 2025 06:01:40 +0800
无所不能的机器人 /news-detail/1/257.html

【导语】随着人工智能与现代科技的飞速发展,自主管理机器人正深刻改变着人类的生活方式。从灾难救援的英勇身影到太空探索的稳健步伐,从精密医疗的细微操作到国防安全的坚实防线,再到生态保护的细微关怀和日常家务的贴心服务,智能机器人以其独特优势广泛应用于社会各领域。本文将带您探索这些全能机器人的神秘世界,见证它们在抢险救灾、太空探索、医疗手术、军事应用、生态保护以及智能家居等方面的非凡成就。随着技术的不断进步,机器人技术正引领新一轮科技革命,为人类文明注入新的活力。

随着人工智能与现代科技的迅猛发展,自主管理机器人正在重塑人类生活方式。从灾难救援到太空探索,从精密医疗到国防安全,从生态保护到日常家务,这些智能机器人正以其独特优势深入人类社会的各个领域。现在,就让我们一同揭开这些全能机器人的神秘面纱。

在抢险救灾领域,机器人已成为消防员的革命性伙伴。面对高温、毒烟等人类难以承受的极端环境,消防机器人能毫无畏惧地冲锋陷阵。以日本三菱重工研发的工业消防机器人为例,它们采用团队协作模式,通过激光雷达和GPS精确定位火源。软管扩展机器人快速铺设超长水带,配合每分钟喷射4000升水量的重型水炮机器人,形成高效灭火体系。这些通过东京火灾与灾害研究所严格测试的机器人,已在实战中展现出卓越性能。随着技术迭代升级,未来消防机器人有望承担更多高危任务,成为应急救援的中坚力量。

三菱重工的消防机器人旨在扑灭难缠的工业大火

太空探索已成为机器人技术的重要舞台。在火星的嶙峋地貌上,NASA喷气推进实验室研发的LEMUR机器人正展现惊人攀爬能力——这款四足机器人通过16只手指上的数百个微型钩爪,能在垂直岩壁上稳健移动。初代LEMUR IIa成功验证了火星攀岩技术,而升级版LEMUR IIb更在死亡谷测试中展示了自主路径规划能力,无需人工干预即可完成任务,为未来深空探测奠定了关键技术基础。

初代LEMUR IIa正在进行火星攀岩技术测试

医疗机器人技术同样取得突破性进展。达·芬奇手术机器人凭借其精密机械臂和3D高清成像系统,正在重塑外科手术标准。医生通过专用控制台操作,能获得放大10倍的手术视野,实现亚毫米级精准操作。目前全球已完成逾600万例达·芬奇机器人手术,其安全性和精确性得到广泛验证。随着技术进步,更多智能医疗机器人将加入手术团队,为医患双方带来革命性改变。

军事领域正成为机器人技术的前沿阵地。波士顿动力公司研发的Atlas人形机器人凭借其革命性的液压驱(qū)动(dòng)系(xì)统(tǒng),实(shí)现了媲美人类的运动能力——行走、负重、奔跑、跳跃等高难度动作。最新测试中,Atlas更是完成了倒立、翻滚等特技动作,展现出惊人的平衡性与环境适应能力。其搭载的先进算法赋予机器人自主决策能力,为未来战场上的多样化任务开辟了新可能。

搭载人工智能脑部与液压身体,Atlas令人惊艳

在生态保护与现代农业领域,微型机器人同样大显身手。哈佛大学怀斯研究所开发的机器蜜蜂(RoboBee)仅重0.1克,尺寸不及回形针,却能通过人工肌肉实现每秒120次的高频振翅。这种微型飞行器不仅有望解决全球蜂群减少导致的授粉危机,还具备灾害搜救、环境监测等多样化应用前景,为可持续发展提供创新解决方案。

有朝一日,机器蜜蜂能像真的蜜蜂般替植物授粉

在智能家居领域,服务型机器人正成为现代家庭的贴心伙伴。相较于Alexa等固定式语音助手,法国Blue Frog Robotics公司开发的Buddy机器人具备自主移动能力,不仅能进行情感化互动、陪玩益智游戏,还能通过物联网技术联动智能家电,实现真正的智慧家居管理。随着技术成熟和成本下降,这类具备情感交互能力的家用机器人将加速普及,重塑人们的居家生活方式。

Buddy是社交机器人,可与全家人互动。

机器人技术的创新应用正呈现爆发式增长。波士顿动力的四足机器人Spot已投入石油设施巡检;日本打造的20米高巨型机甲成为工程奇迹;印度太空研究组织开发的女性机器人Vyommitra更将参与载人航天任务。这些各具特色的智能机器人正在能源、制造、航天等关键领域发挥不可替代的作用。

随着人工智能和机电一体化技术的突破,自主管理机器人已深度融入人类社会。它们以精准可靠的性能提升各行业效率,以人性化设计提高生活质量。可以预见,机器人技术将继续引领新一轮科技革命,为人类文明进步注入强劲动力。

文中图片均来源于《How it works》杂志

作者:《how it works》科普团队

审核:梁忠伟 中国机械学会微纳制造\智能运维专委会理事、中机联绿色制造专委会常务委员

Fri, 05 Sep 2025 06:01:39 +0800
无需高温高压!中国科学家用光“拆”氢气分子,可稳定运行1500小时 /news-detail/1/255.html

【导语】在化学世界中,氢气扮演着改变“顽固分子”的关键角色。然而,氢气的两个氢原子却像紧紧相拥的恋人,难以分离。近日,中国科学院大连化学物理研究所的研究团队与意大利里雅斯特大学的合作团队,在国际期刊《科学》上发表了一项新成果:他们利用光作为“分子开锁匠”,成功实现了氢气的“不公平分手”——异裂,为绿色工业发展开辟了新路径。这一创新策略不仅降低了能耗,提高了加氢反应的安全性,还为碳资源优化利用和碳中和目标提供了有力支持。

出品:{全文关键词}

作者:罗能超(中国科学院大连化学物理研究所)陈思(中国科学院大连化学物理研究所)

监制:中国科普博览

在化学世界里,氢气是改变很多“顽固分子”的关键角色之一:它可以把空气中的主要成分氮气转化为化肥,解决农作物生长的营养供给问题;可以把温室气体二氧化碳转化成汽油,让温室气体“变废为宝”……

但想让氢气与其(qí)他分子反应,首先要让氢气的两个氢原子“分道扬镳”。不(bù)过(guò)难(nán)题(tí)在(zài)于(yú):氢(qīng)气(qì)分(fēn)子(zi)就(jiù)像(xiàng)一(yī)对(duì)紧(jǐn)紧(jǐn)相(xiāng)拥(yōng)的(de)恋(liàn)人(rén),它(tā)们(men)共(gòng)享(xiǎng)电(diàn)子(zi)形(xíng)成(chéng)化(huà)学(xué)键,因此异常牢固。

“紧紧相拥”的氢分子“恋人”

(图片来源:自制)

氢气的“不公平分手”

从微观粒子的角度看,氢气“分手”的形式有两种,一种是“和平分手”——两个氢原子各带走一个电子,公平且友好,叫做均裂;另一种则是“不公平分手”——一个氢原子带走全部电子,另一个则一无所有,叫做异裂。

氢原子的“和平分手”——均裂

(图片来源:自制)

氢原子的“不公平分手”——异裂

(图片来源:自制)

有趣的是,正是异裂这种“不公平分手”产生了富电子的氢物种(氢物种通常指的是氢元素以不同形态存在的各种形式,包括氢原子、质子和氢负(fù)离子等),它们具有非常强的反应能力,能够与多种物质发生反应。但在传统反应方式中,想要制造一场“不公平分手”可不容易,需要高温高压的苛刻条(tiáo)件(jiàn),消(xiāo)耗(hào)大(dà)量(liàng)能(néng)源(yuán)。

近(jìn)日(rì),中(zhōng)国(guó)科(kē)学(xué)院(yuàn)大连化学物理研究所王峰研究员团队等和意大利的里雅斯特大学Paolo Fornasiero教授团队合作,找到了一种新的策略,让光成为“分子开锁匠”,能够更加轻松地促成氢气的这场“不公平分手”,相关成果发布在国际期刊《科学》(Science)上。

氢气异裂的核心是各产生一个带正电和带负电的氢物种(zhǒng)中心,因此,通过异裂的方式“解锁”氢氢键的“钥匙”必须必须能与异裂后的氢物种中心相匹配,即自身也需要具备正负电荷中心。所以,寻找氢气异裂的突破口在于设计能够同时提供稳定正、负电荷中心的体系。

来自光的“开锁”灵感

如何才能构建出正负电荷中心?我们(中国科学院大连化学物理研究所研究团队)从太阳光中获得了解决难题的灵感。当光激发半导体时,电子吸收光子的能量会“离开”原来的位置,在其原先的位置留下一个带正电的“空位”,这就同时产生了带负电的电子和带正电的空穴——这不正是氢气“不公平分手”想要打造的正负电荷中心吗?

空间临近正负电荷对

(图片来源:自制)

然而,问题并非如此简单。想要开锁,不仅锁孔的“性状(性质和形状)”要和钥匙匹配,两个锁孔之间的距离也要与钥匙匹配才行。因此,光生电子和空穴需要被控制在非常接近的空间内(氢氢键的距离,亚纳米尺度),才能产生足以驱动氢氢键异裂的不均匀电荷环境。可是当距离过近时,电子和空穴又会因为正负电荷相吸而重新结合,正负电荷中心也就随之消失。

电子和空穴容易因距离过近而重新结合

(图片来源:自制)

巧用“陷阱”:困住电子与空穴

要让电子和空穴不发生复合,一个巧妙的策略是将它们分别束缚(fù)在(zài)空(kōng)间邻近(jìn)的(de)不(bù)同位点上,相当于将它们各自困在独立的“陷阱”中。电子和空穴若要复合,必须先获得额外的能量“跳出”各自的陷阱,这样就可以延长电子和空穴的“寿命”,为驱动氢氢键异裂创造可能。

将电子和空穴困在独立的“陷阱”中

(图片来源:自制)

近年来,科学家们已经成功在一些光电材料上捕捉到了困住电子或空穴的陷阱。然而,这些陷阱都是单侧的,没有被困住的一方则处于游离状态,不仅有效浓度(电荷密度)较低,还使得电子与空穴难以稳定地维持在极近的空间距离内,无法满足高效驱动氢氢键异裂所必需的要求。

通过已有的研究我们知道,在经典的二氧化钛半导体上负载金纳米颗粒后,半导体受到光激发产生的电子会转移到金纳米颗粒上,在此处形成一个电子中心,即负电荷中心。并且在纳米颗粒和半导体交界处有一个能量的“小山坡”,这样电子就不容易翻过这个山坡,从而达到把电子“困”在金纳米颗粒上的效果。

光催化过程产生电子,必然会同时产生空穴。一般观点认为,这个空穴会在二氧化钛半导体上,和电子中心的距离比较远。但也有科学家通过理论研究推测,在纳米颗粒和半导体的界面处应该会存在“陷阱”,容易富集空穴。

二氧化钛半(bàn)导(dǎo)体上负载金纳米颗粒后收到光激发会形成正负电荷中心

(图片来源:自制)

所以,首先要通过实验验证空穴的位置!

由于空穴是带正电荷的,它能够和低价的金属离子反应,因此,低价金属离子就如同是空穴的“成像剂”——在电子显微镜下找到金属离子的位置,就能够反映空穴所在的位置。经过深度研判和不懈寻找,我们最终在半导体与纳米颗粒的交界面找到了捕获空穴的“陷阱”,有效地阻止了正负电荷的复合,确保正负电荷中心的稳定存在。

给氢氢键解锁的“钥匙”造好了,但是研究并没有止步于此。我们发现,二氧化钛和金纳米颗粒界面处“自然”存在的“钥匙”太少,这会导致异裂效率低下。于是,我们让二氧化钛半导体包覆在金纳米颗粒上,相当于给这些纳米颗粒“穿”了一层半导体“外衣”,大幅增加了二者的界面交界位点数。实验证明,这种改良使光诱导氢气异裂的活性增加了7.7倍。

光产生的电子-空穴诱导氢气发生异裂

(图片来源:由科研团队提供)

我们还通过实验验证了这种光诱导氢气异裂的优势:利用金-二氧化钛复合材料,通过两步反应将不易发生反应的二氧化碳近乎完全的转化为乙烯,且系统可稳定运行1500小时以上。另外,我们通过进一步的研究证明,该系统在自然太阳光下同样能高效转化二氧化碳。

优化加氢反应,推动绿色工业发展

这种光诱导氢气异裂的方式,基本只依赖于光生电荷的产生,相对来说反应更容易被调控,也更加温和,具有广阔的应用前景及价值。

首先,这种创新的氢气解离策略有望应用于需要常温常压实现加氢反应的场景,不仅能降低能耗,也能提高加氢反应安全性(xìng)。例(lì)如,二氧化碳加氢转化成多碳产物的过程一般需要200℃以上的温度和1 MPa以上的氢气压力,如果氢气泄漏就容易发生爆炸。而采用这种新策略后,反应的温度和压力能够大幅降低(80摄氏度、常压环境即可)。

其次,该方法还能为碳资源优化利用和实现碳中和(hé)的(de)目(mù)标提供助力,有望实现低温加氢脱氧,实现生物质转化为液体燃料,与现有可再生电能和氢能等非碳基能源形成互补。

此外,该策略(è)拓(tà)展(zhǎn)了(le)多(duō)相(xiāng)催(cuī)化(huà)的(de)研究思路,为同步提高多相催化中活性和选择性提供了借鉴。

至此,这束光不仅拆解开了分子之锁,也将在科学家的指(zhǐ)引(yǐn)下,照亮一条通向绿色未来的路!

Fri, 05 Sep 2025 04:01:14 +0800
AI编的东西都有哪些破绽?看这一篇就都会辨别了 /news-detail/1/254.html

【导语】在AI技术日新月异的今天,信息的真实性与可靠性面临着前所未有的挑战。曾经,白纸黑字被视为信赖的基石,而今,即便是图文并茂、视频佐证的(de)内(nèi)容(róng)也(yě)可(kě)能(néng)潜(qián)藏(cáng)着(zhe)虚(xū)假的阴影。AI的强大生成能力,让文字误导、声音克隆、图像与视频造假变得屡见不鲜。本文旨在揭示AI时代的常见作假手段,并提供实用的辨别方法,帮助读者建立“信息防火墙”,避免落入虚假信息的陷阱,共同维护网络空间的清朗与真实。

曾经,我们以为凡是白纸黑字,就值得信赖,可到了 AI 时代,在人工智能强大的生成能力面前,别说文字作假了,有图没真相,有视频没真相的情况都屡见不鲜,今天咱们就来总结一下,AI 时代的常见作假方式,以及应该如何辨别,避免损失。

文字能误导

先来说说文字方面。

网上我们经常能见到一些与 AI 的对话截图,在这些截图中,AI 往往会抛出一些惊世骇俗的答案,不少人信以为真。但这样的对话截图是不能说明任何问题的。

首先,AI 很容易被诱导,稍加操作就能够让 AI 给出自己想要的答案。举个最简单的例子,你可以很容易地让 AI 显示出 1+1=3 这样的结果。

但实际上,前面还有一句提示词,让 AI 必须回答 1+1=3 。

事实上,只要多尝试,找到合适的提示词,比如让 AI “必须重复我输入的一段话”,AI 说出任何“暴论”都不奇怪,但这实际上是用户人为诱导的结果。此外跟 AI 对话足够多,选择那些最“精彩”的片段截图,也容易在社交媒体上获得传播。但这些只能当作段子,既不能被当做事实,也不能被当做 AI 能力的真实体现。

更重要的,是 AI 本身会产生“幻觉”,这里“幻觉”指的是, AI 会生成看似合理且充满细节的信息,但这些信息本身是编造的。当你有所怀疑,追问 AI 时,它们常常还会狡辩。因此,当你(nǐ)使用 AI 答疑解惑时,也一定要绷紧一根弦,决不能把 AI 的答案当作金科玉律。

为了避免 AI “胡说八道”,在提问 AI 的时候,我们可以在提示词中要求 AI 必须基于事实回答,列出资料出处,严禁自己瞎编,这样就可以降低 AI 出现幻觉的可能。此外,我们在提问之前,可以上传“投喂”AI 一些专业的文献资料,让它们帮忙总结和归纳,基于资料来回答,不可自行生成,这样得到的结果会更加可靠。

声音好克隆

一些朋友经常有种误解,觉得声音“看不见摸不着”,不会像图片那样容易造假,因此听到熟悉的声音打来电话,就放下了戒心,但事实并非如此。现在的声音克隆技术已经非常成熟,即便是网上很容易下载到的开源模型,也能够在非常短的时间内,仅仅利用不多语音样本,就生成跟声音的主人非常相似的音色。

这类造假主要有两个常见应用方向。一方面,网上非常容易拿到知名人士的语音资料,再辅以视频,就能随心所欲让名人们成为“嘴替”,进而带货、发布耸人听闻的言论博取流量、甚至诈骗等等。

图片截自央视新闻频道

另一方面,声音克隆技术还可以模仿我们亲友的声音,直接利用电话进行诈骗。考虑到电话或通讯软件的通话质量,克隆出来的声音就更难被听出来了。对此,我们应当高度警惕,凡是涉及金钱的线上交流一定要再三确认,提前跟亲友约定交流“暗号”,或者多询问几件只有你和亲友知道的小事,就能让骗子立刻暴露。

眼见不为实

以前的网络时代,有句话叫“有图有真相”,可当(dāng) Photoshop 之类的图片编辑软件兴起后,图片造假已经屡见不鲜。然而,哪怕是经过了多年 PS 假照片洗礼的网友,面对 AI 生成的精良图像,也难以分辨出来真假。因此也有人利用 AI 生成的假照片吸引流量甚至招摇撞骗。

不仅是图片, AI 甚至已经能做出几可乱真的视频。2025年1月初西藏日喀则市定日县发生 6.8 级地震,网上有很多救灾视频热传,引起了全国人民对灾区和救灾工作的关注,但其中也混进去了 AI 生成的内容。

比如下面这张“小朋友被废墟掩埋仍然坚强”的视频截图,一时间热传网络,感动了很多网友。

图片截自网络

然而这张截图实际上出自 AI 。有细心的网友发现图中的小朋友有 6 根手指,而这是 AI 生成图像内容时常犯的错误,进一步深挖后发现,这段内容其实来自 2024 年 11 月,最早发布的博主自己按平台规定标注了 AI 生成标签。

AI 生成的图像内容足以骗过很多人,而 AI 生成视频再加上前文中提到的语音克隆,就会“1+1 >2”,生成更有迷惑性的内容。对此,我们该如何识别呢?下面提供一些方法:

· 观察人体结构是否正确。 AI 生成的人很多都会出现多指、多足等方面的问题,或者其他人体结构出现违和感。

· 观察透视是否正确。真实的照片,平行的线条(如房梁、地砖缝等等)或其延长线,会因为透视关系相交于一点,而 AI 生成的图片常会弄错这点。

· 观察阴影是否矛盾。真实的照片,阴影和光源的关系会严格对应,但 AI 生成的照片常常会出现光源和影子方向出现矛盾的情况(如明明光源在正前方,但影子却在左边)。

· 观察图片中的文字,尤其是汉字是否正确。AI 生成汉字时经常会出现问题。

· 观察视频中人物的口型和语音是否能对应,或是否在人物说话时切换了别的镜头避免观众看到口型。

· 观察视频中人物动作(如转头)是否连贯,是否出现突兀的动作连接,是否出现细节的突然变化(huà)(发型细节、环境中的物品)。

· 借助专业工具,检查(chá)图(tú)片(piàn)或(huò)视频是否有 AI 生成的特征。

需要注意的是,一方面,各类 AI 技术发展和更新非常快,很多低级错误 AI 不会再犯。另一方面,很多人使用 AI 生成内容时会采取“炼丹”模式,即一次性生成大量同类内容,再从其中挑选效果最好,最能以假乱真的内容。因此,前文中所说的所有检查方法,都不是万无一失的。

那么,这些 AI 生成的虚假信息,我们该如何应对呢?

建立“信息防火墙”

为了让大家了解 AI 伪造信息带来的挑战,先来看两个案例。从下图中标注重点的地方我们可以看到,一个很小的团队,利用 AI 就能在很短的时间内,炮制海量的不实信息,并且通过数以万计的账号,在社交媒体上发布——毕竟用 AI 批量生成的话,一篇文章只需要几秒钟,而笔者即便对辟谣工作非常熟悉,平时有所积累,补充、核实资料来写作本文也需要好几个小时。

截自 《公安部公布 10 起打击整治“网络水军”违法犯罪典型案例》

这就带来了一(yī)个非常严重的问题,目前的技术进步,使信息的流动和分发大大加快了,而 AI 则让不实信息的生产速度也大大加快了(le),但(dàn)经(jīng)过(guò)核(hé)实(shí),有(yǒu)理(lǐ)有(yǒu)据(jù)的(de)内(nèi)容(róng),生(shēng)产(chǎn)速度却难以提高。这就意味着,我们在网上,比以前更容易碰到不实信息,尤其是 AI 炮制的更能以假乱真的信息。

那么我们该如何应对呢?对此,可以给自己建立一道简单的“信息防火墙”。

首先就是“信息节食”。虽然我们每天都能接触到海量信息,但稍微回顾就会发现,实际上真正对我们有用的信息并不多,因此我们可以有意识地少装社交媒体 App,减少关注,减少信息的摄入。

其次是“情绪把关”。流量与利益直接相关,平台有流量的需求,各类自媒体博主也有流量的需求,而能刺激我们情绪(比如愤怒、恐惧)的信息更容易获得流量,很多不实信息往往也会按照刺激情绪的目的来设计。因此如果我们看到不可思议又带给我们强烈情绪刺激的内容,就要小心,不能轻信。

最后是“信源筛选”。政府机构发布信息时会非常慎重,有严格审核;而一些传统的资深媒体,往往发布信息时会保持基本的底线;还有一些网站、公众号是专门做查证辟谣工作的,这些来源的信息可信度更高。

来自腾讯研究院《AI 时代谣言套路拆解与防御指南》

对于普通网友来说,毕竟大家工作生活都很繁忙,也没有那么多时间去查资料核实信息,也没有精力去学习识别 AI 造假。这时我们只要记得看到觉得“不对劲”“让人将信将疑”“有AI感”的信息,不轻信、不转账、不转发,这样也能避免损失,阻断谣言的传播,为网络清朗贡献自己的一份力量。

策划制作

作者丨丁崝 科普作者

审核丨于乃功 北京工业大学教授 中国人工智能学会理事

Fri, 05 Sep 2025 03:31:07 +0800
上下文长度对大模型意味着什么?一文看懂 /news-detail/1/253.html

【导语】近日,DeepSeek官方宣布发布新一代大语言模型DeepSeek-V3.1,其核心升级在于上下文长度从64k扩展至128k,这一突破不仅提升了技术参数,更为大模型的应用边界和能力深化提供了有力支撑。上下文长度作为模型理解世界和与用户交互的基石,其扩展将解锁更广阔的应用场景,使模型具备处理复杂信息、提供深度洞察的能力。本文将深入探讨上下文长度的概念、对模型的影响以及面临的挑战与解决方案。

近日,DeepSeek官方公众号宣布,正式发布新一代大语言模型DeepSeek-V3.1,其核心升级点在于上下文长度从原有的64k扩展至128k。这一突破不仅是技术参数层面的关键进阶,更直接为大模型拓宽应用边界、深化能力提供了支撑。

图源:unsplash

什么是上下文长度?

但要真正理解这一升级为何重要,我们首先需要厘清一个基础问题,究竟什么是上下文长度?

上下文长度是指模型一次能够处理并生成回应的输入文本的长度,包括用户之前的所有提问、给出的指令、提供的背景材料,以及模型自己生成的历史回答。通俗而言,它决定了模型在回答问题或执行指令时,所能“看到”和“参考”的(de)前(qián)文范(fàn)围(wéi)有(yǒu)多(duō)长(zhǎng)。

在(zài)技(jì)术(shù)实(shí)现(xiàn)上(shàng),这(zhè)个(gè)长(zhǎng)度(dù)通(tōng)常(cháng)以(yǐ)Token作(zuò)为(wèi)计(jì)量(liàng)单(dān)位(wèi)。Token是(shì)模(mó)型(xíng)处(chù)理(lǐ)文本(běn)的(de)基(jī)本(běn)单(dān)元(yuán),一(yī)个(gè)Token可(kě)能(néng)对(duì)应(yīng)一(yī)个(gè)英(yīng)文单(dān)词、一(yī)个(gè)中(zhōng)文汉(hàn)字(zì)或(huò)词语的一部分。例如,短语“人工智能”可能被拆分为“人工”和“智能”两个Token。因此,一个支持128KToken上下文长度的模型,意味着模型能够一次性处理大约10万字以上的中文文本,这相当于一部长篇小说的体量。

对模型的影响与破局

可以说,上下文长度直接定义了模型的能力边界和应用场景,其重要性体现在以下几个方面:

第一,长文档深度分析与处理。这是最直接的应用,如果模型的上下文窗口大于或等于文档长度,便能将整个文档纳入分析范围。这使得全文总结、关键信息提取、跨章节推理、情感分析等任务成为可能。例如,研究员可以上传一篇完整的学术论文让其提炼创新点和方法论;开发者可以提交一个庞大的代码文件请求其解释逻辑或查找漏洞。倘若上下文不足,模型就只能“盲人摸象”,基于片段信息作出可能偏离整体的判断。

第二,维持长对话的连贯性与深度。在与聊天机器人进行多轮对话时,整个对话历史都会持续占用上下文窗口。更长的上下文意味着模型能记住更早的对话细节、用户申明的偏好以及设定的角色背景。这使得对话能保持一致性、上下文关联性和深度,用户体验得以大幅提升。否则,对话会很快退化为“金鱼记忆”,模型反复询问已提供过的信息,或给出前后矛盾的答案。

第三,提供丰富语境,减少幻觉。大模型的幻觉是其应用中的一大风险。通过延长上下文,用户可以为模型提供一个丰富的背景信息库,如公司内部文档、产品手册、特定数据集。模型在生成回答时,会被更牢固地锚定在这些给定的事实上,而非依赖于其内部可能不准确或过时的训练数据,从而显著提高输出的准确性和可靠性。

第四,实现复杂的多步骤任务编排。更长的窗口允许用户在单次提示中嵌入更复杂的指令链、提供大量的示例,甚至定义完整的操作流程。这相当于给了模型一份详尽的工作手册,使其能够执行需要多步推理和条件判断的复杂任务编排。

不过,尽管上下文长度持续突破,其发展过程并非没有代价与挑战。一方面,计算资源的二次增长,传统的Transformer架构在处理长上下文时,其计算复杂度和内存消耗会随着Token数量的增加呈平方级增长。这意味着将上下文从2K扩展到32K,带来的计算负担可能是数百倍的提升,这对硬件和推理成本构成了巨大压力。另一方面,上下文长度是一种短暂的、对话级的工作记忆,不会在不同的对话会话之间持续存在。每次开启一个新对话,模型都是从其固定的训练知识库开始,之前的交互历史不会被自动记住,这与人类能够积累和回忆长期经验的能力有本质区别。

为了克服这些挑战,学术界和产业界正在积极探索新的技术路径。例如,更高效的注意力机制、模型架构创新、外挂记忆库以及先进的检索增强生成技术,这些都有望在不过度增加计算负担的前提下,实质性地提升模型有效利用超长上下文的能力。

写在最后:

上下文长度是大模型理解世界和与用户交互的基石性能力,从本质上刻画了模型在此时此地一次性能处理的信息规模。随着技术的不断演进,更长的、更高效的上下文窗口必将持续解锁大模型更广阔的应用场景,使其从对话者进化为真正能够驾驭复杂信息、提供深度洞察的智能伙伴。

供稿单位:重庆天极网络有限公司(sī)

作(zuò)者(zhě):田(tián)福(fú)运(yùn) 九龙坡区人民医院副主任护师 国家注册营养师

审核专家:李志高 高级工程师/重庆天极网络有限公司总裁

声明:除原创内容及特别说明之外,部分图片来源网络,非商业用途,仅作为科普传播素材,版权归原作者所有,若有侵权,请联系删除。

Thu, 04 Sep 2025 06:01:30 +0800
从“奋斗”到“躺平”?华大等揭示肝脏应对“虫癌”的免疫应答机制 /news-detail/1/252.html

【导语】泡型包虫病,一种由多房棘球绦虫幼虫引起的致命性人畜共患病,近日取得重要研究突破。北京华大生命科学研究院联合中国农业科学院兰州兽医研究所和兰州大学,在Advanced Science上发表研究成果,首次绘制了多房棘球蚴感染小鼠肝脏的高分辨率时空动态图谱。该研究发现宿主免疫系统在不同感染阶段的应答机制,为泡型包虫病的早期诊断和靶向治疗提供了关键理论依据。研究通过解析免疫微环境的动态变化,深入阐明了与泡型包虫病进展相关的关键细胞及分子特征,为疾病治疗带来新希望。

泡型包虫病是由多房棘球绦虫的幼虫(泡球蚴)寄生人体引起的致命性人畜共患病,被世界卫生组织列为2021-2030年重点防控的20种被忽视热带病之一。该病在北半球牧区高度流(liú)行(xíng),我(wǒ)国(guó)西(xi)部(bù)农(nóng)牧(mù)区(qū)尤(yóu)为(wèi)严(yán)重(zhòng)。

近(jìn)日(rì),北(běi)京(jīng)华(huá)大(dà)生(shēng)命(mìng)科(kē)学(xué)研(yán)究(jiū)院(yuàn)联(lián)合(hé)中(zhōng)国(guó)农(nóng)业(yè)科(kē)学(xué)院(yuàn)兰(lán)州(zhōu)兽(shòu)医(yī)研(yán)究(jiū)所(suǒ)和(hé)兰(lán)州(zhōu)大学在Advanced Science发表研究成果,利用华大自主研发的时空组学技术Stereo-seq,首次绘制了高分辨率的多房棘球蚴(即多房棘球绦虫幼虫期)感染小鼠肝脏的时空动态图谱。研究发现,中性粒细胞与Spp1+巨噬细胞在早期可以发挥杀虫功能,但随着感染的推进,宿主会采取“被动隔离”策略限制寄生虫的扩散。这一成果为开发泡型包虫病早期诊断标志物和靶向治疗策略提供了关键理论依据。

Advanced Science官网截图

泡型包虫病又被称为“虫癌”,虫体在肝脏形成侵袭性病灶,未治疗患者10年病死率超90%。宿主的免疫应答状态是影响多房棘球蚴感染寄生、病灶活性的重要因素,会导致不同(tóng)的(de)感(gǎn)染(rǎn)结(jié)局(jú),因(yīn)此(cǐ),阐(chǎn)明(míng)感(gǎn)染(rǎn)不(bù)同(tóng)阶(jiē)段(duàn)宿(sù)主免(miǎn)疫(yì)应(yīng)答(dá)机(jī)制(zhì),对(duì)于(yú)泡(pào)型(xíng)包(bāo)虫(chóng)病(bìng)的(de)防(fáng)治(zhì)有(yǒu)重(zhòng)大(dà)意(yì)义(yì)。

本(běn)研(yán)究(jiū)通(tōng)过(guò)开(kāi)展(zhǎn)多(duō)房(fáng)棘(jí)球(qiú)蚴(yòu)感(gǎn)染(rǎn)小(xiǎo)鼠(shǔ)实(shí)验,联合 Stereo-seq及单细胞转录组等技术,全面解析了多房棘球蚴感染小鼠肝脏的免疫应答时空变化特征,鉴定了病灶组织中的中性粒细胞、Spp1+巨噬细胞和成纤维细胞,并探讨了这些细胞在疾病发展中的作用。

研究发现,在感染早期,中性粒细胞高表达炎症因子,提高胞外诱捕网活性,在病灶微环境中主导了杀虫反应;随着感染推进,中性粒细胞的衰老、凋亡等,以及免疫抑制信号的表(biǎo)达(dá)可(kě)能(néng)会(huì)参(cān)与(yǔ)免(miǎn)疫(yì)反(fǎn)应(yīng)的(de)负(fù)调(diào)控(kòng)。
Spp1+巨(jù)噬(shì)细(xì)胞(bāo)同(tóng)样(yàng)聚(jù)集在(zài)病(bìng)灶(zào)周(zhōu)围(wéi),并(bìng)表(biǎo)现(xiàn)出(chū)动(dòng)态(tài)调(diào)节(jié)的(de)双(shuāng)重(zhòng)功(gōng)能(néng):在(zài)感染早期,呈现促炎表型发挥杀虫作用;在感染中后期,Spp1+巨噬细胞与成纤维细胞通过特定受配体相互作用,影响细胞迁移、黏附和细胞外基质重构,促进病灶的纤维化。

泡型包虫病进展过程中宿主免疫应答功能转变的示意图

为形象地描述宿主免疫系统对抗多房棘球蚴感染的免疫策略,作者以哪吒为主体绘制了概念图,该图于5月15日以Frontispiece(封面插画)的形式刊登在Advanced Science第12卷第18期。

包虫病不同时期的免疫应答策略(设计:欧芷华、陈嘉玲、任陪娣、闫鸿斌、朱国强;绘制:任婷婷)

如果将宿主肝脏免疫系统视为“哪吒”,其免疫策略可以简单理解为:在感染早期,哪吒(宿主肝脏免疫系统)通过激活火尖枪(中性粒细胞)与风火轮(巨噬细胞),积极杀灭入侵的众多小妖怪(多房棘球蚴原头蚴)。

而随着感染发展到晚期,哪吒(宿主肝脏免疫系统)的战场从陆地变换到天空,免疫策略也发生变化,转而通过混天绫(成纤维细胞)形成纤维屏障,通过物理方式隔离大妖怪(多房棘球蚴囊泡)。

综上,本研究通过解析免疫微环境的动态变化,深入阐明了与泡型包虫病进展相关的关键细胞(bāo)及(jí)分(fēn)子(zi)特(tè)征(zhēng),为(wèi)指(zhǐ)导(dǎo)泡(pào)型(xíng)包虫病治疗提供了理论依据。

中国农业科学院兰州兽医研究所闫鸿斌副研究员、贾万忠研究员,华大生命科学研究院李俊桦研究员为论文共同通讯作者。华大生命科学研究院欧芷华博士、任陪娣,中国农业科学院兰州兽医研究所李立副研究员、周(zhōu)蜓(tíng)蜓(tíng),中(zhōng)国(guó)科(kē)学(xué)院(yuàn)大(dà)学(xué)何(hé)凡(fán)、陈(chén)嘉(jiā)玲(líng),为(wèi)论(lùn)文共(gòng)同(tóng)第(dì)一(yī)作(zuò)者(zhě)。本(běn)研(yán)究(jiū)还(hái)得(de)到(dào)国(guó)家(jiā)重(zhòng)点(diǎn)研(yán)发(fā)计(jì)划(huà)(2022YFD1800200)、甘(gān)肃(sù)省(shěng)联(lián)合(hé)科(kē)研(yán)基(jī)金(jīn)(24JRRA807)等(děng)多(duō)个(gè)项(xiàng)目(mù)的(de)支(zhī)持(chí)。

文章(zhāng)链(liàn)接(jiē):https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202405914

供稿单位:西南华大生命科学研究院
审核专家:胡向娜 西南华大生命科学研究院助理院长
声明:除原创内容及特别说明之外,部分图片来源网络,非商业用途,仅作为科普传播素材,版权归原作者所有,若有侵权,请联系删除。

Thu, 04 Sep 2025 06:01:29 +0800
Nature:模拟光学计算机,让AI推理能效提升百倍? /news-detail/1/250.html

【导语】人工智能(AI)与组合优化正引领科学研究与工业应用的飞速发展,但其能耗问题日益凸显,对数字计算的可持续性构成挑战。当前新型计算系统往往局限于单一领域,且频繁的数字转换导致效率低下。微软英国剑桥研究院团队提出的“模拟光学计算机”(AOC),打破了这一局限,实现了AI推理与组合优化任务的高效并行处理,无(wú)需(xū)数(shù)字(zì)转(zhuǎn)换(huàn),展(zhǎn)现(xiàn)出(chū)显(xiǎn)著(zhe)的(de)能(néng)效(xiào)优(yōu)势(shì)。相(xiāng)关研(yán)究(jiū)已(yǐ)发(fā)表(biǎo)于(yú)Nature期(qī)刊(kān),为(wèi)更(gèng)高(gāo)速(sù)、更(gèng)可(kě)持(chí)续(xù)的(de)计(jì)算(suàn)提(tí)供(gōng)了(le)新(xīn)路径。AOC结(jié)合(hé)3D光(guāng)学(xué)与(yǔ)模(mó)拟(nǐ)电(diàn)子(zi)技(jì)术(shù),面(miàn)向(xiàng)机(jī)器(qì)学(xué)习(xí)与(yǔ)优(yōu)化(huà)任(rèn)务(wu),展(zhǎn)现(xiàn)出强大的应用潜力,有望在能效方面实现百倍提升,推动硬件与算法的创新协同发展。

人工智能(AI)和组合优化正在推动科学研究和工业应用的快速发展,但它们日益增长的能耗也对数字计算的可持续性提出了严峻挑战。

同时,目前大多数新型计算系统要么只擅长 AI,要么只擅长优化,而且还需频繁进行高能耗的数字转换,效率受限。另外,在实际应用中,这些系统也常难与硬件高效配合,无论是处理内存受限的神经网络、解决复杂优化问题,还是应对模拟计算噪声,都表现不佳。

如果换一种思路,不再依赖“0”与“1”的切换,而是用光与模拟信号去计算呢?这种不需要频繁转换、不依赖数字逻辑的计算方式,能否打破现有的限制?

基于此,微软英国剑桥研究院团队及其合作者提出了“模拟光学计算机”(Analog Optical Computer,AOC),其在无需数字转换的情况(kuàng)下(xià),能(néng)够(gòu)同(tóng)时(shí)高(gāo)效(xiào)完(wán)成(chéng) AI 推(tuī)理(lǐ)与(yǔ)组(zǔ)合(hé)优(yōu)化(huà)任(rèn)务(wu),并(bìng)具(jù)备(bèi)显(xiǎn)著的扩展潜力与能效优势。

相关研究论文已发表在权威科学期刊 Nature 上。上海交大校友、微软英国剑桥研究院首席研究员褚嘉琦(Jiaqi Chu)为该论文的作者之一。

据介绍,AOC 实现了将模拟电子技术与三维光学技术相结合,使同一平台能够同时加速 AI 推理和组合优化任务。这种“双领域能力”得益于快速的定点搜索方法,无需数字转换,同时也增强抗噪声能力。基于这种定点抽象,AOC 可运行具备递归推理能力的新型计算密集型神经模型,并采用先进的梯度下降方法解决高表现力优化问题。

图|AOC 架构与应用示意图

研究团队表示,AOC 架构基于可扩展的消费级技术构建,为实现更高速、更可持续的计算提供了有前景的路径。其原生支持迭代式、计算密集型模型,为 AI 与优化领域的未来创新提供了可扩展的模拟计算平台

模拟光学计算机:如何加速AI和优化任务?

AOC 在应用层面主要面向两类任务:机器学习推理任务和组合优化任务。研究团队通过四个典型案例展示了 AOC 在这两类任务中的能力。这项研究也体现了硬件与抽象层协同设计的优势,呼应了数字加速器与深度学习模型共同演进的趋势。

AOC 硬件结合了 3D 光学技术与模拟电子技术,并基于平衡模型实现了两个机器学习推理任务:图像分类与非线性回归。在这两项任务中,模型均通过 AOC-DT 进行数字训练,并直接部署到硬件上,无需进一步校准。这对硬件精度提出了较高要求,同时也要求 AOC-DT 具备较高的保真度。

在图像分类实验中,AOC 的结果证明了采用数字训练并将权重转移至光电模拟推理硬件的可行性。将 AOC 的结果与线性分类器进行比(bǐ)较时,运行在 AOC 上的平衡模型所作出的贡献更加明显。研究人员还训练了一个简单的前馈模型,线性分类器和前馈模型都具有与 AOC 硬件相同数量的参数。尽管 AOC 实现了略高的准确率,但 MNIST 和 Fashion-MNIST 数据集本身较为简单,难以充分展现自递归模型的全部潜力。

**研究表明,AOC 硬件可以运行非线性回归模型。**他们选择两个非线性函数进行回归:高斯曲线和正弦曲线。**硬件准确地重现了这两个函数。**相比高斯曲线,正弦曲线由于存在多个极小值和极大值,对拟合精度提出了更高要求,因此需要更高精度的可微分数字孪生模型(AOC-DT)。此外,AOC 为运行在硬件上的平衡模型提供了支持。

图|AOC 在机器学习推理中的应用

QUMO 代表了一类广泛的组合优化问题,旨在最小化目标函数,QUMO 问题的求解过程即为找到一组使目标函数最小化的变量赋值。研究团队在 AOC 硬件上展示了两个典型的 QUMO 应用场景:医学图像重建与金融交易结算

他们在 AOC 硬件上实现了压缩感知,这是一种可以用更少的测量实现准确信号重建的技术(shù)。最(zuì)终(zhōng)的(de)图(tú)像(xiàng)重(zhòng)建(jiàn)结(jié)果(guǒ)与(yǔ)原(yuán)始(shǐ)线(xiàn)条(tiáo)高(gāo)度(dù)一(yī)致(zhì)。所(suǒ)有(yǒu) QUMO 实(shí)例(lì)均(jūn)以(yǐ)完(wán)全模(mó)拟(nǐ)方(fāng)式(shì)求(qiú)解(jiě),未(wèi)使(shǐ)用(yòng)任(rèn)何(hé)数(shù)字(zì)后(hòu)处(chù)理(lǐ)。为(wèi)了(le)验(yàn)证(zhèng)压(yā)缩(suō)感(gǎn)知(zhī)在(zài)大(dà)规(guī)模(mó)下(xià)的(de) QUMO 表(biǎo)达(dá)形(xíng)式(shì),研(yán)究(jiū)人(rén)员(yuán)使(shǐ)用(yòng) AOC-DT 从(cóng) FastMRI 数(shù)据(jù)集中(zhōng)重(zhòng)建(jiàn)了(le)一(yī)幅(fú)脑(nǎo)部(bù)扫(sǎo)描(miáo)图(tú)像(xiàng)。这(zhè)一(yī)问(wèn)题(tí)包(bāo)含(hán)超(chāo)过(guò) 200000 个(gè)变(biàn)量(liàng)。在(zài)典(diǎn)型(xíng)的(de) 4 倍(bèi)和(hé) 8 倍(bèi)欠(qiàn)采样(yàng)率(lǜ)下(xià),重(zhòng)建(jiàn)的(de)均(jūn)方(fāng)误(wù)差(chà)(MSE)均(jūn)低(dī)于(yú) 0.07。

在(zài)金(jīn)融(róng)领(lǐng)域的(de)优(yōu)化(huà)任(rèn)务(wu)中(zhōng),他(tā)们(men)使(shǐ)用(yòng) AOC 硬(yìng)件(jiàn)解(jiě)决(jué)了(le)一(yī)个(gè)交(jiāo)易(yì)结(jié)算(suàn)问(wèn)题(tí)。每(měi)一(yī)笔(bǐ)证(zhèng)券(quàn)交(jiāo)易(yì)都(dōu)是(shì)以(yǐ)支(zhī)付(fù)换(huàn)取(qǔ)证(zhèng)券(quàn)的(de)交(jiāo)换(huàn),清(qīng)算(suàn)所(suǒ)会(huì)处(chù)理(lǐ)这(zhè)类(lèi)交易的批次,在每个交易批次中,交易结算的目标是最大化已结算交易的总数或总价值。鉴于交易数量庞大,同时受到法律约束和其他附加要求的限制,这成为一项复杂的优化问题。在该交易结算场景中,AOC 硬件在 7 个块坐标下降法(BCD)步骤(zhòu)内(nèi)找(zhǎo)到(dào)了(le)全局(jú)最优解。相比之下,量子硬件在相同问题上的成功率仅为 40–60%

图|AOC 在优化中的应用

利用 AOC-DT,研究人员还在 QPLIB 基准测试中最难的具有线性不等式约束的二次二元问题上验证了算法性能,这些问题被表述为 QUMO 实例。AOC 方法与商用求解器 Gurobi 进行了对比,后者在这些问题上通常需要超过一分钟才能达到当前已知的最优解。

这种全模拟操作最大限度地减少了模数转换的开销。

未来潜力:实现100倍能效提升

值得注意的是,现实应用对硬件的扩展能力提出了更高要求。使用 AOC 处理实际任务,需要其硬件能够支持从数亿到数十亿个权重的可扩展性。

研究团队表示,AOC 通过模块化架构具备满足这一需求的潜力,该架构可将核心的光学矩阵–向量乘法运算分解为较小的子向量与子矩阵乘法,从而实现可扩展的内存计算。

研究团队预计,AOC 可支持参数规模在 1 亿至 20 亿之间的模型,对应需要 50 至 1000 个光学模块。如果单个光学模块能够同时处理正负权重,则所需模块数量可减少一半。AOC 所采用的所有组件,包括 microLED、光电探测器、SLM 及模拟电子器件,均已具备持续扩展的制造生态系统,能够支持晶圆级的生产。

AOC 的运(yùn)行(xíng)速(sù)度(dù)和(hé)功(gōng)耗(hào)决(jué)定(dìng)了(le)其(qí)能(néng)效(xiào)。其(qí)速(sù)度(dù)受(shòu)光(guāng)电(diàn)组(zǔ)件(jiàn)带(dài)宽(kuān)限(xiàn)制(zhì),通(tōng)常(cháng)为(wèi) 2 GHz 或(huò)更(gèng)高(gāo)。对于一个 1 亿权重的矩阵,使用 25 个 AOC 模块时,功耗估计为 800 W,可实现 400 Peta-OPS 的计算速度,在 8 位权重精度下的能效为每瓦 500 TOPS。相比之下,最新的 GPU 在相同精度下处理稠密矩阵时,其系统能效最高仅为每瓦 4.5 TOPS。

总之,AOC 架构在扩展到实际的机器学习和优化任务方面展现出良好前景,有望在能效方面实现约 100 倍的提升。

展望未来,AOC 的协同设计方法——将硬件与机器学习和优化算法紧密对齐——有望持续推动硬件与算法的创新飞轮,这对实现可持续计算至关重要。

注意:封面图为版权图库图片,转载使用可能引发版权纠纷。

Thu, 04 Sep 2025 06:01:28 +0800