
Figure机(jī)器(qì)人(rén)(图(tú)源(yuán):Figure)
在(zài)科(kē)幻(huàn)电(diàn)影(yǐng)的(de)预(yù)言(yán)中(zhōng),人(rén)类(lèi)与(yǔ)机(jī)器(qì)人(rén)的(de)共(gòng)生(shēng)总(zǒng)是(shì)始(shǐ)于(yú)一(yī)场(chǎng)静(jìng)默(mò)的(de)革(gé)命(mìng)——那(nà)些(xiē)曾(céng)经(jīng)笨(bèn)拙(zhuō)的(de)机(jī)械(xiè)臂(bì)开(kāi)始(shǐ)像(xiàng)人(rén)类(lèi)一(yī)样(yàng)思(sī)考(kǎo),冰(bīng)冷(lěng)的(de)金(jīn)属(shǔ)关节学会与生活场景共舞。而2025年2月,这一幕似乎悄然在现实中上演。
美国初创公司Figure推出的新一代人形机器人,搭载了名为Helix的视觉-语言-动作(VLA)模型,极大增强了机器人的感知、控制、理解能力,让两台机器人无需预演便能默契传递物品,以近乎科幻的智能协作能力,将家庭场景中的机械管家从幻想拉入现实。
人形机器人:科技的集大成者

电影《大都会(Metropolis)》剧照
机器人(Robot)的概念,最早出(chū)现(xiàn)在(zài)捷克著名作家卡雷尔·恰佩克(Karel Čapek)于1920年创作的戏剧《罗素姆万能机器人》中。1927年电影《大都会》中的人造人玛丽亚,便以机械(xiè)之(zhī)躯(qū)承(chéng)载(zài)人(rén)性(xìng),成(chéng)为(wèi)赛(sài)博(bó)朋(péng)克(kè)美(měi)学(xué)的(de)早(zǎo)期(qī)雏(chú)形(xíng)。
人(rén)形(xíng)机(jī)器(qì)人(rén)(Humanoid Robot)是(shì)一(yī)种(zhǒng)利(lì)用(yòng)人(rén)工(gōng)智(zhì)能(néng)和(hé)机(jī)器(qì)人(rén)技(jì)术(shù)制(zhì)造(zào)的(de)具(jù)有(yǒu)类(lèi)似(shì)人(rén)类(lèi)外(wài)观(guān)和(hé)行(xíng)为(wèi)的(de)机(jī)器(qì)人(rén),融(róng)合(hé)了(le)机(jī)械(xiè)工(gōng)程、电子技术、计算机科学、人工智能等多学科领域的前沿成果。

NASA 的 Valkyrie (R5) 机器人
图源:NASA
人形机器人的核心技术由四部分组成:
感知系统:指人形机器人需要具备感知环境的能力,通过传感器等设备来获取外部信息,如视觉感知、听觉感知、触觉感知等。
智能决策:指通过机器学习、深度学习、神经网络等人工智能技术,使机器人能够根据情景和任务要求自主决策和判断。
人机交互:指人形机器人能够更好地与人类进行交流和互动的功能,如语言识别、情感识别等。
运动控制:指通过使用各种传感器和算法来对机器人进行姿势控制、步态规划和平衡控制。
人形机器人的发展史,是一部人类试图用机械复刻自身的史诗。从蒸汽时代的齿轮幻想,到AI时代的神经网络革命,每个技术节点的突破都暗合着科幻作品的预言与启示。
01
早期发展阶段(1970s-2000):
早期的人形机器人模型外表简略,仅仅具有初级的人类躯干与肢体形状,能实行的功能也存在很大局限性,只能实现简单的行走和手部运动,尚未具备交互能力且智能化水平较低。

WABOT-1机(jī)器(qì)人(rén)(图(tú)源(yuán):早(zǎo)稻(dào)田(tián)大(dà)学(xué))
例(lì)如(rú)1973年(nián),日(rì)本(běn)早(zǎo)稻(dào)田(tián)大(dà)学(xué)研(yán)发(fā)出(chū)了(le)世(shì)界(jiè)上(shàng)第(dì)一(yī)款(kuǎn)人(rén)形(xíng)机(jī)器(qì)人(rén)WABOT-1,它(tā)只(zhǐ)能(néng)够(gòu)执(zhí)行(xíng)搬(bān)运(yùn)物(wù)体(tǐ)等(děng)任(rèn)务(wu),智(zhì)力(lì)水(shuǐ)平(píng)相(xiāng)当(dāng)于(yú)一(yī)岁(suì)半(bàn)的(de)婴(yīng)儿(ér);同(tóng)时(shí)期(qī)日(rì)本(běn)本(běn)田(tián)公(gōng)司(sī)研(yán)发(fā)的(de)自(zì)主行(xíng)走(zǒu)机(jī)器(qì)人(rén)P2和(hé)ASIMO也(yě)仅(jǐn)仅(jǐn)在(zài)行(xíng)走(zǒu)和(hé)平(píng)衡(héng)方(fāng)面(miàn)进(jìn)行(xíng)不(bù)断(duàn)优(yōu)化(huà)。
02
高(gāo)度(dù)集成(chéng)发(fā)展(zhǎn)阶(jiē)段(duàn)(2001-2011):
这(zhè)一(yī)阶(jiē)段(duàn)是(shì)人(rén)形(xíng)机(jī)器(qì)人(rén)初(chū)级(jí)感(gǎn)知(zhī)功(gōng)能(néng)的(de)起(qǐ)步(bù)阶(jiē)段(duàn)。这(zhè)一(yī)时(shí)期(qī)的(de)人(rén)形(xíng)机(jī)器(qì)人(rén)因(yīn)技(jì)术(shù)的(de)突(tū)破(pò)可(kě)以(yǐ)实(shí)现(xiàn)与(yǔ)外(wài)界(jiè)环(huán)境(jìng)有(yǒu)限(xiàn)的(de)互(hù)动(dòng),并(bìng)且(qiě)运(yùn)动(dòng)自(zì)由(yóu)度(dù)提(tí)升(shēng)。虽(suī)然(rán)应(yīng)用(yòng)场(chǎng)景(jǐng)较(jiào)为(wèi)简(jiǎn)单(dān),主要(yào)用(yòng)于(yú)展(zhǎn)览(lǎn)和(hé)娱(yú)乐(lè),但(dàn)在(zài)运(yùn)动(dòng)控(kòng)制(zhì)和(hé)人(rén)机(jī)交(jiāo)互(hù)方(fāng)面(miàn)确(què)实(shí)有(yǒu)很(hěn)大(dà)进(jìn)步(bù)。

本(běn)田(tián)机(jī)器(qì)人(rén)发(fā)展(zhǎn)历(lì)史(shǐ)与(yǔ)第(dì)三(sān)代(dài)ASIMO(图(tú)源(yuán):本(běn)田(tián)Honda)
例(lì)如(rú)2003年(nián)索(suǒ)尼(ní)QRIO机器人配备了语音识别功能和人脸识别功能,能识别10种面部表情;2011年,日本本田推出的第三代ASIMO,其利用传感器避开障碍物等自动判断并行动的能力,还能用五根手指(zhǐ)做(zuò)手(shǒu)语(yǔ),或(huò)将(jiāng)水(shuǐ)壶里的水倒入纸杯;ASIMO不仅能上下楼梯、端茶倒水,还曾在2014年指挥底特律交响乐团。
03
高动态运动与交互能力提升阶段
(2012-2020):
该阶段的研发重点放在强化人形机器人的运动能力或交互能力上。强化学习技术让人形机器人在与环境的交互中不断优化动作和行为,情感识别和语言交互技术也得到显著提升。

POPPY机器人发展历史(图源:Inria)
例如,2013年美国波士顿动力公司研发的双足人形机器人Atlas具有超高的运动能力,可以熟练地完成垂直(zhí)起(qǐ)跳(tiào)、倒(dào)立(lì)、跨(kuà)越(yuè)障(zhàng)碍(ài)、后(hòu)空(kōng)翻(fān),甚(shén)至(zhì)和(hé)Spot机(jī)器(qì)人(rén)一(yī)起(qǐ)舞(wǔ)蹈,具有手脚都参与的跑酷功能。
2016 年法国 Inria Flower 实验室开发的第一款开源人形机器人 POPPY 上市,它在教育、科研、文化艺术等多个领域都展现出出色的适应能力。在教育领域,POPPY 可以作为教学工具,帮助学生更直观地理解机器人原理和编程知识;在文化艺术创作中,艺术家们借助 POPPY 的独特表现力,创作出许多新颖的艺术作品。
04
高度智能化发展阶段(2020至今):
借助现代人工智能、计算机视觉系统等先进技术,人形机器人迈向智能化进阶之路。如今的人形机器人的感知与认知能力大大增强,大多具有高度仿生(shēng)的(de)躯(qū)干(gàn)构(gòu)型(xíng)和(hé)拟(nǐ)人(rén)的(de)运(yùn)动(dòng)控(kòng)制(zhì),在(zài)重(zhòng)量(liàng)、灵(líng)活(huó)性(xìng)等(děng)方(fāng)面(miàn)都(dōu)有(yǒu)显(xiǎn)著(zhe)进(jìn)步(bù),实(shí)用(yòng)性(xìng)大(dà)大(dà)增(zēng)强(qiáng)。

Ameca机(jī)器(qì)人(rén)发(fā)展(zhǎn)历(lì)史(shǐ)(图(tú)源(yuán):Engineered Arts)
例(lì)如(rú),英(yīng)国(guó) Engineered Arts 为(wèi) Ameca 接(jiē)入(rù) GPT-3/4 后(hòu),它如获新生。Ameca 配备了高级传感器,具备面部和多种语音识别功能,可以自然地与人类互动,不仅能敏锐检测人类情绪,还能通过丰富的表情和手势(shì)传(chuán)达(dá)信(xìn)息(xi)。
在(zài)一些高端科技体验场所,Ameca 作为接待员,以亲切的交流和互动为访客提供服务,给人留下深刻印象。特斯拉公司的Optimus Gen2人形机器人的移动功能、灵巧性、平衡性和实时处理方面的功能也因为AI大模型的介入得到了显著提升。

Unitree H1机器人(图源:宇树科技)
虽然国内人形机器(qì)人(rén)的(de)发(fā)展(zhǎn)起(qǐ)步(bù)较(jiào)晚(wǎn),上(shàng)个世纪90年代才开始研究。但近年来,国内人形机器人研发取得了显著进展,众多企业和科研机构积极投身其中,在(zài)技(jì)术(shù)创(chuàng)新(xīn)和(hé)产(chǎn)品(pǐn)应(yīng)用(yòng)方(fāng)面(miàn)不(bù)断(duàn)探(tàn)索(suǒ)。宇(yǔ)树(shù)科(kē)技(jì)便(biàn)是(shì)国(guó)内(nèi)人(rén)形(xíng)机(jī)器(qì)人(rén)领(lǐng)域的(de)佼(jiǎo)佼(jiǎo)者(zhě)。
在(zài)春(chūn)晚(wǎn)舞(wǔ)台(tái)上(shàng),宇(yǔ)树科技的16台人形机器人Unitree H1与舞蹈演员共同演绎《秧BOT》,以“赛博秧歌”惊艳全场。这些机器人拥有19个关节,手臂额外增加3个自由度,实现了手绢旋转(zhuǎn)、抛(pāo)掷回收等高难度动作。
这支名为《秧BOT》的舞蹈背后,是19个关节的精密协同,是每帧动作的AI映射,更是双足机器人在复杂动态平衡领域的突破性进展,充分展现了宇树科技在人形机器人研发方面的深厚实力。
人形机器人的发展前景令人充满期待。随着人工智能、材料科学、传感器技术等领域的持续创新突破,人形机器人将变得更加智能、灵活和强大。
在智能水平方面,它们将具备更强大的学习能力和推理能力,能够理解和处理更加复杂的任务和情境。通过与物联网、大数据等技术的深度融合,人形机器人可以实时获取和分析海量数据,实现更精准的决策和更高效的行动。
在运动能力上,新型材料和机械设计将使人形机器人的动作更加流畅、自然,能够适应各种复杂的地形和环境,完成更多高难度的动作。

Figure机器人(图源:Figure)
随着人形机器人技术的不断成熟,其应用场景也日益广泛。在工业领域,它们可以承担一些危险、重复或高精度的工作;在医疗领域,人形机器人可协助医生进行手术,凭借其高精度的操作能(néng)力(lì),降(jiàng)低(dī)手(shǒu)术(shù)风(fēng)险(xiǎn);在(zài)家(jiā)庭(tíng)服(fú)务(wu)方(fāng)面(miàn),人(rén)形(xíng)机(jī)器(qì)人(rén)可(kě)以(yǐ)担(dān)当(dāng)家(jiā)务(wu)助(zhù)手(shǒu),扫(sǎo)地(de)、擦(cā)窗(chuāng)、洗(xǐ)碗(wǎn)等(děng)家(jiā)务(wu)都(dōu)能(néng)轻(qīng)松(sōng)完(wán)成(chéng);在(zài)教(jiào)育(yù)领(lǐng)域,人(rén)形(xíng)机(jī)器(qì)人(rén)作(zuò)为(wèi)创(chuàng)新(xīn)的(de)教(jiào)学(xué)工(gōng)具(jù),能(néng)够(gòu)以(yǐ)生(shēng)动(dòng)有(yǒu)趣(qù)的(de)方(fāng)式(shì)传(chuán)授(shòu)知(zhī)识(shi)。
由(yóu)此(cǐ)可(kě)见(jiàn),人(rén)形(xíng)机(jī)器(qì)人(rén)未(wèi)来(lái)潜(qián)力(lì)巨(jù)大(dà),不(bù)过(guò)仍(réng)面(miàn)临(lín)多(duō)种(zhǒng)挑(tiāo)战(zhàn)。
1.高(gāo)算(suàn)力(lì):人(rén)形(xíng)机器人的姿态、速度和力度等方面,都需要高算力,现阶段的计算能力面临巨大挑战。
2.弱技术:现在基础技术能力仍然很弱,现有的软件算法等不足以支撑人形机器人的大规模应用,仍需技术大幅创新。
3.高成本:研发成本高昂,高额亏损、研发投入高,是人形机器人行业的常态。
4.不安全:数据安全能力和体系均存在不足(zú),面(miàn)临(lín)安(ān)全隐(yǐn)私(sī)等(děng)问(wèn)题(tí)。

游戏《底特律:化身为人(Detroit: Become Human)》主角康纳
从WABOT-1的简单动作到Ameca的自由互动,人形机器人正以“科技奇迹”之姿步入日常生活。它们既是《2001太空漫游》中HAL 9000的进化版,也是《底特律:变人》中康纳的原型。但技术的终极目标并非取代人类,而是如《星际穿越》中的TARS一般,成为探索未知的协作伙伴。
未来,当人形机器人真正融入(rù)社(shè)会(huì)时(shí),人(rén)类(lèi)或(huò)将(jiāng)重(zhòng)新(xīn)定(dìng)义(yì)“人(rén)性(xìng)”——不(bù)是(shì)以(yǐ)生(shēng)物(wù)学(xué)特(tè)征(zhēng)为(wèi)界(jiè)限(xiàn),而(ér)是(shì)以(yǐ)创(chuàng)造(zào)力(lì)、同(tóng)理心与伦理选择为标尺。
或许正如所有经典科幻的警示寓言,人形机器人终将成为照见人类本质的镜子:当它们学会在递出苹果时调整指尖力度以防磕碰,我们是否能以同等温柔对待同类?当它们突破图灵测试的瞬间,人类引以为傲的 “意识” 疆域又该如何重新勘定?
答案或许藏在下个十年的实验室里,也可能早已写在艾西莫夫的机器人定律与《仿生人会梦见电子羊吗》的雨夜独白中。唯一确定的是,这场机械觉醒的终章,注定由人类文明与机器智能共同书写。
参考资料:
https://www.ccidgroup.com/info/1207/41123.htm
https://www.hanspub.org/journal/paperinformation?paperid=86460
https://www.figure.ai/news/helix
https://en.wikipedia.org/wiki/Atlas_(robot)
https://builtin.com/robotics/humanoid-robots
https://en.wikipedia.org/wiki/Humanoid_robot作者:杨(yáng)雨鑫
策划:刘颖 张超 李培元 杨柳
审核:付昌义 南京工业大学副教授
江苏省科普作家协会科幻专委会主任委员

