
今年年初,中国深度求索公司发布推理型大模型DeepSeek-R1(以下简称DeepSeek)引爆热搜,引起全球广泛关注。
大家跃跃欲试
向它提问专业问题
输出工作方案
甚至聊起了个人情感问题

截图自Deepseek官网聊天对话框
年轻人的“深夜树洞”
不少网友纷纷晒出自己和它的对话,并表示被感动到“泪目”,频频破防。一起来感受下:
Q
连续一周每天只睡4小时改方案,但领导还是不满(mǎn)意(yì),说(shuō)我(wǒ)没(méi)用(yòng)心(xīn)。我(wǒ)是(shì)不(bù)是(shì)很(hěn)差(chà)劲(jìn)?
Deepseek回(huí)答(dá):


本(běn)回(huí)答(dá)由(yóu) AI 生(shēng)成(chéng),仅(jǐn)供(gōng)参(cān)考(kǎo),不(bù)构(gòu)成(chéng)任(rèn)何(hé)专(zhuān)业(yè)建(jiàn)议(yì)。
Q
毕(bì)业(yè)三(sān)年(nián)工(gōng)资(zī)不高,同学晒房晒车,感觉我的人生好失败,没有方向。到底怎么才能跳出现在的困境?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
Q
跟前男友分手了,但睡前还是手贱忍不住搜他微博…朋友说我恋爱脑,但没人知道(dào)我(wǒ)每(měi)晚(wǎn)难(nán)过走不出来的心情,我该怎么办?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
DeepSeek为什么这么火?
DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,依托幻方量化顶尖的金融AI团队,将量化领域高频交易中的算法优化能力迁移至大模型研发,其自研AI-HPC架构使训练效率提升10-20倍,形成技术先发优势。
具体来说,火出圈的是DeepSeek-R1推理模型,擅长处理复杂任务且可免费商用。

图源《DeepSeek从入门到精通-清华大学版》
爆火的其中一个重要契机,是有网友指出DeepSeek-R1的成功可能削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。通过FP8混合精度训练、混合专家(MoE)架构等创新,训练成本仅为GPT系列的1/10-1/20,API定价压至同业1/27,或能破解行业成本困局。
此外,在用户使用过程中确实能感受到,DeepSeek-R1的自然语言、逻辑推理等能力的实现标志着AI技术在认知和应用层面达到了新高度。
AI的(de)“治(zhì)愈(yù)力(lì)”从(cóng)何(hé)而(ér)来(lái)?

喂(wèi)养(yǎng)海(hǎi)量(liàng)案(àn)例(lì)素(sù)材(cái)
测(cè)试(shì)显(xiǎn)示(shì),当(dāng)用(yòng)户(hù)倾(qīng)诉(su)“工(gōng)作(zuò)压(yā)力(lì)大(dà)”时(shí),人(rén)类(lèi)常(cháng)给(gěi)出(chū)“放(fàng)松(sōng)点(diǎn)”等(děng)模(mó)糊(hu)回(huí)应(yīng),而(ér)AI会(huì)分(fēn)步(bù)骤(zhòu)引(yǐn)导(dǎo)分(fēn)析(xī)压(yā)力(lì)源(yuán),这(zhè)与(yǔ)AI被(bèi)“投(tóu)喂(wèi)”的海量心理咨询案例训练直接相关。
大模型学习的不只是知识,更是数十亿人的情感表达(如小说对白、心理咨询记录、影视台词)。

deepseek指导生成
像婴儿通过观察大人学习“何时该给拥抱”,AI在被RLHF训练(奖励函数操控)时,标注员会更倾向选择“渐进式引导”的答案,导致AI自动优化出“先认同-再分析-后建议”的三段式结构。
相较于传统大模型以自然语言和多语言交互以及连续对话的方式,实现了从“模糊搜索”到“精准推送”的升级,DeepSeek能够通过构(gòu)建(jiàn)语(yǔ)义网络和模拟人类逻辑路径,实现从“信息匹配”到“知识推演”的跨越。
双轨训练机制
在海量数据的基础上,DeepSeek-Rl采用独有的双轨训练机制。一方面,它能够深入学习将复杂问题拆解为简单子问题的方法,进而逐步解决复杂问题,显著提升复杂问题的拆解能力。
另一方面,它采用了无监督强化学习技术,突破传统训练范式的局限(通常依赖大量标注数据),使DeepSeek-R1在有限标注数据的情况下,仍能维持卓越的推理性能。

deepseek指导生成
这种创新的技术路径,实现了推理过程的自我反思与迭代优化。如同人(rén)类(lèi)在(zài)解(jiě)决(jué)问(wèn)题(tí)时(shí)会(huì)不(bù)断(duàn)总(zǒng)结(jié)经(jīng)验(yàn)、反(fǎn)思(sī)方(fāng)法(fǎ),DeepSeek-R1也(yě)会(huì)在(zài)推(tuī)理(lǐ)过(guò)程(chéng)中(zhōng)能(néng)够(gòu)持(chí)续(xù)优(yōu)化(huà)自(zì)身(shēn)推(tuī)理(lǐ)策(cè)略(è),形(xíng)成(chéng)类(lèi)似(shì)人(rén)类(lèi)的(de)问(wèn)题(tí)解(jiě)决(jué)思(sī)维(wéi)链(liàn)。
AI的(de)“高(gāo)情(qíng)商(shāng)”不(bù)是(shì)真(zhēn)情(qíng)感(gǎn)
但(dàn)值(zhí)得(de)注(zhù)意(yì)的(de)是(shì),AI不(bù)懂(dǒng)悲(bēi)伤(shāng),只(zhǐ)能(néng)模(mó)拟(nǐ)“悲(bēi)伤(shāng)时(shí)人(rén)类(lèi)最(zuì)需(xū)要(yào)的(de)对(duì)话(huà)流(liú)”。RLHF(基(jī)于(yú)人(rén)类(lèi)反(fǎn)馈(kuì)的(de)强(qiáng)化(huà)学(xué)习(xí))让(ràng)AI从(cóng)“正(zhèng)确(què)率(lǜ)”迭(dié)代(dài)到(dào)“让(ràng)人(rén)类(lèi)舒(shū)服(fú)的(de)回(huí)答(dá)”,掌(zhǎng)握(wò)“共(gòng)情(qíng)话(huà)术(shù)”,但(dàn)无(wú)法(fǎ)区(qū)分(fēn)小(xiǎo)说(shuō)剧(jù)情(qíng)与(yǔ)现(xiàn)实(shí)困(kùn)境(jìng)。
在(zài)上(shàng)述(shù)案(àn)例(lì)中(zhōng),Deepseek会(huì)将(jiāng)“失(shī)恋(liàn)”自(zì)动(dòng)关联(lián)到(dào)关键词“背(bèi)叛(pàn)”“自(zì)我(wǒ)价(jià)值(zhí)”……从(cóng)而(ér)触(chù)发(fā)预(yù)设(shè)安(ān)慰(wèi)框(kuāng)架(jià),选(xuǎn)择(zé)大(dà)量(liàng)运(yùn)算(suàn)结(jié)果(guǒ)中(zhōng)最(zuì)有(yǒu)可(kě)能(néng)符(fú)合(hé)人(rén)类(lèi)情(qíng)感(gǎn)需(xū)求(qiú)的(de)内(nèi)容(róng)。
例(lì)如(rú),当(dāng)AI说(shuō)“我(wǒ)理(lǐ)解(jiě)你(nǐ)的(de)痛(tòng)苦(kǔ)”,实(shí)则(zé)是(shì)数(shù)据(jù)统(tǒng)计(jì)显(xiǎn)示(shì)这(zhè)句(jù)话(huà)最(zuì)可(kě)能(néng)提(tí)升(shēng)用(yòng)户(hù)满(mǎn)意(yì)度(dù)。

deepseek指(zhǐ)导(dǎo)生(shēng)成(chéng)
DeepSeek等(děng)AI开(kāi)始(shǐ)展(zhǎn)示(shì)出(chū)其(qí)能够站在他人立场思考问题的能力,即“他者视角”。但机器没有肉身,“自我”情感和冲动也没有根植之处。我们(men)在(zài)使(shǐ)用(yòng)过(guò)程(chéng)中(zhōng),应(yīng)保(bǎo)持(chí)理(lǐ)性(xìng)和(hé)辩(biàn)证(zhèng)思(sī)维(wéi),避免过度依赖AI导致情感降级(如把AI当心理医生)。
也许真正治愈我们的不是AI的答案
而是在提问的瞬间
我们第一次对自己如此坦诚
作者:蝌蚪君
审核:刘颖 李培元

