人工智能发展简史：从图灵到 ChatGPT 再到 AI Agent 时代

发表于 2026-06-16 分类于技术杂谈阅读次数： Changyan：本文字数： 3.1k 阅读时长 ≈ 11 分钟

1950 年，艾伦·图灵发表了《计算机器与智能》，提出了那个著名的问题："机器能思考吗？"七十多年后的今天，AI 已经从学术论文里的概念，变成了每个人手机里的日常工具。这篇文章梳理了 AI 发展的完整历程，从最早的哲学萌芽，到 2026 年的智能体商业化。

一、思想起源（公元前 - 1949 年）

虽然 AI 的正式诞生是在 1956 年，但人类对"人造智能"的向往可以追溯到古代。

公元前 380 年：古希腊神话中，火神赫菲斯托斯用黄金打造了自动侍女，这被认为是最早的"人造智能"想象。
250 年：古希腊发明家克特西比乌斯制造了世界上第一个自动系统——自调节水钟。
1308 年：西班牙神学家拉蒙·柳利完成了《大艺术》，提出用机械方法组合知识以形成新知识的框架。
1206 年：阿拉伯博学家贾扎里撰写了《精巧机械装置知识之书》，设计了上百种自动装置，被认为是"机器人学之父"。
1495 年：达·芬奇设计了机械骑士（可活动的人形机器人）。
1726 年：乔纳森·斯威夫特在《格列佛游记》中描写了一台名为"引擎"的机器，成为最早对计算机的文学想象。
1914 年：西班牙工程师托雷斯·克维多展示了自动国际象棋机器，用电磁铁移动棋子，是 AI 的早期硬件尝试。

二、AI 的诞生（1950-1959 年）

这一阶段标志着 AI 从哲学思辨走向科学实验。

1950 年：图灵测试

艾伦·图灵发表《计算机器与智能》，提出"模仿游戏"（后称图灵测试）：如果一台机器能在对话中不被辨别出是机器，就说明它具有智能。这一思想至今仍是 AI 的核心议题之一。

1956 年：达特茅斯会议 — AI 正式诞生

这一年夏天，约翰·麦卡锡、马文·明斯基、克劳德·香农等科学家在美国达特茅斯学院召开了为期两个月的研讨会。麦卡锡首次提出了"人工智能"（Artificial Intelligence）这一术语，这次会议被公认为 AI 诞生的标志。

1957-1959 年：早期突破

1957 年：弗兰克·罗森布拉特发明了感知机（Perceptron），这是最早的神经网络模型之一。
1958 年：麦卡锡发明了 LISP 编程语言，成为 AI 研究的主流语言（至今仍在使用）。
1959 年：亚瑟·塞缪尔首次提出"机器学习"（Machine Learning）这一概念，定义为"让计算机具备无需明确编程即可学习的能力"。
1959 年：美国国防部成立高级研究计划局（ARPA，后改称 DARPA），开始为 AI 研究提供资金支持。

三、黄金时代与第一次 AI 寒冬（1960-1980 年）

1960 年代：乐观与突破

1961 年：通用汽车引入第一台工业机器人 Unimate，用于装配线作业。
1964 年：MIT 的约瑟夫·魏泽鲍姆开发了 ELIZA，这是世界上第一个聊天机器人，能模拟心理治疗师进行对话。
1966 年：斯坦福研究所的 Shakey 机器人诞生，它带有视觉传感器，能根据指令发现并抓取物体，被认为是第一台智能机器人。
1969 年：Minsky 和 Papert 出版了《感知机》一书，指出了感知机的局限性，导致神经网络研究进入低谷。

1970 年代：第一次 AI 寒冬

受限于当时的计算机算力和数据量，AI 研究遇到了严重的瓶颈。英国政府、DARPA 等资助机构逐渐停止拨款。1973 年英国《莱特希尔报告》认为 AI 研究"未能产生任何重大影响"，标志着第一次 AI 寒冬的到来。

四、专家系统与第二次 AI 寒冬（1980-1990 年代）

1980 年代：专家系统的兴起

1980 年：专家系统（Expert Systems）开始商业化。这类系统通过"如果-那么"规则模拟人类专家的决策能力，在医疗诊断、地质勘探等领域取得了成功。
1981 年：日本启动第五代计算机项目，拨款 8.5 亿美元发展 AI 计算机，引发全球跟进。
1986 年：大卫·鲁姆哈特等人重新发表了反向传播（Backpropagation）算法，为后来的深度学习奠定了基础。

1987-1990 年代：第二次 AI 寒冬

专家系统维护成本高、适用场景窄，其局限性逐渐暴露。日本第五代计算机项目也未能达到预期目标，资金再次大幅缩减，第二次 AI 寒冬到来。

五、AI 复兴（1997-2011 年）

1997 年：深蓝击败国际象棋世界冠军

IBM 的超级计算机**深蓝（Deep Blue）**以 3.5:2.5 击败了当时的国际象棋世界冠军加里·卡斯帕罗夫。这是 AI 首次在标准比赛时限内击败人类世界冠军，引起全球轰动。

2006 年：深度学习奠基

杰弗里·辛顿发表了深度信念网络（Deep Belief Networks）的论文，提出了逐层预训练的方法，被认为是深度学习的起点。

2011 年：IBM Watson 赢得《危险边缘》

IBM 的 Watson 系统在美国智力问答节目《Jeopardy!》中击败了两位人类冠军，展示了自然语言处理和知识检索的巨大进步。

六、深度学习爆发（2012-2016 年）

2012 年：AlexNet 改写图像识别

辛顿团队在 ImageNet 图像识别竞赛中凭借深度学习模型 AlexNet 以巨大优势夺冠，错误率从 26% 降至 16%。这是 AI 发展的关键转折点，标志着深度学习时代的正式来临。

2014 年：生成对抗网络（GAN）

伊恩·古德费洛提出了生成对抗网络（GAN），两个神经网络相互博弈，能生成以假乱真的图像，引发了 AI 生成内容（AIGC）的研究热潮。

2016 年：AlphaGo 击败李世石

Google DeepMind 的 AlphaGo 以 4:1 击败世界围棋冠军李世石。围棋的复杂度远超国际象棋，这一胜利让 AI 真正走入大众视野，被视为现代 AI 的"出圈"时刻。

七、Transformer 与大模型时代（2017-2022 年）

2017 年：Transformer 架构诞生

Google 发表了里程碑论文 《Attention Is All You Need》，提出了 Transformer 架构。它用自注意力机制替代了传统的循环神经网络，成为后续所有大语言模型（如 GPT、BERT、LLaMA）的核心基础。这是 AI 发展史上最重要的论文之一。

2018 年：BERT 与 GPT-1

Google 发布 BERT，双向预训练模型刷新了 11 项 NLP 任务纪录。
OpenAI 发布 GPT-1（1.17 亿参数），提出了"无监督预训练 + 有监督微调"范式。

2020 年：GPT-3 横空出世

OpenAI 发布 GPT-3（1750 亿参数），首次展现出强大的上下文学习能力，只需少量提示就能完成翻译、写作、编程等任务。大模型"缩放定律"被验证，模型越大性能越强，开启了大规模参数竞赛。

2021-2022 年：多模态与 AI 绘画

2021 年 1 月：OpenAI 发布 DALL·E，实现了文本到图像的生成。
2022 年 4 月：OpenAI 发布 DALL·E 2，图像质量大幅提升。
2022 年 7 月：Midjourney 上线，在设计师和艺术圈快速破圈。
2022 年 8 月：Stability AI 开源 Stable Diffusion，首次实现消费级显卡运行 AI 绘画，引爆了 AIGC 开源社区。

八、ChatGPT 引爆全球（2022 年 11 月 - 2023 年）

2022 年 11 月 30 日：ChatGPT 上线

OpenAI 发布 ChatGPT（基于 GPT-3.5，搭载 RLHF 人类反馈强化学习）。它以极简的对话界面和接近人类的对话能力，5 天突破 100 万用户，2 个月达到 1 亿月活，打破了互联网产品的增长纪录，成为全球 AI 爆发的奇点。

2023 年：百模大战

2023 年是 AI 大模型的"军备竞赛"年：

时间	事件
1 月	ChatGPT 月活破 1 亿
1 月	微软向 OpenAI 追加 100 亿美元投资
2 月	微软推出 New Bing，搜索引擎接入生成式 AI
3 月	GPT-4 发布，首个多模态大模型，在律师资格考试中跻身前 10%
3 月	百度发布文心一言，国产大模型起跑
3 月	AutoGPT 开源，AI Agent 概念引爆
7 月	Meta 开源 Llama 2，免费可商用，改写开源大模型格局
11 月	OpenAI 开发者大会，发布 GPT-4 Turbo（128k 上下文）和 GPTs
12 月	Google 发布 Gemini 1.0，全模态原生处理

国内方面，阿里巴巴（通义千问）、腾讯（混元）、字节跳动（豆包）、智谱 AI（GLM）、月之暗面（Kimi）等纷纷入局，形成了"百模大战"的局面。

九、多模态与推理突破（2024 年）

文生视频爆火

2024 年 2 月：OpenAI 发布 Sora，可生成长达 1 分钟的高保真视频，被称为"视频生成领域的 ChatGPT 时刻"。

模型竞争白热化

2 月：Anthropic 发布 Claude 3 系列，多模态全面升级，Opus 版本多项测试超越 GPT-4。
4 月：Meta 发布 Llama 3，开源模型逼近闭源水平。
5 月：OpenAI 发布 GPT-4o，全模态实时交互，推理成本降低 50%。
7 月：Meta 发布 Llama 3.1 405B，开源模型首次对标 GPT-4。
9 月：OpenAI 发布 o1 推理大模型，首次让大模型具备"慢思考、深推理"能力。
10 月：Anthropic 发布 Claude 3.7 Sonnet，首个混合推理模型。
12 月：Google 发布 Gemini 1.5 Pro，上下文窗口突破 12M tokens。

十、AI Agent 与国产崛起（2025 年）

推理技术革命

2025 年 1 月：DeepSeek 发布 R1 推理模型，训练成本仅 557 万美元，性能对标 OpenAI o1，彻底改写了"高成本 = 高性能"的行业逻辑。
2025 年 1 月：DeepSeek App 登顶美国 iOS 应用商店免费榜，超越 ChatGPT，成为首个登顶的国产 AI 产品。
2025 年 4 月：OpenAI 发布 o3/o4-mini，首次实现图像融入思维链。

AI Agent 全面落地

2025 年 1 月：OpenAI 发布 Operator，首个官方 AI 智能体，可模拟人类操作浏览器。
2025 年 5 月：华为发布盘古 Ultra MoE（7180 亿参数），基于国产昇腾算力训练。
2025 年 7 月：OpenAI 发布 ChatGPT Agent，融合对话、网页操作和深度调研，向所有付费用户开放。
2025 年 8 月：OpenAI 首次发布开源大模型 GPT-oss-120b。
2025 年 9 月：Sora 2 发布，AI 视频生成进入全民时代；Anthropic 发布 Claude Sonnet 4.5。
2025 年 11 月：Anthropic 发布 Claude Opus 4.5，登顶编码与 Agent 能力榜单。
2025 年 12 月：OpenAI 发布 GPT-5.2，专为专业知识型工作优化。

十一、2026 年最新进展（截至 6 月）

1 月：智谱 AI 在港交所上市，成为"全球大模型第一股"。
1 月：百度发布文心大模型 5.0，全模态统一建模；阿里云发布 Qwen3-Max-Thinking。
2 月：字节跳动发布 Seedance 2.0 电影级视频生成引擎；DeepSeek 发布 V4 旗舰大模型；Anthropic 发布 Claude Opus 4.6/ Sonnet 4.6。
2 月：智谱开源 GLM-5，面向复杂系统工程与长程 Agent 任务。
2026 年趋势总结：核心竞争从"参数规模"转向 Agent 工程能力、推理效率、商业化落地。大模型推理成本三年下降超过 99%，国产模型从跟跑到并跑，部分赛道实现领跑。

核心趋势总结

回望这七十多年的发展，AI 的演进脉络清晰可见：

技术路径：符号主义 → 机器学习 → 深度学习 → 大语言模型 → 多模态推理 → 自主智能体
市场格局：从 OpenAI 一家独大，到 OpenAI/Anthropic/Google 三强鼎立，再到国产模型全面追赶
成本下降：推理成本三年下降超 99%，AI 从巨头专属走向人人可用
两个 AI 寒冬的教训：技术成熟度需要与基础设施（算力、数据、算法）同步发展，过度炒作必然导致反噬
现在的挑战：幻觉问题、安全对齐、能源消耗、版权争议、AI 治理与监管

本文于 2026 年 6 月整理。信息来源包括 Big Human、Swiss Cyber Institute、腾讯云开发者社区、维基百科等公开资料。