人工智能通识教程

2022年11月,OpenAI公司发布了ChatGPT。它具有非常强大的自然语言处理能力,能够实现自动聊天机器人、自动回复、自动翻译等功能,可以更有效地进行交流,辅助人们提升工作效率。2023年3月14日,OpenAI公司发布了GPT-4,在各个领域引起了巨大的轰动,因为该模型在人工智能技术中达到了一个新的高度。自从ChatGPT发布以来,国内外迎来了新一轮大模型浪潮。


大模型是一种机器学习模型,包含了“预训练”和“大模型”两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成预训练后不需要微调,或仅需要少量数据的微调,就能直接支撑各类应用。基于自监督学习的大模型在学习过程中会体现出不同方面的能力,而这些能力为下游的应用提供了动力和理论基础,因此这些大模型称为基础模型,简单理解就是智能化模型训练的底座。


大模型从2012年的萌芽期,发展到2016年的人工智能1.0时期,再到2022年ChatGPT带来的人工智能2.0时期,模型参数均较上一代有数量级的飞跃,如GPT-4有数千亿个参数,谷歌公司推出的“通才”大模型PaLM-E拥有全球已公开的规模最大的5620亿个参数。目前,国内大模型研发和应用领域也正迎来高速发展热潮,各
类大模型产品层出不穷,“千模大战”已经打响。


大模型可以学习和处理更多的信息(如图像、文字、声音等),也可以通过训练,完成各种复杂的任务。生活中常见的智能语音助手和图像识别软件都会用到大模型。

大模型的生成关系为:人工智能→机器学习→深度学习→深度学习模型→预训练模型→预训练大模型→预训练大语言模型,如图所示。

image.png

人工智能当前正处在新起点,大模型改变了人工智能。大模型让人们看到了实现通用人工智能的路径。人工智能再次成为创新的焦点。越来越多的人认可第四次产业革命正在到来,而这次革命是以人工智能为标志的。


首先,大模型重新定义了人机交互。自然语言人机交互会带来提示词革命。未来程序员的薪酬水平将取决于提示词写得好不好,而不是取决于代码写得好不好。据估计,10年后全世界有50%的工作会是提示词工作,因此提出问题比解决问题更重要。

然后,大模型会重新定义营销和客服。谁拥有最佳的与客户沟通的方式,谁就会拥有这个客户。


最后,大模型会催生人工智能原生应用。用人工智能原生思维重构所有的产品、服务和工作流程,不是整合也不是接入,而是重做、重构。


未来,很多应用都将基于大模型来开发,每一个行业也将有属于自己的大模型。大模型会深度融合到实体经济当中去,赋能千行百业,助力中国经济开创下一个黄金30年。


大模型是人类社会目前集数据、算法、算力综合的成果,其训练成本极其巨大。举例来说,GPT-4是一款由8个混合专家模型组成的集成系统,为了训练GPT-4,OpenAI公司耗费了巨大的资源:训练数据集包含约13万亿个token,训练时间长达100天,训练成本高达6300万美元。


那么,现在国内外有哪些公司具有大模型?答案如下。
OpenAI:一家人工智能研究公司,拥有多个大型语言模型,例如ChatGPT等。
谷歌:拥有很多大型深度学习模型,例如BERT、Transformer等。
脸书:拥有很多大型深度学习模型,例如XLM-R、RoBERTa等。
微软:微软云服务Azure OpenAI可以直接调用OpenAI模型,包括ChatGPT、Codex、Dall-E等。
百度:百度云平台提供文心一言、千帆大模型。
阿里巴巴:阿里云平台提供通义千问、通义万象,也支持LlaMA2、Baichuan、ChatGLM、姜子牙等第三方模型。
华为:华为云发布了盘古大模型。
360:发布了人工智能大模型360智脑。
目前,人工智能大模型研究主要集中在中美两国,呈现千模大战的格局。大模型是新型关键基础设施的底座之一,大模型的竞争也是国家科技战略的竞争。我国需要布局全栈自主创新的大模型产品,同时要构建国产化算力。